标准规范下载简介
基于深度学习算法的路基二维位图图纸识别及工程量智能计算技术.docx实用技术成果详细说明书
基于深度学习算法的路基二维位图图纸识别及工程量智能计算技术
(中铁六局集团北京铁路建设有限公司)
YB/T 4876-2020 绿色设计产品评价技术规范 压力容器用钢板.pdf关键词:人工智能 深度学习 二维位图 图纸识别 工程量智能计算
2016年,AlphaGo大胜围棋九段李世石,让近十年来再一次兴起的人工智能技术走向台前,进入公众的视野。过去几年中,科技巨头已相继成立人工智能实验室,投入越来越多的资源抢占人工智能市场,甚至整体转型为人工智能驱动的公司,紧锣密鼓筹谋人工智能未来。我国及其他各国政府都把人工智能当作未来的战略主导,出台战略发展规划,从国家层面进行整体推进,迎接即将到来的人工智能社会。建筑行业的人工智能应用也在近年兴起。
在建筑施工领域,识图是一项重要的环节,技术人员和测量人员需要重复识图,计算工程数量及测量参数,费时又费力。
唯有创新才能跨越建筑行业低迷的大周期,为新产业化革命储备力量。
基于目前人工智能应用的热潮及智能施工中的问题,本课题拟采用深度学习算法,探索实现路基二维位图图纸识别的技术。以机械施工分公司多年路基施工经验及所收集的路基图纸为基础制作数据集,同时也为桥梁、隧道等其他专业图纸识别提供技术参考。
收集机械施工分公司近十年施工的石家庄货迁工程、张唐铁路工程、平天高速、京石二通道、京张高铁等工程路基横断面图,对横断面图进行分析,将横断图分解为: 断面参数、路肩、坡脚、宽度标注、高程标注、边坡斜率、排水沟等元素,采用数据标注工具labelImg对断面图做标注,生成VOC标准数据格式。
将标注的数据集按照80%、10%、10%的比例划分为训练集、验证集、测试集;生成对应的txt文件和label文件。
搭建训练网络,将数据集输入训练网络进行训练,获得推理预测模型。
图纸输入预测模型之后,输出图纸各元素的类别、左上角XY值、右下角XY值;采用百度智能云提供的API进行识别,获得文本内容、相应文本框左上角XY值、文本框宽度、文本框高度。将图纸元素框与文本框进行交集运算,以确定各图元素的参数信息。
由于一张图纸中可能存在多个断面,每个断面又有多个图纸元素,需对识别的参数进行处理。
首先是对多个断面的图纸,对每个断面位置进行切分,分出每个参数所属的断面。
其次是比较图纸元素X值大小,区分出左右路肩、左右边坡等数据。
计算出中线位置的X值,计算路基的左宽和右宽等。
将以上数据进行分类之后,存入字典中,为下一步导出参数表、计算土石方数量提供基础。
5、工程量计算及表格输出。
将里程转换成数值,按大小顺序进行排序,对图纸参数进行处理、运算得到土石方工程数量,输出图纸参数及工程量计算表。
适用于铁路、公路路基图纸识别,计算土石方工程数量,并能智能采集图纸数据,辅助施工和测量人员快速获得图纸参数。
训练模型采用PPYOLO模型进行训练,结构如下:
ResNet50网络参数
ResNet50网络结构
DetectionNeck:这里依然采取的是FPN特征金字塔结构做一个特征融合,选取最后三个卷积层C3, C4, C5,然后经过FPN结构,将高层级语义信息和低层级信息进行融合。
DetectionHead:输出通道数为3*(K+5),3代表每个层设定的三种尺寸的锚框,K代表类别数目,5又可以分成4+1,分别是目标框的4个参数,以及1个参数来判断框里是否有物体。
ResNet的具体结构:
ResNet分为5个阶段,其中Conv1的结构比较简单,可以视其为对INPUT的预处理,后4个阶段分别由3、4、6、3个Bottleneck组成。
Conv1:(3,224,224)指输入INPUT的通道数(channel)、高(height)和宽(width),即(C,H,W)。
CONV是卷积(Convolution)的缩写,7×7指卷积核大小,64指卷积核的数量(即该卷积层输出的通道数),stride 2指卷积核的步长为2。
BN是Batch Normalization的缩写,即常说的BN层。
RELU指ReLU激活函数。
(64,56,56)是该阶段输出的通道数(channel)、高(height)和宽(width),其中64等于该阶段第1层卷积层中卷积核的数量,56等于224/2/2(步长为2会使输入尺寸减半)。
1、将二维位图的施工图纸分解成对应图纸元素,制作成可供深度神经网络学习的数据集,并训练出路基图纸识别的预测模型。
本课题独创性的将二维位图的路基图纸进行了图纸元素分解,制作了工业化数据集;并将数据集输入深度神经网络进行学习,得到了路基图纸识别的推理模型。
2、加载路基图纸识别的预测模型,识别图纸元素类别及定位坐标,融合OCR字符识别,将图纸元素识别框与字符识别框进行交集运算,获得施工图纸参数信息。
在数据处理阶段采用了融合目标检测和OCR字符识别技术,对人工智能技术做了更贴近实际的应用,对识别的参数做了过滤和后处理,仅需导入图片便能做到提取图纸参数和智能计算工程量。
1、该课题对路基二维位图图纸进行图纸元素分解、标注,制作了路基图纸识别工业化数据集,为以后的类似项目提供了数据基础。
2、该课题的整体解决思路为其它专业图纸识别提供的技术参考,其他专业图纸识别时仅需要按此技术思路制作训练数据集,进行迁移学习即可获得训练模型。对桥梁、隧道、房建等专业图纸的识别技术提供参考。
3、课题中融合了OCR字符识别技术,进行了多模态融合,获得了图纸参数数值,做了较深入的应用研究,而非简单的目标检测。
4、该课题实现了对二维位图的识别并实现工程化应用。
该技术应用在丰台站改工程、新建津兴铁路工程、新建本桓高速公路等工程中。其中新建本桓高速公路工程前期策划中需要掌握图纸工程数量,在工期紧的情况下,实现了快速计算。
新建本桓高速公路工程某省电网生产调度楼主楼升降机施工方案,该技术仅在施工前期参与图纸工程量计算及参数提取。按照2个技术员和2个测量员,计算工作需要60天。每天的费用为500元。因此,人力成本为60 * 4 * 500 = 12万元。
综上所述,节约人力成本总计为:12 + 6 + 12 = 30万元。
1、该课题提供了其他专业图纸识别的技术参考,为其它专业图纸识别提供了解决思路。其他专业图纸识别只需按照此技术思路制作训练数据集,进行迁移学习即可获得训练模型。
2、该软件具有快速计算的特点,适用于前期策划、标前联动等工期紧、需要快速了解工程数量的情况。
3、通过深度学习算法实现二维位图的识别并实现工程化应用,可以提升企业市场知名度,并与相关软件企业进行技术合作。
1、按每个工程每年节约成本30000元,每个工程持续时间3年考虑,可节约人力成本30000*3=9万元。如果考虑全局200个项目使用该软件计算,将节约人力成本1800万元。
3、将该技术融合NLP自然语言处理,识别图纸说明;并将施工标准、材料等信息识别出来;利用点云识别和图像处理技术识别关键点位置和结构物轮廓线。采用多模态融合实现全信息识别,作为构建BIM模型的数据基础。
4、该技术具备自学习能力,使用过程中继续收集路基图纸,标注训练集,增加不同光照条件下的训练集图纸,增强模型的泛化能力并经过迭代循环钢筋气压焊技术交底,提高识别精度。
5、将模型部署到手机端,开发图纸识别APP。做到拍照识图,应用方便。