Q/GDW 12118.3-2021 人工智能平台架构及技术要求 第3部分:样本库格式要求.pdf

Q/GDW 12118.3-2021 人工智能平台架构及技术要求 第3部分:样本库格式要求.pdf
仅供个人学习
反馈
标准编号:
文件类型:Q/GDW12118.3—2021
资源大小:7.6 M
标准类别:电力标准
资源ID:351073
下载资源

标准规范下载简介

Q/GDW 12118.3-2021 人工智能平台架构及技术要求 第3部分:样本库格式要求.pdf

ICS 35. 020

Q/GDW12118.3—2021

人工智能平台架构及技术要求

Architectureandtechnicalrequirementsofartificialintelligenceplatform Part3:Samplelibraryformatrequirements

DBJ/T15-151-2019标准下载国家电网有限公司 发布

Q/GDW12118.32021

[Q/GDW 1211832021

为规范国家电网有限公司人工智能平台建设,明确人工智能平台架构和技术要求,提升公司人工智 能基础支撑能力及应用水平,制定本部分, 《人工智能平台架构及技术要求》标准分为三个部分: 一第1部分:总体架构与技术要求; 一第2部分:算法模型共享应用要求; 一第3部分:样本库格式要求 本部分为《人工智能平台架构及技术要求》的第3部分。 本部分由国家电网有限公司互联网部提出并解释。 本部分由国家电网公司科技部归口。 本部分起草单位:中国电力科学研究院有限公司、国家电网有限公司大数据中心、国网信息通信产 业集团有限公司、全球能源互联网研究院有限公司、国网青海省电力公司、国网福建省电力有限公司、 国网经济技术研究院有限公司、国网重庆市电力公司。 本部分主要起草人:蒋炜、王晓辉、陈振宇、邱镇、刘卫卫、蔡常雨、主海亭、董衍旭、罗志明 郭鹏天、饶玮、钱基业、陈涛、钟加勇、李俊杰。 本部分首次发布。 本部分在执行过程中的意见或建议反馈至国家电网有限公司科技部。

本部分规定了人工智能平台建设的样 数要求、样本库接和样本应用要求 本部分适用于人工智能平台样本库的规划 开发、 建设和运维

下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。 凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T2900.51电工术语架空线路 GB/T5271.29一2006/IS0/IEC2382一29:1999信息技术词汇规范:第29部分人工智能语音识别 与合成 GB/T13715一92信息处理用现代汉语分词规范 Q/GDW1906一2013输变电一次设备缺陷分类标准

下列术语和定义适用于本文件。

分辨率resolution 衡量数字图像内所包含数据量多少的技术参数。这里指一帧图像在水平和垂直方向的有效像素数。 [DB11/T 384.5—2009,定义3.1] 3.2 信噪比signaltonoiseratio 在视频信号处理、传输过程中,某一测量点信号幅度的标称值与随机杂波幅度的有效值之比,用分 贝(dB)数标识。 [DB11/T 384.5—2009,定义3.3]

信噪比signaltonoiseratio 在视频信号处理、传输过程中,某一测量点信号幅度的标称值与随机杂波幅度的有效值之比, (dB)数标识。 [DB11/T384.5—2009,定义3.3]

线路Tine 用于电力系统两点之间输电的导线、绝缘材料和各种附件组成的设施。 [GB/T 2900.51,定义2. 1. 1]

杆塔 support

Q/GDW 12118.32021

下列缩略语适用于本文件。 RGB:色彩模式(RedGreenBlue) WAV:窗波(WindowsWave)

RAW:原始音像资料(RawSoundData

人工智能平台样本分类为图像、视频、语音、文本。

本部分对人工智能平台接入图像样本的质量、标注方法提出规范化要求,适用于公司图像样本采集 与标注。格式要求见本部分6.1。

本部分对人工智能平台接入视频样本的质量、标注方法提出规范化要求,适用于公司视频样本采集 与标注。格式要求见本部分6.2。

本部分对人工智能平台接入语音样本的质量、标注方法提出规范化要求,适用于公司语音样本采集 与标注。格式要求见本部分6.3。

本部分对人工智能平台接入文本样本的质量、标注方法提出规范化要求,适用于公司文本样本采集 与标注。格式要求见本部分6.4。

6.1.1图像采集要求

应满足样本参数、拍摄角度、部位、区域要求。具体要求包括: 图像样本长边应为1920像素、短边应为1080像素; 应避免在遮挡的情况下拍摄图像,采集过程中无法避免遮挡时,应优先选择未遮挡图像或遮 挡比例较小的图像作为样本使用: C 对绝缘子、杆塔、导线连接处组合设备较多的输电、配电线路,应从不同方向(包括:正位、 左、右、上、下等)、多角度(左、右、上、下分别偏离正位约45°)获取目标区域,保障所 有设备部件在图像中均清晰可见,每个角度拍摄宜多于3张; d 且标区域在整个图像样本中的占比应不低于40%。

6.1.2图像存储要求

6.1.2.1图像文件存储格式要求

图像文件均应以jpg、png等常用格式存储。

图像文件均应以pg、png等常用格式存储。

6.1.2.2图像样本命名要求

Q/GDW 12118 3202

应满足图像样本命名规则。具体规则包括: a)输电图像样本名称应由五部分组成:第一部分为项目命名词或图像来源;第二部分为输电线 路名称;第三部分为输电专业信息;第四部分为当前文件的日期,日期格式:年+月+日;第五 部分为文件唯一性编号,从1开始计数; 6 变电图像样本名称应由五个部分组成:第一部分为项目命名词或图像来源;第二部分为变电 站名称;第三部分为变电专业信息;第四部分为当前文件的日期,日期格式:年+月+日;第五 部分为文件唯一性编号,从1开始计数; 配电图像样本名称应由五个部分组成:第一部分为项目命名词或图像来源;第二部分为配电 站、线名称;第三部分为配电专业信息;第四部分为当前文件的日期,日期格式:年+月+日: 第五部分为文件唯一性编号,从1开始计数; d 其他图像样本名称应由四个部分组成:第一部分为项目命名词或图像来源;第二部分为当前 图像专业信息;第三部分为当前文件的日期,日期格式:年+月+日;第四部分为文件唯一性编 号,从1开始计数。

6.1.3图像标注要求

6.1.3.1信息标签添加

应满足图像样本标签内容添加规则。具体规则如下: 输电图像样本添加标签内容至少应包括:输电区域名称、线路名称、电压等级、杆塔号、巡 检时间、巡检人员、缺陷内容等信息; b 变电图像样本添加标签内容至少应包括:变电区域名称、变电站名称、设备名称、电压等级 巡检时间、巡检人员、缺陷内容等信息; 配电图像样本添加标签内容至少应包括:配电区域名称、线路名称、电压等级、杆塔号、 检时间、巡检人员、违规原因等信息; d) 其他图像样本添加标签内容至少应包括:创建时间、创建者、图像用途等信息,

6. 1. 3. 2目标区域标注规则

应满足图像样本标注规则。具体规则如下: 输电图像样本应标注整张图像上所有缺陷信息,精确到目标部位。目标区域缺陷标签名称应 遵照附录A中“缺陷标签”列内容编写,若附录A中未指定该类缺陷标签名,标注者应参照附录 中已有命名模式对新缺陷标签命名; b 变电图像样本应标注整张图像上所有缺陷信息,精确到目标部位。目标区域缺陷标签名称应 遵照附录B中“缺陷标签”列内容编写,若附录B中未指定该类缺陷标签名,标注者应参照附录 中已有命名模式对新缺陷标签命名; 配电图像样本应标注出安全帽、验电棒、接地棒、绝缘靴等安全工器具,登高扶梯、验电、 接地、班前班后会等作业行为及杆塔倾倒情况; d 其他图像样本应标注整张图像上所有目标区域并拟定标签名称; e) 所有图像样本应采用最小外接矩形标注方式,对于不规则目标区域应采用多边形标注方式。 目标区域应轮廓清晰,标注框需贴合目标边缘,若同一目标区域有多个缺陷,全部缺陷都要标 注

6. 1.3.3标注颜色

对正常目标区域应采用蓝色标注。

Q/GDW1211832021

缺陷目标区域,应根据缺陷等级分别采用红色颜色标注危急缺陷、橙色标注严重缺陷、黄色标注一 般缺陷、紫色标注设备的偏移、位移,标注颜色说明详见表1

6.1.3.4标注记录文件命名规则

标注文件应与巡检图像命名一致,保存为XML、JSON(参见示例1,2)等常见格式文件,储存于 置标注数据文件内。该文件记录信息应包含对应图像的基本信息、目标区域基本信息、缺陷情 等。 示例1:XML图像标注示例见表2。

Q/GDW 12118.32021

6.2.1视频处理要求

视频样本应按需截取为图像样本并满足图像采集要求,详见本部分6.1.1。

6. 2. 2视频存储要求

视频样本无存储要求。 截取的图像样本应存储并满足图像存储要求,详见本部分6.1.2

6.2.3视频标注要求

视频样本无标注要求。 截取的图像样本应标注并满足图像标注要求,详见本部分6.1.3

6.3.1语音采集存储要求

6.3.1.1语料内容范围要求

6.3.1.2录音条件要求

应选择安静的录音环境,无噪音于扰。

6.3.1.3语音质量要求

6.3.2语音文件格式及命名要求

6.3.2.1语音文件存储格式要求

音文件均宜以MP3、PCM、RAW等常见格式存储。

6.3.2.2语音文件命名要求

安徽某高速公路低压配电施工方案音人性别应用英文female和male的英文首字母F 各省份应以省名称每个字的拼 类别应用英文首字母编号

6.3.2.3语音描述文件内容及格式要求

每条语音样本应包含2个描述文件,一个描述文件记录声源的信息,一个描述文件记录语音样本的 信息。具体内容要求如下: a)记录声源信息的描述文件命名为:语音文件名+声源信息.txt,内容应包含:声源信息、系统 信息; b) 记录语音样本信息的描述文件命名为:语音文件名+Info.txt,内容应包含:标注规范、料库 名、录音文件夹编号、录音日期、录音时间点、录音格式、通道数、发音人ID、录音地点、环 境信息等信息

6. 3. 3语音标注要求

6.3.3.1声纹样本标注

对变压器声纹样本中波段明显有起伏的片段进行

SMA-13沥青砼中面层试验段施工方案6.3.3.2汉字与音节标注

副语言现象应包含非音段感叹声和非语音信

©版权声明
相关文章