标准规范下载简介
GB/T 39400-2020 工业数据质量 通用技术规范.pdfICS 25.040.40 L67
GB/T 39400—2020
GTCC-038-2018 机车车辆25kV高压电缆总成-铁路专用产品质量监督抽查检验实施细则Industrial data qualityGeneral technical specification
国家市场监督管理总局 发布 国家标准化管理委员会
范围 规范性引用文件 术语和定义 工业数据质量持续改进 4.1 质量特性 4.2 持续改进模型 工业数据质量描述 5.1 描述要素 5.2 定量元素 5.3 非定量元素 工业数据质量识别 6.1 定量的数据质量信息 6.2非定量的数据质量信息 工业数据质量评价 7.1 评价方法 7.2 评价流程和步骤 工业数据质量控制 8.1 控制规则 8.2 控制方法 报告数据质量信息 9.1 概述 9.2 数据质量报告 参考文献
GB/T39400—2020
本标准按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任, 本标准由中国机械工业联合会提出。 本标准由全国自动化系统与集成标准化技术委员会(SAC/TC159)归口。 本标准起草单位:中国标准化研究院、浙江大学、中机生产力促进中心、深圳鹏锐信息技术股份有限 公司、深圳市华傲数据技术有限公司、北京三维天地科技股份有限公司。 本标准主要起草人:杨青海、王志强、顾复、洪岩、潘康华、刘守华、顾新建、岳高峰、肖承翔、张伟群 贾西贝、曹朝晖、徐凯程、尹书蕊
GB/T 394002020
随着信息化与工业化的深度融合,信息技术渗透到了工业企业产业链的各个环节,工业企业建立了 多计算机信息系统,积累了大量工业数据,工业数据已成为工业企业的重要资源。同时,数据质量贯 穿于工业数据生命周期的产生、收集、存储、维护、传输、加工和利用等各个阶段,海量的工业数据存在数 据残缺、数据不规范以及数据错误等数据质量问题, 本标准通过对工业数据质量持续改进的模型、质量的描述、识别、评价、控制和报告等的标准化,支 掌工业数据的协同建设、互联互通、共享利用,提高工业数据的质量、可用性和利用效率。 化管理和质量保证
GB/T39400—2020
工业数据质量通用技术规范
本标准规定了工业数据质量持续改进的模型,以及工业数据质量的描述、识别、评价、控制和报告的 要求。 本标准适用于工业数据采集、传输、维护和使用过程中的质量管理。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T19001—2016质量管理体系要求 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据质量dataquality 数据的一组固有特性满足要求的程度。 注:固有特性一般指永久性的特性 3.2 数据质量管理dataqualitymanagement 指导和控制某机构数据质量的协调活动。 3.3 质量评价过程 qualityevaluationprocedure 用于应用和报告质量评价方法及结果的操作。 3.4 质量测量qualitymeasurement 对质量定量元素、子元素的评估。 3.5 质量结果 qualityresult 数据质量测量得到的一个值或一组值,或将这些值同规定的一致性质量等级相比得到的评价结果。 3.6 质量范围qualityscope 报告质量信息的数据的覆盖范围或特征。 3.7 数据集dataset 可以标识的数据集合。 GB/T336742017.定义3.1
本标准规定了工业数据质量持续改进的模型,以及工业数据质量的描述、识别、评价、控制和报告的 要求。 本标准适用于工业数据采集、传输、维护和使用过程中的质量管理。 2 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T19001—2016质量管理体系要求 3 术语和定义 下列术语和定义适用于本文件。 3.1 数据质量dataquality 数据的一组固有特性满足要求的程度。 注:固有特性一般指永久性的特性 3.2 数据质量管理dataqualitymanagement 指导和控制某机构数据质量的协调活动。 3.3 质量评价过程 qualityevaluationprocedure 用于应用和报告质量评价方法及结果的操作。 3.4 质量测量qualitymeasurement 对质量定量元素、子元素的评估。 3.5 质量结果qualityresult 数据质量测量得到的一个值或一组值,或将这些值同规定的一致性质量等级相比得到的评价结果。 3.6 质量范围qualityscope 报告质量信息的数据的覆盖范围或特征。 3.7 数据集dataset 可以标识的数据集合。 『GB/T 33674—2017,定义 3.17
本标准规定了工业数据质量持续改进的模型,以及工业数据质量的描述、识别、评价、控制和报告的 要求 本标准适用于工业数据采集、传输、维护和使用过程中的质量管理
4工业数据质量持续改进
工业数据主要包括主数据、事务数据和产品数据。 工业数据质量特性包括完整性、一致性、准确性以及其他附加特性
工业数据质量管理应用戴明环(PDCA循环)持续改进方法,PDCA循环符合GB/T19001一2016 约规定,工业数据质量持续改进模型见图1,包括策划、实施、检查和处置4个阶段,其中: 策划(Plan):明确质量目标和用户需求,规划数据质量描述要素,开展数据质量描述; 实施(Do):识别数据质量要素,新建数据质量要素,开展数据质量识别; 检查(Check):选择评价方法,确定评价流程和步骤,开展数据质量评价; 处置(Act):确定控制规则.选择控制方法,开展数据质量控制
精确性:数值符合其实际值或规定值的程度 时序性:表达有序活动或序列活动相关数据时间顺序的正确性。 对任意数据质量定量元素,可新建附加数据质量定量子元素
5.2.3子元素描述项
GB/T39400—2020
对每个可用的数据质量定量子元素,应记录其质量信息。每个数据质量定量子元素的完全质量信 息,用下列7个数据质量描述项来描述: 数据质量范围; 数据质量测量; 数据质量评价过程; 数据质量结果; 数据质量值类型; 数据质量值单位; 数据质量测量日期
数据质量非定量元素用来描述数据集的非定量的质量信息。包括但不限于以下元素: 目的:描述数据集的创建原因和其预定的便用目的, 用途:描述使用过该数据集的应用。数据生产者或其他数据使用者用“用途”来描述数据集的 使用情况。 数据志:描述数据集的历史,即数据集的整个生命周期信息。数据志包含两部分:描述数据集 起源的源信息;描述数据集生命周期中的处理步骤和过程信息。数据溯源描述参见 GB/T349452017
6.1定量的数据质量信息
6.1.1识别可用的数据质量定量元素
对可用于数据集的所有数据质量定量元素加以识别,判断这些元素是否适用于某一特定类型的数 据集 注:数据质量定量元素可用性由数据规范来决定
6.1.2新建附加数据质量定量元素
方面,则应命名并定义新的 量定量元素。附加数据质量定量元素的命名和定义,应作为数据集质量信息的一部分。
6.1.3识别可用的数据质量定量子元素
对可用数据质量定量元素的所有数据质量定量子元素加以识别,判断这些元素的数据质量定量 素是否适用于某一特定类型的数据集。每个可用数据质量定量元素至少包含一个可用数据质量定 元素。 注:数据质量定量子元素可用性由数据规范来决定,
GB/T 51330-2019 传统建筑工程技术标准(完整正版、清晰无水印)GB/T 394002020
6.1.4新建附加数据质量定量子元素
方面,则应命名并定义新的 量定量子元素。附加数据质量定量子元素的命名和定义,应作为数据集质量信息的一部分。
DB37/T 2905-2019 运动场地合成材料面层 施工要求6.1.5数据质量定量子元素描述项使用
6.1.5.1数据质量范围
对每个可用数据质量定量子元素,应识别至少一个数据质量范围。数据质量范围可以是数据集系 列、数据集或数据集内具有相同特征的部分数据。若数据质量范围无法识别,则默认为该数据集 注:数据质量范围的确定参照数据规范及数据质量非定量元素提供的非定量质量信息