GB/T 38666-2020标准规范下载简介
GB/T 38666-2020 信息技术 大数据 工业应用参考架构ICS35.240.50 L67
nformation technologyBig dataIndustrial application reference archit
hation technologyBig dataIndustrial application reference architectur
CBDA 11-2018-T 机场航站楼室内装饰装修工程技术规程国家市场监督管理总局 发布 国家标准化管理委员会
规范性引用文件 术语和定义 缩略语 参考架构 参考架构构件功能 6.1 系统协调者 6.2 数据提供者 6.3 应用提供者 6.4 大数据计算框架提供者 6.5 数据消费者 6.6 安全和隐私 67管理
本标准按照GB/T1.1一2009给出的规则起草 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:北京数码大方科技股份有限公司、中国电子技术标准化研究院、清华大学、中国人 民大学、上海计算机软件技术开发中心、北京软通智城科技有限公司、九次方大数据信息集团有限公司, 勤智数码科技股份有限公司、中兴通讯股份有限公司、北京卡达克数据有限公司、四川久远银海软件股 份有限公司、湖北省标准化与质量研究院、北京软件和信息服务交易所有限公司。 本标准主要起草人:齐建军、朱道云、卫凤林、张群、王晨、王主建民、杜小勇、陈普川、郑树泉、栗越妍
术大数据工业应用参考架构
本标准给出大数据在工业领域的参考架构,规定了各组成部分(构件)的基本功能 本标准适用于工业大数据开发、管理和应用
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 O GB/T35295—2017信息技术大数据术语 GB/T35589—2017 信息技术大数据技术参考模型 3术语和定义 GB/T35295一2017界定的以及下列术语和定义适用于本文件 3.1 工业大数据industrial bigdata 3.2 大数据工业应用参考架构industrialbigdataapplicationreferencearchitecture;IBDRA 对工业大数据内在要求、设计结构和运行进行开放性探讨的高层概念模型。 注:一般包含系统协调者、数据提供者、应用提供者、框架提供者和数据消费者5个逻辑功能构件。 3.3 系统协调者 system orchestrator IBDRA中的一种逻辑功能构件,定义所需的数据应用活动并将它们整合到可运行的垂直系统中 3.4 数据提供者dataprovider IBDRA中的一种逻辑功能构件,将新的数据或信息引人大数据系统。 3.5 应用提供者applicationprovider IBDRA中的一种逻辑功能构件,执行数据生命周期操作,以满足系统协调者定义的需求以及安全 和隐私保护需求。 3.6 框架提供者 framework provider IBDRA中的一种逻辑功能构件,即一种计算框架,在此框架中执行应用转换,同时保护数据完整性 和隐私。 37
数据消费者dataconsumer
下列缩略语适用于本文件。 BOM:物料清单(Bill of Material) CAD:计算机辅助设计(ComputerAidedDesign) CAE:计算机辅助工程(ComputerAidedEngineering) CAM:计算机辅助制造(ComputerAidedManufacturing) CAPP:计算机辅助工艺规划(ComputerAidedProcessPlanning) CAX:计算机辅助技术/系统(ComputerAidedX) CRM:客户关系管理(CustomerRelationshipManagement) DNC:分布式数控设备联网(DistributedNumericalControl) ERP:企业资源计划(EnterpriseResourcePlanning) IBDRA:大数据工业应用参考架构(IndustrialBigDataApplicationF Reference Architecture) MES:制造执行系统(ManufacturingExecutionSystem) NC:数字控制(NumericalControl) PLM:产品生命周期管理(ProductLifecycleManagemen POSIX:可移植操作系统接口(PortableOperatingSystemInterface) SCADA:数据采集与监视控制(SupervisoryControlandDataAcquisition) 参考架构 本标准在GB/T35589一2017定义的大数据参考架构的基础上,针对工业领域应用,进一步细化了 提供者和数据消费者,明确了"工业”领域的应用提供者。本标准定义的IBDRA见图1。
图N大数据工业应用参考架构
数据提供者的主享 此构件主要包括数据源和系统两部分。数据源产生原始数据,之后通过各种信息系统的收集、 分类,提供给工业大数据应用提供者
主要功能是提供原始数据。任何实体以及实体的活动都可能是数据源,例如,各类人员、工业软件、 生产设备装备、产品、物联网、互联网、其他软件等各类实体,以及企业活动、人员行为、装备设备运行、环 境检测、物联网和互联网运行等各类活动都可能产生数据。图1以示例形式列出了以下三大类数据源: a)产品:是工业应用数据的核心数据源。 以产品的整个生命周期过程为主线,从时间上覆盖产品市场调研、概念设计、详细设计、工艺设计、 生产准备、产品试制、产品定型、产品销售、运行维护、产品报废和回收利用等过程,从空间上覆盖企业内 部、供应链上的企业及最终用户,都在产生产品相关数据。这些数据影响许多与产品相关的其他数据源 所产生的数据,支持不同的工业应用 产品相关数据,其表现形式有很多,例如,产品结构和配置、零件定义及设计数据。CAD三维模型和 二维图纸文件、工程分析及验证数据、制造计划及规范、CAD/CAM编程文件、图像文件照片、造型图、 扫描图等)、产品说明书、软件产品(程序、库、函数等“零部件”)等结构化和非结构数据。具体描述形式 取决于设计者设计时的考虑。 b)工业物联设备:是工业大数据新的、增长最快的来源。 工业生产设备在物联网运行模式下,产生、收集涵盖操作和运行情况工况状态、环境参数等数据。 工业物联设备产生的数据,其表现形式有很多海绵城市建设技术指南,例如:设备接口、智能传感器产生收集的涵盖设备运 行参数、工况状态参数、运行环境参数等评估生产设备运行状态、产品运行状态的数据。具体表现形式 决于设备的功能和使用者的需求。 c)生产经营及外部互联网:是与工业企业生产活动和产品相关的企业外部互联网,是保障工业应 用的支撑数据源。 生产经营及外部互联网数据主要来自传统企业信息化范围,被收集存储在企业信息系统内部。 生产经营及外部互联网数据,其表现形式有很多,例如:企业信息系统累计的产品生产研发数据、试 验数据、生产数据、客户信息数据、物流供应数据、环境数据;用户通过互联网发表的与企业产品相关的 评论数据、第三方机构提供的用户调查数据、评价企业环境绩效的环境法规、预测产品市场的宏观社会 经济数据等。具体表现形式取决干生产经营活动的需求
主要功能是对数据源产生的数据进行收集、分析与分类,然后提供给工业大数据应用提供者。此类 系统有很多,主要包括CAD、CAM、CAE、CAPP、PLM、MES、SCADA、DNC、ERP、SCM、CRM等。具 体如下: a)CAD用于生成产品的图形化数据,是所有产品数据的源头,包括非结构化数据(文件)和结构 化数据(从文件中提取出的产品属性、BOM结构和物料清单数据等)。产生的数据可为设计、 绘图、工程分析与文档控制等设计活动提供支持。 b)CAM一般具有数据转换和过程自动化两方面的功能。CAM在CAD模型基础上,生成和仿 真优化数控加工用的指令代码数据。产生的NC代码可驱动机床设备运行,进行生产设备管 理、控制和操作。 CAE一般采用CAD系统来建立CAE的儿何模型和物理模型,完成分析数据的输人,主要处 理、分析和优化复杂工程和产品的力学性能等数据。系统产生的结果数据可生成形象的图形 输出,为设计活动提供支持。 CAPP通过向计算机输被加工零件的儿何信息(形状、尺寸等)和工艺信息(材料、热处理、批 量等),来生成产品和零件的工艺路线、工序内容等加工工艺过程文件。
协同过程数据。 f MES用于收集、管理和优化车间层的制造过程数据。MES在接收订单开始到制成最终产品 的全部时间范围内,采集来自产品、工业物联设备以及生产经营相关的各种数据信息和状态信 息,与上层业务计划层和底层过程控制层进行信息交互。 g SCADA用于收集和管理自动化设备的运行参数、控制、测量及各类信号报警等数据,并向现 场连接的设备发送控制命令。 h)DNC用于收集、管理和控制数控机床设备的输入、输出数据。其中涉及的数据实体包含四类: 1)与制造设备硬件相关的数据实体(如机床等): 2)与人机通信相关的数据实体(如通信协议实体和串口通信实体); 3) 数控数据实体(如NC程序号、刀具号、工序号); 4)输人操作指令或派工单实体。 1 ERP围绕企业的业务流程,用于收集和管理企业的物质资源、人力资源财务资源等数据。 力 SCM围绕企业业务协作过程,收集和管理企业与上下游合作伙伴间的协作数据 k)CRM用于收集和管理企业与客户间的交易和服务数据 X
应用提供者主要功能是围绕数据消费者需求,将来自数据提供者的数据进行处理和提取 据消费者。 主要包括收集、预处理、分析、可视化和访问五个活动
负责处理与数据提供者的接口和数据引人 由于工业数据的种类、格式很多,且开放程度差异很大,缺少统一标准,需要根据数据格式、类型 引用对应的工业应用或构件TB 10100-2018 铁路旅客车站设计规范,完成数据的识别和导入
包括数据清洗、数据归约、标准化、格式化和存储。 数据清洗和数据规约是为避免噪声或干扰项给后期分析带来困难,针对首次采集获得的多维异构 数据执行的同构化预处理。 数据标准化、格式化处理如:元数据处理和标识管理。具体如下: a)元数据处理包括对订单元数据、产品元数据、供应商能力等进行定义和规范; b)标识管理包括分配与注册、编码分发与测试管理、存储与编码规范、解析机制等。 数据存储主要采用大数据分布式云存储的技术,将预处理后的数据有效存储在性能和容量都能线 性扩展的分布式数据库中
基于数据科学家的需求或垂直应用的需求,利用数据建模、处理数据的算法,以及工业领域专用算 法,实现从数据中提取知识的技术。 例如,对无法基于传统建模方法建立生产优化模型的相关工序建立特征模型,基于订单、机器、工 艺、计划等生产历史数据、实时数据及相关生产优化仿真数据,采用聚类、分类、规则挖掘等数据挖掘方 法及预测机制建立多类基于数据的工业过程优化特征模型