标准规范下载简介
DB35T 1952-2020 公共信息资源开放 数据质量评价规范.pdfDB35/T 1952202
公共信息资源开放 数据质量评价规范
taSpecificationforqualityevaluatior
福建省市场监督管理局 发布
范围. 规范性引用文件 术语和定义 数据集元数据描述 数据质量评价原则 数据质量评价方法. 6.1重复值分析法 6.2缺失值分析法 6.3值域分析法 6.4逻辑关系分析法 6.5词组比对分析法 6.6实验观察法 6.7经验分析法 数据质量评价指标 7.1完整性, 7.2一致性JB/T 10668-2018标准下载, 7.3唯一性 7.4可机读性 7.5规范性 7.6及时性 7.7原始性 7.8非歧视性 7.9安全性 数据质量评价步骤 8.1步骤, 8.2选择评价指标 8.3初步评价 8.4数据集元数据评价 8.5标识数据记录评价 8.6内容数据记录评价 8.7形成评价结果. 录A(资料性)评价结果应用示例 3
三 范围. 规范性引用文件, 术语和定义 数据集元数据描述 数据质量评价原则 数据质量评价方法. 6.1重复值分析法 6.2缺失值分析法 6.3值域分析法 6.4逻辑关系分析法 6.5词组比对分析法 6.6实验观察法 6.7经验分析法 数据质量评价指标 7.1完整性 7.2 一致性 7.3唯一性 7.4可机读性 7.5规范性 7.6及时性 7.7原始性 7.8非歧视性 7.9安全性 数据质量评价步骤 1 8.1 步骤 8.2选择评价指标 8.3初步评价 8.4数据集元数据评价 8.5标识数据记录评价 8.6内容数据记录评价 8.7形成评价结果. 附录A(资料性)评价结果应用示例
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的 草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任 本文件由福建省经济信息中心提出。 本文件由福建省信息化标准化技术委员会归口。 本文件起草单位:福建省经济信息中心、浪潮软件股份有限公司。 本文件主要起草人:阙天豪、何坤山、郑清溪、吴阳、戴起飞、张兆勇、鲍庆峰、许剑雄。
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和起草规则》的规定 起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由福建省经济信息中心提出。 本文件由福建省信息化标准化技术委员会归口。 本文件起草单位:福建省经济信息中心、浪潮软件股份有限公司。 本文件主要起草人:阙天豪、何坤山、郑清溪、吴阳、戴起飞、张兆勇、鲍庆峰、许剑雄
公共信息资源开放数据质量评价规范
本文件给出了公共信息资源开放数据集元数据描述,确立了数据质量评价的原则、方法、指标和步 本文件适用于公共信息资源管理、开放、开发和质量评价等活动中的数据质量评价
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文件, 仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于本 文件。 GB/T74082005 数据元和交换格式信息交换日期和时间表示法 GB/T19710—2005地理信息元数据 GB/T36344一2018信息技术数据质量评价指标
GB/T19710一2005、GB/T36344一2018界定的以及下列术语和定义适用于本文件。 3.1 政务部门governmentdepartment 国家机关、经法律法规授权或者受委托管理公共事务的事业单位和团体组织。 3.2 公共信息资源publicinformationresources 政务部门、公共服务企业在履行职责或经营过程中制作或获取的,以一定形式记录、保存的,与企 业和公众息息相关的文件、资料、图表和数据等各类信息资源。 3.3 公共信息资源开放openingofpublicinformationresources 经过数据加工处理后,将不涉及国家秘密、商业秘密和个人隐私的公共信息资源,通过公共信息资 源开放平台,提供给社会使用的过程。
数据质量dataquality
在指定条件下使用时,数据的特性满足明确的和隐含的要求的程度
DB35/T 1952—2020
[来源:GB/T36344—2018,2.3
数据质量评价dataqualityevaluatior
按照数据质量评价指标体系,采用适当的方法对数据质量进行评估,并形成数据质量评价 程。
DB35/T 1952—2020
在非亢余的情况下,将每条数据记录中的部分数据项或者所有数据项的取值,与所有的数据记录 一比对,识别重复记录。
对每条数据记录的所有数据项进行逐一检查GB/T 38770-2020标准下载,识别数据记录的数据项是否为空。
将数据项的取值与字段的取值区 间进行比对,识别是否超出取值区间,
将数据记录目标数据项的取值与目标敏感词、常见错词等词库内容进行比对,识别与词库 据记录。
某些条件,通过控制行为过程,观察符合条件的
对比验证数据取值与日常生产生活中产生的经验取值,证实或证伪数据内容 经验分析法常与逻辑关系分析法、词组比对分析法联合使用。
完整性评价指标见表2
钢筋平法计算规则图文并茂讲解表2完整性评价指标(续)