标准规范下载简介
TCHES 47-2020 非结构化水文资料数据库结构标准.pdfT/CHES472020
T/CHES 47=2020
非结构化水文资料数据库结构标准
DL/T 636-2017《带电作业用导线飞车》.pdfStandardforstructureofdatabaseforunstructuredhydrologicdata
T/CHES47—2020目次前言:引言·III1范围2规范性引用文件3术语和定义4原则和要求5字段类型.·6记录·7非结构化水文资料数据库字段定义7.1文本格式数据的字段定义7.2非文本格式数据的字段定义7.3非结构化数据及结构化数据的字段定义,8非结构化水文资料数据库设计8.1库名和库标识编制·8.2存储位置8.3中文分词·8.4字段设计·9非结构化水文资料数据库的拆分与合并10水文资料文字信息索引11其他规定附录A(资料性)水文资料非结构化数据及结构化数据导入9
T/CHES 47=2020
本文件按照GB/T1.1一2020《标准化工作导则第1部分:标准化文件的结构和 起草规则》的规定起草。 本文件由山东省水文局提出。 本文件由中国水利学会归口。 本文件起草单位:山东省水文局、山东国基光晔信息科技有限公司。 本文件主要起草人:余国倩、张建新、陶光毅、封得华、赵天宇、刘春阳、花基 尧、郭增、李硕、刘冰、池宸星、王娟
T/CHES 47=2020
随着水文事业的发展和信息技术的进步,以及水文行业数据采集能力的不断提升, 可收集的数据日益增多,其数据资源呈多源异构、分布广泛和动态增长的态势,利用 介值高,且需要长期保存。从数据格式上看,水文资料(水文数据)包括结构化数据 和非结构化数据。一般采用关系型数据库存储和管理水文资料结构化数据,而水文资 料非结构化数据存储在文件系统,采用关系型数据库进行管理。非关系型数据库突破 了关系型数据库严格的库表结构,可存储多种类型、多种格式的水文资料非结构化数 活。 非关系型数据库与关系型数据库互不排斥,可以相互交换数据,从而实现相互补 充、扩展。水文部门可根据实际需求,充分利用非关系型数据库和关系型数据库各自 的特点和优势,实现统一存储和管理水文资料非结构化数据和结构化数据。
T/CHES 47=2020
非结构化水文资料数据库结构标准
本文件规定了非结构化水文资料数据库结构设计及采用非关系型数据库存储非结 勾化水文资料的技术要求。 本文件适用于非结构化水文资料数据库的设计、建设和应用
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中, 注日期的引用文件,仅该日期对应的版本适用于本文件,不注日期的引用文件,其最 新版本(包括所有的修改单)适用于本文件。 GB/T32908—2016非结构化数据访问接口规范 GB/T50095一2014水文基本术语与符号标准 SL212015降水量观测规范 SL478水利信息数据库表结构及标识符编制规范 SL502一2010水文测站代码编制导则 DA/T582014电子档案管理基本术语
T/CHES 47=2020
4.1.1非结构化水文资料数据库结构设计应遵循完整性、一致性、准确性、实用性和 规范化、可扩展的原则。 4.1.2非结构化水文资料数据库结构应满足大规模、多种类型、多种格式的水文资料 非结构化数据存储的要求。 4.1.3非结构化水文资料数据库结构设计中,应对所管理的数据库按学科或业务需求 进行分类和编码。 4.1.4非结构化水文资料数据库结构应具有开放性和包容性,能与搜索引擎集成。 4.2要求 4.2.1非结构化水文资料数据库宜采用非关系型数据库。 4.2.2非结构化水文资料数据库应由记录组成,记录由字段组成,字段存储水文资料 非结构化数据和结构化数据。 4.2.3非结构化水文资料数据库结构内容应包括数据库名、数据库标识、字段描述。 4.2.4非结构化水文资料数据库名应使用简明抛要的文字表达该数据库所描述的内容 命名准确、无歧义。 4.2.5非结构化水文资料数据库标识由英文字母、数字和下划线“"组成,首字符应为 大写英文字母。 4.2.6字段描述应包括字段号、字段名、字段标识、字段类型及长度、是否允许空值 计量单位、是否索引等,并应符合以下规定: a)字段号采用数字表示; b)字段名采用中文字符表征字段的名称,命名准确、无歧义; C) 字段标识由英文字母、数字和下划线“”组成,首字符为大写英文字母; d 字段类型及长度描述该字段的数据类型和数据长度: e) 是否允许空值描述该字段是否允许空值; f 计量单位描述该字段数据的计量单位; 是否索引描述该字段数据是否进行索引。
5.1非结构化水文资料数据库应能创建不同类型的字段,存储多种类型、多种格式的 水文资料非结构化数据和结构化数据,并根据用途和需求变化对字段进行增加、删除 和修改。 5.2字段类型主要有字符、数值、日期、时间、文本、二进制等类型,使用规则按SL478 执行。 a)字符字段用于存储定长字符串和变长字符串,其类型长度描述为:C(d); b)数值字段用于存储整数和实数,其类型长度描述为:N(D[,d);
5.1非结构化水文资料数据库应能创建不同类型的字段,存储多种类型、多种格式的 水文资料非结构化数据和结构化数据,并根据用途和需求变化对字段进行增加、删除 和修改。 5.2字段类型主要有字符、数值、日期、时间、文本、二进制等类型,使用规则按SL478 执行。 a)字符字段用于存储定长字符串和变长字符串,其类型长度描述为:C(d); b)数值字段用于存储整数和实数,其类型长度描述为:N(D[,d);
6.1非结构化水文资料数据库的记录可由任意多个字段组成,字段类型应按5.2规定 执行。每条记录的长度无限制。 6.2一条记录可有多个字符、数值、日期、时间的字段。 6.3一条记录可有多个文本字段,存储多个自由文本,包括从文本格式水文资料非结 构化数据中抽取的文字信息。 6.4一条记录可有多个二进制字段,存储多个水文资料非结构化数据,一条记录中多 个水文资料非结构化数据的格式可不同。 6.5同一非结构化水文资料数据库可存储多种格式的非结构化数据,不同记录的水文 资料非结构化数据的格式可不同。 6.6每条记录在数据库中应有唯一的记录号,记录号应自动生成。 3.7每个文本格式水文资料非结构化数据装入非结构化水文资料数据库时,应生成字 符、文本、二进制和数值等4个字段的数据,存储在一条记录中,并符合以下规定: a)水文资料非结构化数据名称存储在字符字段; b)从文本格式水文资料非结构化数据中抽取的文字信息存储在文本字段: c)水文资料非结构化数据存储在二进制字段; d)水文资料非结构化数据容量存储在数值字段。 3.8每个非文本格式水文资料非结构化数据装入非结构化水文资料数据库应生成字 符、二进制和数值等3个字段的数据,存储在一条记录中,并符合以下规定: 水文资料非结构化数据名称存储在字符字段; b)水文资料非结构化数据存储在二进制字段; C 水文资料非结构化数据容量存储在数值字段。
7非结构化水文资料数据库字段定义
7.1文本格式数据的字段定义
7.1.1存储文本格式水文资料非结构化数据的数据库字段类型应包括字符、数值、文 本和二进制字段。 Z.1.2应按照记录的字段内容建立字段
GB/T 36360-2018标准下载.1.2应按照记录的字段内容建立字段。
示例:水文测站考证簿数据库字段定义详见表
表1水文测站考证潼数据库字段定义
说明:各字段存储内容为: a) 考证簿名:数字(化)考证簿的名称; b) 电子文件容量:数字(化)考证薄容量: c) 文字信息:从数字(化)考证簿中抽取的文字信息 d)电子文件:数字(化)考证簿
7.2非文本格式数据的字段定义
GB/T 38847-2020 智能工厂 工业控制异常监测工具技术要求7.2.1存储非文本格式水文资料非结构化数据的数据库字段类型应包括字符、数值和 二进制字段。 7.2.2应按照记录的字段内容建立字段
示例:流域图数据库字段定义详见表2
表2流域图数据库字段定义