GB/T 21336-2008 地理信息 质量评价过程.pdf

GB/T 21336-2008 地理信息 质量评价过程.pdf
仅供个人学习
反馈
标准编号:
文件类型:.pdf
资源大小:1.9 M
标准类别:其他标准
资源ID:361509
下载资源

标准规范下载简介

GB/T 21336-2008 地理信息 质量评价过程.pdf

GB/T21336—2008

GB/T 213362008

某市轨道交通一号线一期工程控制中心空调系统安装工程施工组织设计GB/T21336—2008

E.2检验批和检验单元

总体量以及样本量的大小可根据检验单元的不同基数确定。样本量的确定要直接标示检验单元 表E.1为不同基础的示例

表E.1定义总体的不同基础

图E.1说明总体和样本两者之间的区别。整个图表示数据质量范围内的数据。该图显示出可能 的样本区域范围约占整个数据质量范围的15%,但该样本区域范围内仅包含约10%的曲线长度,而且 无节点。 为解决如图E.1所示的采样问题,可使用不同指标组合的方法确定样本的量和位置,以提高样本 的代表性。

.1样本位置对样本中检验单元代表性的影响

GB/T21336—2008

如:样本应包含数据集覆盖区域 含不少于数据集中描述目标的曲线总长度 的5%,

本条提供顾及地理数据特殊情况的样本定义和抽样方法指南。图E.2示出本附录阐述的 抽样策略有两个方面:抽样的检验单元(区 和选择检验单元的方法(概率或判定)

E.4.2概率抽样与判定抽样

E.4.2概率抽样与判定抽样

E. 4. 2. 1区别

图E.2抽样策略关系

概率抽样应用抽样理论,并包含样本检验单元的随机选取。 概率抽样的基本特征是选择样本的总 本的每个部分都有已知的选取概率。当采用概率抽样时,可以进行有关抽样总体的统计推论。判定栏 本设计包括基于专家知识或专业判别的样本选择,

E.4.2.2简单随机抽样

E.4.2.3分级随机抽样

分级抽样需要将总体分为不相重叠的级或子总体,使同级的样本检验单元间比不同级样本检验单

E.4.2.4半随机抽样

半随机抽样或系统抽样对初始样本检验单元(即位置、时间、要素)采用随机选,对其余所有检验 单元则采用规则选取。半随机抽样或系统抽样的一个例子是格网抽样,这里格网的起始位置是随机决 定的,样本则按空间上规则的空间间隔(格网单元)选取。系统格网抽样用于搜索样本群和推断出均值, 百分位数,或其他参数,还用于评估空间趋势或图斑。该方法提供实用且容易实现的途径,以保证覆盖 区域范围。

E.4.3按要素与按区域抽样

按要素抽样策略是基于要素的非空间属性,而不是基于它们的空间位置选择检验单元样本。如果 整个数据质量范围的产品特征相同,该数据质量范围内的样本可以随机选取。在某些情况下,简单随机 抽样的结果可能不理想,因为可能仅仅数据质量范围的局部区域特征相同,且可能需要样本的均匀分 布,即被抽样的特征中存在明显的不规则图斑或呈集群分布。在这种情况下,分级或半随机抽样可获得 更好的结果

GB/T213362008

例1:如果抽样方法由要素的随机选择确定,则样本有集中在一个较小区域(可能是不可接受的)的风险。 半随机抽样可用于保证样本量和(或)位置的不同指标的确定,以满足对样本的附加限制或降低检 验过程的费用。 例2:电力公司需要评估不同类型要素属性调查的正确性,考虑两种方法:随机选取和半随机选取(随机选取一种类 型要素,然后搜集与第一种类型相邻的不同类型目标,直到抽取了每种类型要素的样本),以降低野外检验费用。

E.4.3.2按区域抽样(空间抽样)

图E.3按区域随机抽样示例

集要求覆盖整个区域范围,则样本位置应根据规则的或不完全规则的图斑决定。图E.4是对 延分布的抽样要素进行半随机(系统)抽样的示例,用于评估数据集位置准确度。

或的规则和非随机抽样示例(×表示按照样本包

抽样时需要考虑以下问题: a)地理数据集覆盖的区域可构成连续的空间。当将数据集划分为检验批时,应特别注意跨越检 验批边界的检验单元的遗漏或多余问题。 6 多种因素,包括原始资料的质量和操作人员的技术水平会影响地理数据质量,数据生产者应 小心地定义检验批以达到检验质是的检验单元的一致

包.5.2抽样检验的现行标准

基于产品的特性和依据产品规范,从现行的国家标准和ISO标准中选择适合抽样检验的标准

GB/T 213362008

应接照产品规范或需求定义检验单元。如果不合格检验单元在统计上高度相关,将它们作为单 的检验单元进行处理,

如果数据质量范围内部不均匀,应将其划分为均匀的子集。 这些均匀的子集应看作不同的数据质 量范围。 注:当下列情况出现时,可以推断为均匀的: 一产品的原始资料具有几乎相同的质量; 一生产系统(硬件、软件、操作人员的技术水平)基本上相同: 可能导致不一致的其他因素(如要素的复杂程度和密度)基本相同

E.5.3.3将数据质量范围划分为检验批

E.5.3.4将检验批划分为抽样单元

抽样单元可以是现有的地理区域,或进行检验的论域的其他分区。当抽样单元是地理区域 部分包含在抽样单元中的检验单元的划分规则。

E.5.3.5采用简单随机抽样选择检验用抽

选取的抽样单元中包含的检验单元总数应符合相关国家标准和ISO标准的规定。 注:如果检验批在统计上是不同类的,不应采用相同抽样等级的简单随机抽样。GB/T2828允许分级抽样。 E.5.3.6检验选取的抽样单元

5.3.6检验选取的抽栏

检验选取的抽样单元中所有的检验单元。按照选择的质量检测(量度),将数据集中的检验 域对比。

GB/T 213362008

本示例的目的是说明度量国家地形数据库(TDB)专题准确度和完整性所采用的质量评价过程。 未讨论位置准确度,因为它不是这类报告的主题。然而,位置准确度一般也采用非随机抽样通过实地测 量进行检验。 F.2说明了数据生产者质量评价步骤,F.6说明了质量信息的记录,

表F.1说明本示例质量评价的操作过程

F.3数据质量评价方法

F.3. 1 抽样步骤

完整性和专题准确度检验执行GB/T2828.1一2003的规定。表F.2列出该国家标准规

GB/T213362008

下列类型的记录是在野外对每个样本区进行检验获得的,图F.1示出对结果进行归纳后产 例如,在样本检验区内有28个1~2层的其他建筑物,按照产品规范数据集中遗漏了1个( 误),有11个要素不应采集

F.5确定数据质量结果和一致性

F.1一个检验区域局部野外质量检验调查示

计算机生成每项质量检验的记录。质量检验的完整记录包括要素超过65个,一些要素含有1个或 多个属性。图F.2是地形数据集完整性和专题准确度评价记录的示例。 图F.2中选作样本的数据库(1:10000图幅)有16个。使用计算机算法从这些数据库中选择 km×1km正方形区域。图F.2示出一个抽样单元。该抽样单元的打印输出表在野外与图F.1一起 使用,检验每个检验单元的完整性和专题准确度,其结果记录在图F.2中。 例如,“公路”要素每100个单元允许有4个完整性错误和4个分类错误。数据库中有4712个路 段(一个路段是两个节点间的线段)。样本中有184个检验单元。GB/T2828规定该检验批量和检验 等级需要80个检验单元,所以满足了最低要求。该样本量的可接受的值为10,因此允许有10个完整 生错误或分类错误。该样本的完整性和分类错误仅有两个,故检验通过。作为参照,对于AQL一 个错误/100个单元)时的可接受值而言,这同样满足了要求,

GB/T213362008

GB/T213362008

图F.4符合本标准附录I规定的质量评价报告

GB/T 213362008

GB/T213362008

GB/T 21336—2008

附录G (资料性附录) 完整性与专题准确度度量和记录示例

示范如何应用质量评价过程度量和记录量化数据质量结果; 给出专题准确度及完整性度量和记录示例; 示范用分类错误矩阵(misclassificationmatrices)作为工具评价数据质量。 本示例包括如何在元数据中和在质量

数据集中的要素、属性和关系。 为示范如何建立数据集,图G.3用图形表示出论域,即满足产品规范要求的理想的数据集。在整 图中: 树符号下的数字或表示数字域的字符是树高,单位为米(m); 房屋符号内的数字是该建筑物层数; 房屋符号旁的注记为建筑物名称。 这3幅图之间的关系是: 图G.2表示“真实世界”,它通常比数据集包含的要素多。 图G.3表示产品规范规定的“论域”。如果数据集是完整的和正确的,它是“真实世界”的一部 分,应当包含在数据集中。 图G,4表示建立的数据集。

GB/T213362008

图G.2“真实世界”的图形表示

图G.3论域的图形表示

GB/T213362008

图G.4数据集的图形表示

通过将图G.4表示的数据集内容与图G.3表示的论域内容进行对比,可以发现示例数据集的错误 (见图G.5),以下是错误及供参照的错误编号

图G.5数据集错误所在位置的图形表示

a) 树的遗漏和多余性错误:有3棵多余的树(#6、#8、#27),遗漏了两棵树(#9、#25) b) 小路的遗漏和多余性错误:遗漏了一条小路(#18),有一条多余的小路(#19)。 一间房屋取代了工业建筑物(#23)。 两条小路错误地标为公路(#17、#26)。 e) 遗漏了一间房屋(#21)。 f 公路的属性错误:两条公路的“条件”错误(#29、#28)

GB/T 213362008

g 数据集中表示了不应采集的医院一所(#3)。 h 数据集中表示了两棵高度不足1m的树(#6、#8)。 遗漏树高属性等级代码:一棵树的等级代码遗漏,它在论域中的代码为“B”(#22)。 树的高度属性分级错误:6棵树的高度等级错误(#2、#11、#13、#16、#20、#24)。 ) 房屋名称属性“建筑物名称”错误:论域中名为“新城大厦”(#7)和“石楼”(#1)的房屋在数据 集中无名称。而在数据集中名为“厅松宾馆”(#12)的房屋在论域中并无名称。 1 房屋名称属性“建筑物名称”错误:论域中名为“花园大厦”(#5)和“林华商场”(#15)的房屋, 在数据集中分别为“花园大夏”和“林华商城”。 m 房屋“建筑物层数”属性值错误:一间房屋(#31)遗漏了该属性值,3间房屋(#4、#14、#30) 的属性值错误。 n)工业建筑物的遗漏性错误:遗漏了一栋工业建筑物(#10)。 注:遗漏/多余、完整性或专题准确度等错误的分类具有主观性。例如,一间错误地划为工业建筑物的房屋,可以认 温中一品全品一

GB/T21337一2008将完整性定义为要素、要素属性和要素关系的存在和缺失。本例的 要素类型进行分类。度量检验的类型为多余性错误和遗漏性错误。表G.1示出完整性分 方法

表G.1要素类型的完整性

G 33 专题准确度

G.3.3.1GB/T21337一2008将专题准确度定义为量化属性的准确度和非量化属性的正确性,以及要 素分类及其关系的正确性。表示专题准确度错误的一种方法是使用“分类错误矩阵”。 注1:分类错误矩阵是一个矩形矩阵,其中,表示数量分级的元素i,实际应为的要素,被划分为j。 表G.2是一个表示要素分类错误的矩阵。它解释了数据集中的实例分类的正确程度。不同的百 分数应始终与数据集的总体相关。

出现的数目,矩阵单元中的值是错误分类所占的百分 G.2要素分类错误矩阵

G.2要素分类错误矩

GB/T213362008

表G.3和表G.4仅仅计算了相同要素类型中具有一致性的要素。 G.3.3.2表G.3列出树的"高度”属性

表G.3要素高度属性分类错误矩阵树高

G.3.3.3表G.4列出公路条件”属性

表G.4要素属性分类错误矩阵公路条件

G.4 质量结果的记录

G.4.1多余性错误示

GB/T213362008

先,将质量结果作为元数据记录。然后,采用质量评价报告记录质量的详细信息。

图G.6是按照GB/T19710一2005规 据内容记求质量结果的示例。圆 GB/T19710—2005使用代码的解释,但它不是该记录的组成部分。

10一2005规定的元数据内容记录质量结果 解释,但它不是该记录的组成部分。

G.4.3质量评价报告

图G.6按照GB/T19710—2005用元数据记录

图G.6按照GB/T19710—2005用元数据记录

图G.7按照本标准附录I规定的质量评价报告

GB/T 21336—2008

本示例描述的主题是说明公 准确度度量与综合技术 本示例仅考虑记录综合的 级别进行对比

H. 2. 1 表示真实世界

图H.1 和随机选取的抽样检验单元(灰色矩形区域

图H.1从完整数据库随机选取的检验批

随机选取的抽样检验单元(灰色矩形区域)

虽然按照本示例的目的进行了简化院内绿化亮化项目施工组织设计,图H.2还是给出了定义论域的产品规范。该规范说明了那些 被认为对产品而言是重要的规则

图H.2产品规范示例

图H.3表示论域。就本示例的目的而言,它提供了现实世界的图形,数据集的内容可以与其进行 比较

小高层住宅楼施工组织设计GB/T 21336—2008

注:箭头表示单行路方向,无箭头表示双向通车

图H.3论域的图形表示

©版权声明
相关文章