标准规范下载简介
GB/T 33767.14-2023 信息技术 生物特征样本质量 第14部分:DNA数据.pdfICS 35.240.15 CCS L 72
信息技术生物特征样本质量
某工业项目安装施工组织设计InformationtechnologyBiometricsamplequality Part14:DNAdata
国家市场监督管理总局 发布 国家标准化管理委员会
GB/T 33767.14—2023
范围 规范性引用文件· 术语和定义 ·* 缩略语 ·. DNA数据类型.... 5.1DNA测序数据...…. 5.2DNA比对数据. 5.3DNA分型数据 DNA数据质量要求 6.2完备性……. 6.3可追溯性 DNA数据质量测试方法 7.1DNA数据质量测试工具 7.2DNA数据准确性测试方法 7.3DNA数据完备性测试方法· 7.4DNA数据可溯性测试方法·
GB/T33767《信息技术生物特征样本质量》旨在规定生物特征识别数据的样本质量要求和测试 拟由十五个部分构成。 第1部分:框架。目的在于规定用于生物特征识别或验证技术的图像数据的样本质量要求和 测试方法通用框架。 一第2部分:指纹细节点数据。目的在于规定基于细节点的指纹用于指纹识别或验证技术的图 像数据的样本质量要求和测试方法。 第3部分:指纹型谱数据。目的在于规定基于指纹型谱用于指纹识别或验证技术的图像数据 的样本质量要求和测试方法。 第4部分:指纹图像数据。目的在于规定基于指纹图像用于指纹识别或验证技术的图像数据 的样本质量要求和测试方法。 第5部分:人脸图像数据。目的在于规定基于人脸图像用于人脸识别或验证技术的图像数据 的样本质量要求和测试方法。 一第6部分:虹膜图像数据。目的在于规定基于虹膜图像用于虹膜识别或验证技术的图像数据 的样本质量要求和测试方法。 第7部分:签名/签字时间序列数据,目的在于规定基于签名/签字信息用于签名/签字识别或 验证技术的数据的样本质量要求和测试方法。 第8部分:指纹骨架数据。目的在于规定基于指纹骨架模式用于指纹骨架识别或验证技术的 图像数据的样本质量要求和测试方法。 第9部分:血管图像数据。目的在于规定基于血管图像用于血管识别或验证技术的图像数据 的样本质量要求和测试方法。 第10部分:手形轮廊数据。目的在于规定基于手形轮廊图像用于手形识别或验证技术的图像 数据的样本质量要求和测试方法。 第11部分:签名/签字处理的动态数据。目的在于规定基于处理后的签名/标志行为数据用于 签名/签字识别或验证技术的数据的样本质量要求和测试方法。 一第12部分:脸型特性数据。目的在于规定基于脸型特性数据用于人脸识别或验证技术的图像 数据的样本质量要求和测试方法。 第13部分:声纹数据。目的在于规定基于单个会话中记录的单个扬声器的人的声纹数据用于 说话人识别或验证技术的数据的样本质量要求和测试方法。 一第14部分:DNA数据。目的在于规定基于高通量测序产生的各种DNA数据类型的DNA数 据用于DNA识别或验证技术的数据的样本质量要求和测试方法。 第15部分:掌纹图像数据。目的在于规定基于掌纹图像数据用于掌纹识别或验证技术的图像 数据的样本质量要求和测试方法。
信息技术生物特征样本质量 第14部分:DNA数据
信息技术生物特征样本质量
本文件提出了在生物特征识别中高通量测序产生的DNA数据类型,规定了DNA数据质量要求以 及对应的DNA数据质量测试方法, 本文件适用于生物特征识别中高通
3.17 基因型genotype 个体的一个或多个基因座上等位基因的组成, 注:本文件中特指SNP或STR位点的等位基因组成 3.18 测序深度sequencingdepth 测序样本中目标区域核苷酸被检测到的次数。 3.19 测序芯片sequencingchip;flowcell 高通量测序中为待测DNA分子提供测序反应 注:测序芯片是高通量测序的核心部件,具有吸附移动 会随机附着在通道表面
3.1/ 基因型genotype 个体的一个或多个基因座上等位基因的组成, 注:本文件中特指SNP或STR位点的等位基因组成。 B.18 测序深度sequencingdepth 测序样本中目标区域核苷酸被检测到的次数。 B.19 测序芯片sequencingchip;flowcell 高通量测序中为待测DNA分子提供测序反应场所的容器。 注:测序芯片是高通量测序的核心部件,具有吸附移动DNA片段的通道,测序文库中的DNA片段在通过通道时 会随机附着在通道表面。
3.17 基因型genotype 个体的一个或多个基因座上等位基因的组成。 注:本文件中特指SNP或STR位点的等位基因组成。 3.18 测序深度sequencingdepth 测序样本中目标区域核苷酸被检测到的次数。 3.19 测序芯片sequencingchip;flowcell 高通量测序中为待测DNA分子提供测序反应场所的容器。 注:测序芯片是高通量测序的核心部件,具有吸附移动DNA片段的通道,测序文库中的DNA片段在通过通道时 会随机附着在通道表面。
DNA测序数据包括基于高通量测序的光学或其他信号生成的碱基序列和每个碱基对应的质量 通量测序产生的DNA测序数据文件宜以FASTQ格式存放。FASTQ格式中每一条测序片段 信息表示,应符合GB/T35890一2018中6.1的要求
DNA比对数据是样本的DNA测序数据与参考序列进行比对,确定相对位置关系的比对文件。比 对过程中每个短序列应分配一个比对质量值表示映射质量分数,以表明比对过程的可信度;测序深度和 覆盖度通过参考序列的参考基因组位置次数和范围来计算。DNA比对数据的格式宜为SAM/BAM 格式。 注1:SAM/BAM格式:基于文本的储存核酸序列及其测序质量和序列比对相关的信息,其头部为注释信息,主体 部分以每一行表示一条序列且每行以制表符分隔的标准格式,BAM格式是SAM格式的二进制压缩格式。 注2:比对质量值:比对到错误位置的概率的整数映射,用来衡量比对正确的概率,通常以数字值直接表示
DNA分型数据是对DNA比对数据由适用的分型软件进行STR和SNP分型得到的数据。 STR分型数据应包含但不限于样本编号、STR名称和基因型;基因型以重复单元的次数表示,未得 到基因型或无法明确判定基因型记为“NA”。 SNP分型数据应包含但不限于样本编号、SNP名称和基因型;基因型以A、C、G、T表示,未得到基 因型或无法明确判定基因型的记为"NA”
6.1.1DNA测序数据的准确性
6.1.3DNA分型数据准确性
6.2.1DNA测序数据完备性
DNA测序数据至少包含以下文件和相应的内容: a)样本信息文件,应包含但不限于样本名称、样本类型和样本来源; b) )测序关联信息文件,应包含但不限于测序仪器(编号、版本号)、测序芯片标识、测序文库标识和 DNA测序数据文件名称; c)DNA测序数据文件,应包含碱基序列和每个碱基对应的质量值; d)DNA测序数据对应的MD5值。 以上文件应至少有一份备份。
DNA测序数据至少包含以下文件和相应的内容: a)样本信息文件,应包含但不限于样本名称、样本类型和样本来源; b) )测序关联信息文件,应包含但不限于测序仪器(编号、版本号)、测序芯片标识、测序文库标识和 DNA测序数据文件名称; c)DNA测序数据文件,应包含碱基序列和每个碱基对应的质量值; d)DNA测序数据对应的MD5值。 以上文件应至少有一份备份
DNA比对数据至少包含以下文件和相应的内容: a)样本信息文件,应包含但不限于样本名称、样本类型和样本来源; b) 1 比对关联信息文件,应包含但不限于测序仪器(编号、版本号)、测序芯片标识、测序文库标识 DNA测序数据文件名称和DNA比对数据文件名称; c)DNA比对数据文件,应包含比对质量、测序深度和覆盖度; d)DNA比对数据对应的MD5值。 以上文件应至少有一份备份
DNA比对数据至少包含以下文件和相应的内容: a)样本信息文件,应包含但不限于样本名称、样本类型和样本来源; b) 1 比对关联信息文件,应包含但不限于测序仪器(编号、版本号)、测序芯片标识、测序文库标识 DNA测序数据文件名称和DNA比对数据文件名称; c)DNA比对数据文件,应包含比对质量、测序深度和覆盖度; d)DNA比对数据对应的MD5值。 以上文件应至少有一份备份
6.2.3DNA分型数据完备性
DNA分型数据至少包含以下文件和相应的内容: a) 样本信息文件,应包含但不限于样本名称、样本类型和样本来源;
b) 分型关联信息文件,应包含但不限于测序仪器(编号、版本号)、测序芯片标识、测序文库标识、 DNA测序数据文件名称、DNA比对数据文件名称和DNA分型数据文件名称; C)1 DNA分型数据文件,应包含STR分型数据和SNP分型数据; d)1 DNA分型数据对应的MD5值。 以上文件应至少有一份备份。
DNA分型数据能够追溯对应DNA比对数据和DNA测序数据的样本信息和测序信息。样本信息 和测序信息包括但不限于样本名称、样本类型、测序仪(编号、版本号)、测序芯片编号、测序试剂编号、测 序文库标签等关联信息
DNA测序数据的可追溯信息应包含样本信息、测序信息及DNA测序数据信息。DNA测序数 追溯信息应与DNA样本的可追溯信息100%一致。
6.3.3DNA比对数据可追溯性
DNA比对数据的可追溯信息应包含样本信息、DNA测序数据信息及DNA比对数据信息。1 对数据可追溯信息应与DNA样本的可追溯信息100%一致。
6.3.4DNA分型数据可追溯性
DNA分型数据的可追溯信息应包含样本信息、DNA比对数据信息及DNA分型数据信息。DNA 分型数据可追溯信息应与DNA样本的可追溯信息100%一致。
DNA数据质量测试方法
DNA数据质量测试工具应满足以下要求: a) 可重复地获得高通量测序DNA数据质量的测试结果; b 1+ 详细记录DNA数据质量分析的信息,包括但不限于软件程序包、脚本、版本号、时间、命令行 和参数信息; C 查阅异常记录文档。
7.2.1DNA测序数据准确性测试
在以下测试条件下并使用以下测试方法对DNA测序数据进行准确性测试。 a) 测试条件: 1)使用符合YY/T1723一2020规定的高通量基因测序仪。 2)读长不低于50bp。 3)Q30不低于85%。 b)测试方法: 1)运行DNA数据质量测试工具,打开需要测试的DNA测序数据文件,检测并得到DNA测
7.2.2DNA比对数据准确性测试
在以下测试条件下并使用以下测试方法对DNA比对数据进行准确性测试 a) )测试条件: 1)读长不低于50bp。 2)目标区域的覆盖度不低于95%。 3)目标区域的平均测序深度不低于100倍。 b)测试方法: 1)运行DNA数据质量测试工具,打开需要测试的DNA比对数据文件,检测并得到DNA比 对数据中单个片段比对质量值MAPQ。和比对到参考序列的测序片段总数nR。 2)木 根据DNA比对数据中单个片段比对质量值,按照公式(3)计算每个片段的单测序片段比 对准确率:
R DNA比对数据中单个片段的单测序片段比对准确率; MAPQ一一DNA比对数据中单个片段比对质量值。 注:未比对到参考序列的读长不计算在内。 由DNA比对数据中单个片段比对质量值,根据公式(4)计算DNA比对数据准确率:
在以下测试条件下并使用以下测试方法对DNA分型数据进行准确性测试 a)测试条件: 1)目标区域的覆盖度不低于95%。 2)目标区域的深度不低于100倍。 b)测试方法:
、 运行DNA数据质量测试工具,打开需要测试的DNA分型数据文件,检测并得到DNA分 型数据中单个基因分型质量值GQ.和分型位点(基因座)总数nG。 根据DNA分型数据中单个基因分型质量值GQ.,按照公式(5)计算单个基因分型准 确率:
1n 一一DNA分型数据中单个基因分型准确率; GQ一一DNA分型数据中单个基因分型质量值。 3)由DNA分型数据中单个基因分型准确率,根据公式(6)计算DNA分型数据准确率:
应采用以下方式对DNA测序数据完备性进行测试: Ea) 1M7 检测是否包含样本信息文件,样本信息文件中是否包含对应的样本名称、样本类型; b) 检测是否包含测序关联信息文件,测序关联信息文件中是否包含测序仪器(编号、版本号)、测 序芯片标识、测序文库标识和DNA测序数据文件名称; 1MT 检测是否包含DNA测序数据文件; C· d) 检测是否具有DNA测序数据对应的MD5值; 检测以上文件是否具有备份文件
迳古潭二隧道隧道开挖施工方案7.3.2DNA比对数据完备性测试
应采用以下方式对DNA比对数据完备性进行测试: Aa) 检测是否包含样本信息文件,样本信息文件中是否包含对应的样本名称、样本类型; b) 检测是否包含比对关联信息文件,测序关联信息文件中是否包含测序仪器(编号、版本号)、测 序芯片标识、测序文库标识、DNA测序数据文件名称和DNA比对数据文件名称; c)检测是否包含DNA比对数据文件; d) 检测是否具有DNA比对数据对应的MD5值; e) 检测以上文件是否具有备份文件
7.3.3DNA分型数据完备性测试
应采用以下方式对DNA分型数据完备性进行测试: a) 检测是否包含样本信息文件,样本信息文件中是否包含对应的样本名称、样本类型; b)检测是否包含分型关联信息文件北京某地铁站空调水系统安全技术交底,分型关联信息文件中是否包含测序仪器(编号、版本号)、测 序芯片标识、测序文库标识、DNA测序数据文件名称、DNA比对数据文件名称和DNA分型 数据文件名称; c)检测是否包含DNA分型数据文件; d)检测是否具有DNA分型数据对应的MD5值;
e) 检测以上文件是否具有备份文件。
7.4DNA数据可溯性测试方法