标准规范下载简介
GA/T 1694-2020 序列多态STR等位基因命名规则.pdfGA/T 16942020
态 STR 等位基因命名
中华人民共和国公安部 发布
GA/T 16942020目次前言引言.1范围,2规范性引用文件3术语和定义4缩略语..5命名原则6命名规则附录A(规范性附录)法庭科学STR基因座序列信息参考文献14
CJJT 301-2020标准下载GA/T16942020
本标准按照GB/T1.1一2009给出的规则起草。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别这些专利的责任。 本标准由全国刑事技术标准化技术委员会法医检验分技术委员会(SAC/TC179/SC6)提出并归口。 本标准起草单位:公安部物证鉴定中心、四川大学、广州市公安局、辽宁省公安厅、北京市公安局, 北京爱普益生物科技有限公司。 本标准主要起草人:季安全、叶健、王乐、康克莱、王正、刘超、刘锋、焦章平、张驰、周骋。
GA/T16942020
STR遗传标记广泛应用于法庭科学、医疗诊断以及人类学研究。本标准面向STR的应用需求,制 的序列多态STR等位基因命名规则,提高STR的应用价值
本标准规定了人类序列多态STR等位基因命名规则。 本标准适用于所有从事STR测序的DNA实验室和产品制造商
GA/T16942020
序列多态STR等位基因命名规则
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB/T37226一2018法庭科学人类荧光标记STR复合扩增检测试剂质量基本要求 GA/T383一2014法庭科学DNA实验室检验规范
下列术语和定义适用于本文件
下列术语和定义适用于本文件
3.1 基因座locus 染色体上基因所占的位置或基因组DNA中的一段。 [GB/T37226—2018,定义2.2] 3.2 等位基因allele 位于一对同源染色体的相同位置上控制同一性状的不同形式的基因。 3.3 基因型 genotype 个体一个或多个基因座上等位基因的组合,是生物体可见性状的实际基因组成。 3.4 短串联重复序列shorttandemrepeat 一类广泛存在于真核生物基因组中的DNA串联重复序列。其重复单位通常由2~6个碱基构成, 重复次数通常在5~60次。
单核苷酸多态性singlenucleotidepolymorphism 在人类基因组范围内,任何单碱基突变使特异核苷酸位置上出现两种或两种以上碱基,其中 种在群体中的频率不少于1%,所形成的多态性遗传标记
GA/T16942020
下列缩略语适用于本文件。 DNA:脱氧核糖核酸(DeoxyribonucleicAcid) SNP:单核苷酸多态性(SingleNucleotidePolymorphism) STR:短串联重复序列(ShortTandemRepeat)
5.1以GRCh38作为比对参考序列,以其正向序列作为STR序列比对依据,进行序列比对、定义重复 结构、定位SNP。 5.2定义STR重复区的起始位置、终止位置和重复结构见附录A,起始和终止位置是以参考序列描 述的,不因碱基插入或缺失而改变。 5.3命名规则应具备基因座可拓展性, 5.4若发现新的STR等位基因,应可依据本命名规则进行系统性唯一命名。 5.5充分利用STR序列多态信息。
微,进片X 正文里友 结构、定位SNP。 5.2定义STR重复区的起始位置、终止位置和重复结构见附录A,起始和终止位置是以参考序列描 述的,不因碱基插入或缺失而改变 5.3命名规则应具备基因座可拓展性, 5.4若发现新的STR等位基因,应可依据本命名规则进行系统性唯一命名。 5.5充分利用STR序列多态信息。
GA/T1694—20206命名规则6.1命名通式按照以下通式结构进行命名,命名细则按照6.2的规定执行。×(×/X/...)[××]:× ×一重复区序列中非重复单位的碱基变异信息侧翼序列的碱基变异信息重复区序列信息等位基因的长度多态分型,用阿拉伯数字表示6.2命名细则及示例6.2.1重复结构中仅包含单一重复单位的基因座,用重复单位数目命名该等位基因。示例:TPOX基因座重复结构为[AATG],该基因座某等位基因重复区序列为[AATG]s,侧翼序列与参考序列完全相同,则该等位基因命名为8。6.2.2重复结构中包含N(N>1)个重复单位的基因座,等位基因命名为:重复单位总数目(第一个重复单位数目/第二个重复单位数目../第N个重复单位数目)。示例1:D2S1338基因座重复结构为[GGAA][GGCA]b,该基因座某等位基因重复区序列为[GGAA]6[GGCA]11,侧翼序列与参考序列完全相同,则该等位基因命名为17(6/11)。示例2:D12S391基因座重复结构为[AGAT][AGAC]b[AGAT]e,该基因座某等位基因重复区序列[AGAT]n[AGAC],侧翼序列与参考序列完全相同,则该等位基因命名为18(11/7/0)。示例3:D21S11 基因座重复结构为[TCTA][TCTG][TCTA]TA[TCTA]aTCA[TCTA]TCCATA[TCTA]r,该基因座某等位基因重复区序列为[TCTA]6[TCTG]s[TCTA]TA[TCTA]3TCA[TCTA]2TCCATA[TCTA]7,侧翼序列与参考序列完全相同,则该等位基因命名为26(6/5/3/3/2/7)。6.2.3当等位基因的重复区序列中的重复单位存在插入序列时,将该插入序列以大写英文字母形式插入等位基因名称的相应位置,并以“+”连接该插入序列和前后序列。在确定插入的序列和位置时,应依次优先考虑插入序列的碱基个数最少和插入位置最靠近序列5端的情况示例1:TH01基因座重复结构为[AATG]a,该基因座某等位基因重复区序列为[AATG]6ATG[AATG]3,侧翼序列与参考序列完全相同,则该等位基因命名为9.3(6+ATG+3)。示例2:D6S1043基因座重复结构为[ATCT]a,该基因座某等位基因重复区序列为[ATCT]5ATGT[ATCT]10,侧翼序列与参考序列完全相同,则该等位基因命名为16(5+ATGT+10)。示例3:VWA基因座重复结构为[TAGA][CAGA]TAGA,该基因座某等位基因重复区序列为[TAGA]3TGGA[TAGA][CAGA]4TAGACAGATAGA,侧翼序列与参考序列完全相同,则该等位基因命名为14(3+TGGA+3/4+TAGA+1)。(该序列可能的序列插入方式如图1所示,根据上述优先规则,确定方式一作为唯一序列插入方式而进行相应命名)重复结构:[TAGA]a[CAGA],TAGA序列插入方式一:[TAGA];TGGA[TAGA];[CAGA],TAGA[CAGA]TAGA序列插入方式二:[TAGA],TGGA[TAGA];[CAGA]TAGACAGA;TAGA序列插入方式三:[TAGA];TGGA[TAGA];[CAGA]4TAGACAGATAGA图1VWA基因座序列插入方式示意图(粗体标示的序列即不同方式插入序列)
GBT51242-2017 同步数字体系(SDH)光纤传输系统工程设计规范.pdfGA/T16942020
5.2.5当插入序列位于重复区序列与侧翼序列之间时,规定该插入序列计入重复区,按照6.2.3进
示例1:D7S820基因座重复结构为[TATC]a,该基因座某等位基因重复区序列为[TATC]9,且在重复区序列与上游 侧翼序列之间存在单碱基A插入,则将该插入计入重复区序列,该等位基因命名为9.1(A+9)。 示例2:D2S441基因座重复结构为[TCTA]a,该基因座某等位基因重复区序列为[TCTA]1oTTTA[TCTA]2,且在重复 区序列与上游侧翼序列之间存在单碱基A插入,则将该插入计入重复区序列,该等位基因命名为13.1(A+10+TTTA+2)。 6.2.6(本条细则所适用的序列在实际人群中出现的概率很低)当等位基因的重复区序列中非重复 单位存在碱基替换、插入、缺失时,在碱基替换、插入、缺失发生位置的前一个重复单位数目后以星 号“*”表示,并在命名通式的重复区序列中非重复单位的碱基变异信息部分补充说明碱基替换、插 入、缺失处的完整序列信息,以冒号“:”起始。以下划线“”标示替换的碱基,以“+”连接插入 减基和前后序列,以删除线标示缺失的碱基。如果多处序列存在碱基替换、插入、缺失,分别在相应
V2 CCTTJ14CCTACCTTTTCCTT,即第二段非重复单位序列存在2个碱基缺失,侧翼序列与参考序列完全相同,则该等 立基因命名为15.2(14/1*/1):CTTT。 示例3:D21S11 基因座重复结构为[TCTA],[TCTG][TCTA]TA[TCTA]aTCA[TCTA]TCCATA[TCTA],该基因座 某等位基因重复区序列为[TCTA]g[TCTG]12[TCTA]3TCA[TCTA]2TCCATA[TCTA]13,即第一段非重复单位序列存在2个 碱基的缺失,侧翼序列与参考序列完全相同,则该等位基因命名为38.2(9/12/3*/0/2/13):TA 示例4:D21S11基因座重复结构为[TCTA][TCTG][TCTA]。TA[TCTA]aTCA[TCTA]。TCCATA[TCTA],该基因座 某等位基因重复区序列为[TCTA]6[TCTG]s[TCTA]3TA[TCTA]3TCA[TCTA]2TCCATT[TCTA](该序列为虚构示例),即 主第三段非重复单位序列存在碱基替换,侧冀序列与参考序列完全相同,则该等位基因命名为26(6/5/3/3/2*/7):TCCAT 示例5:D21S11基因座重复结构为[TCTA][TCTG][TCTA]。TA[TCTA]aTCA[TCTA]。TCCATA[TCTA]r,该基因座 某等位基因重复区序列为[TCTA][TCTG]s[TCTA]3ATA[TCTA]3TCA[TCTA]2TCCATT[TCTA]>(该序列为虚构示例),即 在第一段非重复单位序列存在单碱基插入,第三段非重复单位序列存在碱基替换,侧翼序列与参考序列完全相同,则 该等位基因命名为26.1(6/5/3*/3/2*/7):A+TA.TCCATT。
法庭科学STR基因座序列信息见表A.1。
GA/T16942020
表A.1法庭科学STR基因座序列信息
GA/T16942020
YD/T 901-2018标准下载GA/T16942020