研究人员对117份男性样本(来自114个缅甸人和3个尼日利亚人)dna芯片数据中的2041个y-snps进行了评估分析。利用gwas构建y染色体单倍型类群树,从而解析出缅甸人群的父系遗传结构。
随着全基因组关联分析(genome-wide association analysis,gwas)广泛应用于人类遗传学工作之中,相关的dna芯片(微阵列)也不断得到发展。许多y染色体单核苷酸多态性位点(y-snps)已被整合在dna芯片中。然而,这些y-snps数据在gwas中都被弃之不顾,未进行任何评估分析。
针对这个问题,研究人员开发出针对dna芯片数据中y-snps的分析策略。
运用该策略,研究人员对117份男性样本(来自114个缅甸人和3个尼日利亚人)dna芯片数据中的2041个y-snps进行了评估分析。基于数据过滤后提取出的369个y-snps,研究人员构建了y染色体单倍型类群树(y chromosomal haplogroup tree),从而解析出缅甸人群的父系遗传结构。该结果得到基因分型实验和y染色体重测序数据的支持,表明该策略切实可行。
对于分析中的数据格式转换、过滤以及注释,研究人员开发了免费软件ytool。结合对hapmap中ceu人群数据的分析结果,研究人员发现dna芯片对y-snps的检测灵敏度和准确性依旧有待提高,例如芯片厂商可依据y染色体重测序数据重新选择合适的y-snps并设计相关探针。