广泛使用的人类参考基因组缺失3亿个DNA

过去的17年间,单个个体的基因组DNA信息一直作为“基线”来比对遗传突变,但人类的DNA比我们原先想象的要多得多。科学家们发现,基础参考基因组中缺少了大约3亿个DNA,910名非洲人后裔的集体基因组,出现与参考基因组很大不匹配。

搜狗截图18年11月24日1550_2.png

人体遗传变异

精确的研究需要来自不同人群的其它参考基因组,科学家需要建立更多参考基因组来反映不同的种群。

世界参考基因组是由少数匿名志愿者的核酸序列组装而成,70%来自半欧洲半非洲的个体。当一个特定的DNA分析与参考文献不匹配时,序列也许会被扔掉,但丢弃的DNA可能会有你需要的答案和线索。

最新研究结果强调创建人类基因组全面和包容性的重要性,更全面的人类基因组可能会让我们更好地了解不同人群的疾病风险变化。

更多种群的参考基因组

之前寻找参考基因组与个体之间的微小差异,有时只是DNA中化学碱基对的单一变化,被称为单核苷酸多态性SNP。SNP有助于确定个体的血统,但对可能导致常见病症和疾病的遗传变异,却不能确定,因为可能是基因组较大部分变异造成。

最新研究中分析910人的DNA序列,寻找至少1000个碱基对中的DNA片段,都与参考基因组不匹配,这些使个体独特了起来。他们组装序列,寻找重叠和冗余,短于1,000个碱基对的序列筛选出来,以及可能与人类中都存在的细菌相关DNA。

然后,他们将所有910个个体的组装序列与标准参考基因组进行比较,这样,研究人员发现了3亿个碱基对DNA,这大约是整个人类基因组估计大小的10%。其中,最大的独特DNA长度为152,000个碱基对,但大多数DNA长约1,000-5,000碱基对。序列中一小部分可能与编码蛋白质或其他细胞功能的基因重叠,但研究人员没有找到每个序列的功能。

搜索框传播样式-标准色版.png