迄今為止最全面的人類蛋白質編碼區(qū)遺傳變異記

 行業(yè)動態(tài)     |      2020-04-06 21:15

一項關于人類基因組外顯子組(蛋白質編碼區(qū))的深度分析提供了迄今為止有關該區(qū)域最全面的遺傳變異記錄。登上本周《自然》雜志封面的研究 Analysis of protein-coding genetic variation in 60,706 humans 被認為有助于從臨床發(fā)現與人類疾病相關的遺傳變異。

來自哈佛-麻省理工博德研究所,參與人類外顯子組整合數據庫(ExAC)項目的 Daniel MacArthur 及同事分析了來自60,706位被試者的外顯子組測序數據,這些被試者來自于不同的地理人口系譜,包括歐洲、非洲、南亞、東亞和拉美人口。他們發(fā)現了約740萬個遺傳子多態(tài)(genetic variants),對于人類低頻蛋白質編碼多態(tài)的分析,其分辨率達到前所未有的程度。

作者通過分析該數據集來表征全球遺傳變異的模式,在較小的遺傳變異數據集上達到了此前無法實現的分辨率。遺傳變異密度令研究人員得以在同一位點分辨多重序列多態(tài)(多等位基因多態(tài)),而數據集的規(guī)模則令研究人員得以首次獲得一些有關復發(fā)突變的發(fā)現,復發(fā)突變指的是罕見突變在各人口歷史中獨立發(fā)生。

ExAC提供了一個可公開獲取的參照數據庫,事實已經證明這是一個有用的臨床工具,可用于評估潛在的孟德爾遺傳?。▎位虿。┑闹虏』蚨鄳B(tài),其中一些多態(tài)在人口中的普遍程度令人難以置信。作者分析了過往研究所報告的192個此類多態(tài),結果發(fā)現僅9個有充足的數據表明其與疾病相關。

在另外一篇發(fā)表在Genetics in Medicine的論文 Reassessment of Mendelian gene pathogenicity using 7,855 cardiomyopathy cases and 60,706 reference samples 中,倫敦帝國理工學院的Roddy Walsh 及同事評估了最常見的嚴重的孟德爾病之一 — 心肌癥(心肌疾?。┑倪z傳變異情況。他們的發(fā)現表明,此前認為與特定心肌癥相關的許多基因和基因多態(tài)可能并沒有真的關系,不過現在利用ExAC可以顯著改進對基因變體的解讀。

在發(fā)表在Nature Genetics上的另外一篇論文 Patterns of genic intolerance of rare copy number variation in 59,898 human exomes中,西奈山伊坎醫(yī)學院的 Douglas Ruderfer 及同事分析了ExAC數據集內罕見的拷貝數變異(一種基因組結構變異)。

一直有研究設法記錄外顯子組內的遺傳變異,而ExAC是其中規(guī)模最大最全面的一個項目。在伴隨的新聞與觀點版塊中,西雅圖華盛頓大學的 Jay Shendure 總結說:“ExAC既是一項技術成就,也是一項政治成就,不僅有數據爭議,也有研究者、審批許可和14余項研究的角力 — 主要針對的是各種常見疾病的遺傳問題。”