電話:
021-67610176傳真:
屬于中國人自己*的基因“密碼”有望被破譯。近日,由哈爾濱工業(yè)大學(xué)牽頭的國家重點(diǎn)研發(fā)計(jì)劃醫(yī)學(xué)研究重點(diǎn)專項(xiàng)之“中國十萬人基因組計(jì)劃暨中國人群多組學(xué)參比數(shù)據(jù)庫與分析系統(tǒng)建設(shè)”項(xiàng)目正式啟動(dòng),并進(jìn)入為期4年的項(xiàng)目實(shí)施階段。
“這是我國科學(xué)家*自主實(shí)施的國ji*人類全基因組項(xiàng)目。”項(xiàng)目負(fù)責(zé)人、哈工大生物信息技術(shù)研究院院長王亞東在啟動(dòng)會(huì)上介紹,項(xiàng)目組將選取十萬中國自然人群作為研究對(duì)象,進(jìn)行基因組、暴露組、表型組等組學(xué)研究,揭示中國人群*基因組變異、變異頻率及其影響,zui終繪制完成屬于國人自己的基因組變異圖譜和多組學(xué)健康地圖。
“目前,我國在人類基因組研究方面的總體科學(xué)影響力,還不能認(rèn)為是達(dá)到了水平。” 中國科學(xué)院上海生命科學(xué)研究院生物醫(yī)學(xué)大數(shù)據(jù)中心科學(xué)家、中國科學(xué)院院士趙國屏評(píng)價(jià)道,“在組學(xué)研究進(jìn)入大數(shù)據(jù)時(shí)代這個(gè)關(guān)鍵時(shí)刻,結(jié)合醫(yī)療方向?qū)嵤?lsquo;中國人群多組學(xué)參比數(shù)據(jù)庫與分析系統(tǒng)建設(shè)’這一大研究計(jì)劃,輔以正在開展的大規(guī)模人群隊(duì)列研究和正在籌劃中的‘人類表型組’計(jì)劃,是我們實(shí)現(xiàn)‘彎道超車’的大好機(jī)遇。”
為什么要選定“十萬人”
人類基因組變異多數(shù)都是無害的,但也有些變異可導(dǎo)致疾病,如癌癥、心腦血管疾病、糖尿病等。中國十萬人基因組計(jì)劃就是要比較全面而地鑒定中國人的基因組變異及相關(guān)的其他組學(xué)(包括表型組)數(shù)據(jù),形成比較完善的基因組變異參比數(shù)據(jù)庫。這個(gè)基本數(shù)據(jù)基礎(chǔ),將大大促進(jìn)我國科學(xué)和醫(yī)學(xué)工作者,鑒定與不同人群表型(包括各種復(fù)雜疾?。┫嚓P(guān)的基因組變異,以利于疾病防治,保證全民健康。
“我國尚未建立高精度的中國人參考基因組,大量醫(yī)學(xué)前沿研究缺少參考數(shù)據(jù),已經(jīng)成為我國醫(yī)學(xué)發(fā)展的重大瓶頸問題。”王亞東坦言,啟動(dòng)中國十萬人基因組計(jì)劃就是瞄準(zhǔn)了這一瓶頸問題。
王亞東表示,該計(jì)劃將構(gòu)建世jie級(jí)精度中國人參考基因組和多組學(xué)參比數(shù)據(jù)庫,這是我國醫(yī)學(xué)發(fā)展的重要基礎(chǔ),將滿足醫(yī)學(xué)研究的關(guān)鍵共性需求,有助于挖掘健康和疾病的遺傳與環(huán)境風(fēng)險(xiǎn)因素的相關(guān)性、建立的疾病防治方案。
那么,為什么要選定十萬人作為參比人群?實(shí)際上,“研究環(huán)境和基因相互作用對(duì)健康的影響,研究腫瘤等重大疾病易感性的個(gè)體遺傳差異,罕見變異(頻率低于千分之五)可能是重要的研究對(duì)象。”王亞東在接受媒體采訪時(shí)指出,我國人口接近14億,遺傳結(jié)構(gòu)復(fù)雜,根據(jù)統(tǒng)計(jì)遺傳學(xué)理論,要達(dá)到本項(xiàng)目地鑒定罕見變異的目標(biāo),即變異檢測的精度達(dá)到萬分之一,十萬人只是一個(gè)zui小限度的基因組測序數(shù)量。
那這十萬人又是如何選取出來的呢?一方面是依托醫(yī)學(xué)研究專項(xiàng)等國家科研項(xiàng)目,從已有的研究隊(duì)列中選取樣本;另一方面,項(xiàng)目還將建立一個(gè)開放的平臺(tái),志愿者也可以參與其中。
為了保證樣本的全面性和多樣性,項(xiàng)目基本涵蓋了我國東北、西北、華北、華中、華東、華南、西南7大地區(qū)的漢族樣本。同時(shí),還選擇了包括藏族、蒙古族、壯族、回族、滿族等9個(gè)人口數(shù)量在500萬以上的少數(shù)民族群體,在接下來的項(xiàng)目推動(dòng)過程中,將逐步擴(kuò)展到56個(gè)民族。
實(shí)施過程將面臨重大挑戰(zhàn)
人類約有2.5萬個(gè)基因,要想把十萬人每個(gè)人體內(nèi)的基因密碼全部解開,面臨的首要挑戰(zhàn)就是十萬人基因組變異檢測的計(jì)算復(fù)雜性和質(zhì)量控制。
趙國屏對(duì)《中國科學(xué)報(bào)》記者解釋道,全基因組是指全部30億堿基長的人類基因組序列。只有通過包括全基因組測序又高于現(xiàn)在常用的二代測序的方法,才能夠發(fā)現(xiàn)基因組上的單核苷酸變異(SNV)、插入/缺失變異(INDEL)和結(jié)構(gòu)變異(SV)等所有基因組變異。
“在過去的基因組計(jì)劃,雖然GWAS(全基因組關(guān)聯(lián)分析)研究曾經(jīng)用到萬人以上的樣本,但全基因組測序的計(jì)劃從未有如此大的樣本。”趙國屏表示,該項(xiàng)目產(chǎn)生的數(shù)據(jù)規(guī)模巨大,數(shù)據(jù)總量可達(dá)到10PB,從基因組測序數(shù)據(jù)中檢測基因組變異的計(jì)算量巨大,可達(dá)到2000萬CPU小時(shí),需要建立的計(jì)算分析平臺(tái)完成所有數(shù)據(jù)分析工作。
除此之外,目前,上的基因組變異檢測方法準(zhǔn)確率較低,其中SNP準(zhǔn)確率低于99%,INDEL準(zhǔn)確率低于95%,SV準(zhǔn)確率低于90%。如何確保此次項(xiàng)目數(shù)據(jù)分析的準(zhǔn)確度也是一大難點(diǎn)。
“因此,我們需要建立的計(jì)算分析平臺(tái)完成所有數(shù)據(jù)分析工作,研發(fā)更高精度的基因組分析算法、軟件和工作流,以及基因組變異檢測的質(zhì)量控制體系,確保基因組變異檢測的準(zhǔn)確性。”王亞東說。
面對(duì)龐大數(shù)據(jù)算法方面的挑戰(zhàn),上海交通大學(xué)Bio-X研究院院長、中國科學(xué)院院士賀林則建議,除了算法改進(jìn)和計(jì)算機(jī)能力的更新,未來側(cè)重點(diǎn)還應(yīng)考慮放在對(duì)海量“垃圾”序列的劃界和處理上。
除此之外,賀林還對(duì)《中國科學(xué)報(bào)》記者指出,中國十萬人基因組計(jì)劃完成之后,立即面對(duì)的是如何解讀所得到的大量序列數(shù)據(jù)與健康和疾病之間的關(guān)系。建立遺傳咨詢行業(yè)被認(rèn)為是*出路,然而在我國的職業(yè)大典上,至今還找不到遺傳咨詢師這一職業(yè)。
集中力量實(shí)現(xiàn)“彎道超車”
繼成功繪制人類基因組測序“中國卷”和水稻基因組圖譜后,進(jìn)入本世紀(jì)以來,我國科學(xué)家繼續(xù)向著生命科學(xué)的深處進(jìn)軍,繼續(xù)參與了人類基因組新計(jì)劃HapMap計(jì)劃、腫瘤基因組計(jì)劃和千人基因組計(jì)劃,并且在成功完成HapMap計(jì)劃的基礎(chǔ)上,針對(duì)若干重大疾病,大規(guī)模地開展GWAS研究工作,獲得了可喜的成就。
據(jù)趙國屏介紹,在過去二十年里,利用人類基因組研究的技術(shù)與知識(shí),中國微生物(包括病毒)基因組研究進(jìn)展迅速,在傳染病防控的基礎(chǔ)研究與臨床應(yīng)用方面迅速走向前沿。另外,中國在干細(xì)胞、腫瘤防治、胎兒遺傳疾病早期檢測、慢性病代謝病防治方面的進(jìn)步也有目共睹,其中干細(xì)胞的研究已經(jīng)達(dá)到了前沿水平。但是,我國在基因組,特別是人類基因組研究方面的總體科學(xué)影響力,還達(dá)不到的水平。
趙國屏認(rèn)為,對(duì)基因組的研究,本質(zhì)上是對(duì)基因型的認(rèn)識(shí)。我們目前所使用的關(guān)于人類基因組的比較系統(tǒng)和可靠的基礎(chǔ)數(shù)據(jù),大部分是由以西方人群為主的研究項(xiàng)目所提供,這對(duì)于服務(wù)中國人的健康與醫(yī)藥事業(yè)是不適應(yīng)的。另一方面,以往項(xiàng)目對(duì)于相應(yīng)表型信息的采集,基本上是項(xiàng)目導(dǎo)向,比較分散難以整合,再加上其中亞洲人樣本有限,也更為開展基因型與表型的相關(guān)分析帶來了基礎(chǔ)性的問題。
“造成這個(gè)問題的根本原因就是我們?cè)谶^去二十年中,對(duì)于我們自己產(chǎn)生的基因組數(shù)據(jù)的整合、交互和共享沒有組織并實(shí)施持之以恒的大規(guī)模的工程性管理、支撐、服務(wù)、研究和開發(fā)工作。”趙國屏再次強(qiáng)調(diào)說。
而此次啟動(dòng)的中國十萬人基因組計(jì)劃正好給了我們“彎道超車”的大好機(jī)遇。中國人“多組學(xué)”相關(guān)項(xiàng)目的整合,為中國人類基因組研究走向工程化,為中國人類基因組數(shù)據(jù)能夠真正在整合與共享基礎(chǔ)上實(shí)現(xiàn)的挖掘與研發(fā)創(chuàng)造了條件。相信這個(gè)項(xiàng)目的扎實(shí)推進(jìn),一定能為我國健康事業(yè)和生命科學(xué)研究事業(yè)作出根本性的貢獻(xiàn)。
據(jù)悉,該項(xiàng)目設(shè)立五個(gè)課題,分別由哈爾濱工業(yè)大學(xué)、復(fù)旦大學(xué)、中國科學(xué)院北京基因組研究所、華中科技大學(xué)、中國科學(xué)院上海生命科學(xué)研究院等五個(gè)科研單位,將有20個(gè)大學(xué)、科研院所和企業(yè)的166位專家學(xué)者參與到項(xiàng)目中。
“現(xiàn)在我國測序設(shè)計(jì)和分析能力是有的,但力量卻是分散的,這次項(xiàng)目是一個(gè)機(jī)會(huì),希望能夠把力量集中起來?,F(xiàn)在,在籌備的過程中,也看到了這方面希望。”趙國屏說。(生物谷Bioon.com)