一群年輕人撰寫(xiě)了“基因組字典”,為我們的醫(yī)療發(fā)展作出了杰出貢獻(xiàn)

基因測(cè)序在現(xiàn)在遺傳病學(xué)上起到了關(guān)鍵的作用,可以幫我們及時(shí)的規(guī)避風(fēng)險(xiǎn),基因測(cè)序技術(shù)的成熟與這群年輕人的“事業(yè)”有很大關(guān)系!是他們的不懈努力才有了今天的”基因組字典“

在光谷,希望組公司是國(guó)內(nèi)首家提供三代測(cè)序服務(wù)的公司,已為數(shù)千個(gè)物種繪制基因組圖譜,成果用于科學(xué)研究、分子育種、疾病診療等各個(gè)領(lǐng)域。

“我們的下游客戶想知道哪一段基因起到何種作用,而我們把整個(gè)基因組圖譜都測(cè)定出來(lái)了。相當(dāng)于他們只想認(rèn)識(shí)一兩個(gè)字句,而我們編制了整本字典。”武漢希望組總經(jīng)理梁帆介紹。

這家企業(yè)由一群懷揣夢(mèng)想的年輕人創(chuàng)立,創(chuàng)始人汪德鵬畢業(yè)于北京大學(xué)生命科學(xué)學(xué)院,2011年以4萬(wàn)元起家,在武漢與幾位華科、華農(nóng)畢業(yè)生一起創(chuàng)業(yè)。

如今,企業(yè)已發(fā)展至260多人,一半以上是技術(shù)人員,并將事業(yè)版圖擴(kuò)展至北京,先后獲得了經(jīng)緯中國(guó)、賽富投資、遠(yuǎn)毅資本、昌發(fā)展、京銘資本等國(guó)內(nèi)知名投資機(jī)構(gòu)投資。

01

光谷,花山,武漢軟件新城,希望組公司的辦公室占了三層樓。除了大部分生物醫(yī)藥公司都擁有的裝滿各類試管、試劑的實(shí)驗(yàn)室外,這家企業(yè)還擁有一個(gè)IT公司才有的巨大機(jī)房。

“這個(gè)房間里有50多臺(tái)服務(wù)器,每一臺(tái)都有32核CPU、256G內(nèi)存。相比于普通辦公用電腦,性能不是一般的強(qiáng)大。就這樣,我們的算力還是遠(yuǎn)遠(yuǎn)不夠,需要通過(guò)專線,把數(shù)據(jù)傳到華為云上進(jìn)行計(jì)算。有一次,我們組裝一個(gè)基因組,把一臺(tái)內(nèi)存30T的服務(wù)器給跑爆了。”

首席生信技術(shù)官胡江介紹,生物基因組的信息量是十分龐大的。人類基因組單倍DNA數(shù)據(jù)量約為3.1Gb,23對(duì)染色體雙螺旋DNA就是6.2Gb。到目前為止,動(dòng)物界已知最大的基因組是肺魚(yú)類,其中相對(duì)較小的非洲肺魚(yú),就有40多Gb,是人類基因組大小的15倍左右,為了解決這樣的世界級(jí)難題,企業(yè)專門(mén)開(kāi)發(fā)了組裝軟件NextDenovo,成果發(fā)表在國(guó)際頂級(jí)科學(xué)雜志Cell的封面。

基因測(cè)序行業(yè)是一個(gè)典型的BT(生物技術(shù))+IT(信息技術(shù))產(chǎn)業(yè)。在此過(guò)程中,測(cè)序儀對(duì)一個(gè)個(gè)基因片段進(jìn)行測(cè)定,一臺(tái)測(cè)序儀兩天就可以產(chǎn)生100多T的數(shù)據(jù)。完成后,研究人員再使用算法和高性能計(jì)算機(jī),將片段組裝成完整的基因圖譜。

相比第二代測(cè)序技術(shù),第三代技術(shù)可讀取的片段更長(zhǎng),可大幅減少后續(xù)基因組拼接和注釋的工作難度,且經(jīng)過(guò)修正的精度可達(dá)到99.9%以上。“理論上所有使用二代測(cè)序技術(shù)測(cè)序過(guò)的基因組,都可以使用第三代技術(shù)再來(lái)一遍,結(jié)果將更加完整、準(zhǔn)確。”

希望組團(tuán)隊(duì)在超高分子量樣品制備、長(zhǎng)讀長(zhǎng)序列分析算法開(kāi)發(fā)等方面,具有獨(dú)特技術(shù)優(yōu)勢(shì)。胡江開(kāi)發(fā)的NextDenovo等系列基因組組裝軟件,國(guó)內(nèi)外很多測(cè)序公司及科研機(jī)構(gòu)都在使用。

“在我們剛剛創(chuàng)業(yè)的時(shí)候,第三代測(cè)序還未興起,存在測(cè)序成本高、單次讀序錯(cuò)誤率高等問(wèn)題,備受挑戰(zhàn)和質(zhì)疑。”但希望組團(tuán)隊(duì)毅然堅(jiān)持探索,如今已成長(zhǎng)為世界領(lǐng)先的三代測(cè)序基因組公司。

02

在希望組公司展廳內(nèi)有一面墻,上面掛滿了使用該公司測(cè)序成果產(chǎn)生的科研文章,發(fā)表在《Nature》《Science》《Cell》等眾多國(guó)際頂級(jí)期刊上,有的成果甚至已經(jīng)寫(xiě)入教科書(shū)。

比如,蘋(píng)果皮為什么能進(jìn)化出誘人的紅色?在希望組團(tuán)隊(duì)在給蘋(píng)果基因測(cè)序時(shí),就與合作者發(fā)現(xiàn)了一個(gè)Gypsy-like反轉(zhuǎn)座子充當(dāng)增強(qiáng)子控制著蘋(píng)果著色,基于這個(gè)結(jié)果,育種科學(xué)家在蘋(píng)果種子階段,就能精準(zhǔn)的進(jìn)行果色預(yù)先選擇,節(jié)省大量育種時(shí)間。

短串聯(lián)重復(fù)序列(STR)占人類基因組序列的7%,目前人類已知有50多種神經(jīng)和神經(jīng)肌肉疾病是由STR擴(kuò)增引起的,包括亨廷頓病、強(qiáng)直性肌營(yíng)養(yǎng)不良、運(yùn)動(dòng)神經(jīng)元病等。其中,有約5種疾病的致病變異是由希望組與合作單位聯(lián)合發(fā)現(xiàn),占全球該領(lǐng)域10%,公司甚至立下目標(biāo),要在接下來(lái)幾年之內(nèi),發(fā)現(xiàn)全球一半的“重復(fù)擴(kuò)張癥“新基因。

目前,三代測(cè)序全基因組檢測(cè)的成本已經(jīng)可以控制在萬(wàn)元以內(nèi),1周內(nèi)就能出報(bào)告,很快就能成為遺傳病檢測(cè)的重要手段。

最近,該公司正在測(cè)定一些水稻的泛基因組,共測(cè)定了兩三百種水稻,希望定位一些抗旱、抗淹方面的基因。未來(lái),還可以擴(kuò)展到大麥、燕麥、西瓜等物種上。

“我們不育種,也不治病,但我們?yōu)樗麄兲峁┩暾?lsquo;百科全書(shū)’。對(duì)我們來(lái)說(shuō),每一個(gè)項(xiàng)目,都是探索全新的未知領(lǐng)域。”

通過(guò)自己的努力,組建一個(gè)260多人的團(tuán)隊(duì),從事基因測(cè)序,還撰寫(xiě)了”基因組字典“真的很酷,據(jù)說(shuō)他們的公司要上市了,真的為這群有志青年感到驕傲和自豪!

免責(zé)聲明:市場(chǎng)有風(fēng)險(xiǎn),選擇需謹(jǐn)慎!此文僅供參考,不作買(mǎi)賣(mài)依據(jù)。

關(guān)鍵詞:
圖片版權(quán)歸原作者所有,如有侵權(quán)請(qǐng)聯(lián)系我們,我們立刻刪除。
新化月報(bào)網(wǎng)報(bào)料熱線:886 2395@qq.com

相關(guān)文章

你可能會(huì)喜歡

最近更新

推薦閱讀