近日,華大智造美洲營(yíng)銷中心總監(jiān)譚宏?yáng)|博士就測(cè)序技術(shù)發(fā)展、大人群測(cè)序等問題接受采訪。譚宏?yáng)|博士深耕測(cè)序領(lǐng)域多年,對(duì)測(cè)序技術(shù)的研發(fā)和應(yīng)用有著豐富經(jīng)驗(yàn)。對(duì)于測(cè)序領(lǐng)域,他有很多的觀點(diǎn)和心得。
前瞻觀點(diǎn)
1、測(cè)序應(yīng)用的發(fā)展一定程度上依賴于芯片技術(shù)的發(fā)展。
2、展望未來,光學(xué)和化學(xué)兩個(gè)方向?qū)⑹菧y(cè)序技術(shù)發(fā)展的重點(diǎn)。
3、解讀人類基因,探索復(fù)雜疾病,需要對(duì)大人群進(jìn)行大規(guī)模測(cè)序,而最大的人群,就是全人類。
Q: 測(cè)序技術(shù)發(fā)展日新月異,能否介紹一下近年來我們?nèi)〉昧四男┓矫娴倪M(jìn)展?
A: 在過去幾年中,高通量大規(guī)模平行測(cè)序的技術(shù)發(fā)展迅猛,以華大智造為代表的DNBSEQ測(cè)序技術(shù)尤其突出?;仡欉@幾年,我們的技術(shù)進(jìn)展主要體現(xiàn)在檢測(cè)方法學(xué)、文庫(kù)制備方法學(xué)、大規(guī)模平行芯片的制作技術(shù),以及對(duì)數(shù)據(jù)質(zhì)量的認(rèn)識(shí)等方面。
Q: 高質(zhì)量的文庫(kù)制備是精準(zhǔn)測(cè)序的前提,如何才能獲得更高質(zhì)量的測(cè)序文庫(kù)呢?
A: 測(cè)序文庫(kù)或者是DNA文庫(kù)的制備方法有兩個(gè)比較新的發(fā)展。
一個(gè)是我們希望整個(gè)測(cè)試過程中盡量保持原來DNA樣本的狀態(tài),即通過高保真的、沒有復(fù)制錯(cuò)誤的流程來制備文庫(kù),真實(shí)的基因組信息才能夠被保留下來。
另一個(gè)是我們的測(cè)序技術(shù)使用線性擴(kuò)增,是極少有擴(kuò)增錯(cuò)誤的,加上沒有PCR的文庫(kù)制備方法,這樣檢測(cè)出來的基因組,我們就可以稱之為真實(shí)的基因組。
無PCR的文庫(kù)制備方法加上無PCR的檢測(cè)方法,是我們新的技術(shù)進(jìn)步。我們開發(fā)的無PCR的文庫(kù)產(chǎn)品有諸多優(yōu)勢(shì),包括低起始量、長(zhǎng)讀長(zhǎng)、支持多種樣本等,其中一個(gè)突出的特點(diǎn)是,相比PCR文庫(kù),用PCR Free文庫(kù)對(duì)于檢測(cè)高GC區(qū)域有更好的準(zhǔn)確性,可以形成非常長(zhǎng)的重疊群,不再依賴測(cè)序樣本中的GC含量。
另一項(xiàng)快速發(fā)展的技術(shù)是我們新開發(fā)的stLFR單管長(zhǎng)片段讀取技術(shù)。stLFR的主要原理是一個(gè)雙barcode、雙標(biāo)識(shí)的標(biāo)記過程。我們知道人體有兩個(gè)基因組,一個(gè)是從母親來的,一個(gè)是從父親來的。我們希望把這兩個(gè)基因組都進(jìn)行標(biāo)識(shí),最好在同一個(gè)管中進(jìn)行測(cè)序,這樣我們才能夠讀到比較長(zhǎng)的片段。
每個(gè)長(zhǎng)片段在每個(gè)beads上都會(huì)有共同的barcode,我們只要識(shí)別這個(gè)barcode就能識(shí)別出這些短片段是否同屬于一個(gè)長(zhǎng)片段。通過短片段測(cè)序、組裝和兩個(gè)barcode識(shí)別的方法,就能獲得長(zhǎng)片段。
這些片段最長(zhǎng)可以檢測(cè)到約300K,大部分片段是在60K左右。這項(xiàng)技術(shù)一個(gè)很好的應(yīng)用就是我們可以檢測(cè)到大的、長(zhǎng)的缺失。我們可以通過單管長(zhǎng)片段的形式,檢測(cè)我們體內(nèi)DNA的單倍體的 “相”(Phasing)的情況,即這個(gè)片段是來自于母親還是來自于父親。
我們分別將PCR-free和stLFR做出來的基因組叫做真實(shí)基因組和完美基因組,這些技術(shù)使我們的測(cè)序儀不僅可以檢測(cè)長(zhǎng)片段,而且可以保證測(cè)序的基因組非常準(zhǔn)確。我們現(xiàn)在將這些技術(shù)集成在一同個(gè)測(cè)序儀、同一個(gè)測(cè)序反應(yīng)里面,從而在一體機(jī)器上實(shí)現(xiàn)多種應(yīng)用。
Q: 隨著各種測(cè)序應(yīng)用的普及,提升測(cè)序通量的需求也越來越緊迫,您覺得當(dāng)面我們?nèi)〉昧四男┩黄疲磥頊y(cè)序技術(shù)又會(huì)朝什么方向發(fā)展?
A: 各種測(cè)序應(yīng)用的發(fā)展都有賴于芯片技術(shù)的發(fā)展,要想實(shí)現(xiàn)大規(guī)模的測(cè)序,我們一定要有比較大的芯片,目前我們最有代表性的就是DNBSEQ-T7測(cè)序儀使用的芯片,每張芯片可以實(shí)現(xiàn)5個(gè)G的reads,每張芯片上有50億個(gè)位點(diǎn)可讀出的位點(diǎn)。
展望未來,測(cè)序技術(shù)會(huì)沿著兩個(gè)方向發(fā)展:
一是光學(xué)方法,通過提高光學(xué)檢測(cè)系統(tǒng)的性能,光學(xué)系統(tǒng)能檢測(cè)的載片pitch(即修飾位點(diǎn)之間的間距)越來越小。如果將目前載片上700納米的pitch,縮小到500納米,那么5Gb的reads就會(huì)變成8Gb。
二是化學(xué)方法,目前我們能做到一臺(tái)機(jī)器通量在6T左右,將來如果可以做到PE300、PE600,就可能實(shí)現(xiàn)20T、40T的通量。
Q: 您前面提到了我們對(duì)數(shù)據(jù)質(zhì)量有了新的認(rèn)識(shí),能否談一談華大智造新發(fā)布的“676”標(biāo)準(zhǔn)?
A: “676”標(biāo)準(zhǔn),是我們?cè)谛碌募夹g(shù)條件下提出的,定義高精度基因組的新標(biāo)準(zhǔn)。即從頭組裝產(chǎn)生一個(gè)基因組的質(zhì)量,應(yīng)該滿足下面這些條件:
在測(cè)序深度為50X左右,且沒有dup或者很少重復(fù)序列的情況下,Contig(重疊群)N50長(zhǎng)度大于100萬(106),scaffold(重疊群形成的支架)N50 長(zhǎng)度大于1000萬(107),每次組裝的單倍體需要達(dá)到6個(gè)G,測(cè)序質(zhì)量達(dá)到Q50。這就是我們的高精度的基因組的標(biāo)準(zhǔn)。
這里需要區(qū)分一下重測(cè)序和從頭組裝測(cè)序。重測(cè)序是指,我們測(cè)序獲得了大量短片段之后,我們拿這些短片段和一個(gè)已知的基因組進(jìn)行比較,就是屬于重測(cè)序。而從頭組裝測(cè)序(denovo組裝)是指我們并不與某個(gè)已知的基因組進(jìn)行對(duì)照,而是直接將拿到手的數(shù)據(jù)進(jìn)行組裝,這個(gè)就叫做從頭組裝。從頭組裝的測(cè)序可以告訴我們每一個(gè)基因真實(shí)的情況。
我們用這項(xiàng)技術(shù)從頭組裝測(cè)序了六種植物和兩種動(dòng)物的數(shù)據(jù),實(shí)驗(yàn)表明, 從頭組裝與常用的組裝產(chǎn)出的數(shù)據(jù)非常相似,并且表現(xiàn)更好一些。此外我們還從頭組裝了二十多種海洋魚類的基因組,證明該技術(shù)的表現(xiàn)非常令人滿意。
在華大智造,我們一直有一個(gè)信念,人重測(cè)序不是我們的目標(biāo),從頭組裝的完美基因組測(cè)序才是我們追求的目標(biāo),現(xiàn)在,DNBSEQ-T7測(cè)序儀能夠用1000美元實(shí)現(xiàn)一個(gè)符合“676”標(biāo)準(zhǔn)的基因組測(cè)序,未來,每一個(gè)人都有擁有獨(dú)特的,從頭組裝的完美基因組。
Q: 近年來英國(guó)、中國(guó)、美國(guó)等國(guó)都發(fā)起了大人群測(cè)序計(jì)劃,大人群測(cè)序是否已經(jīng)成為一個(gè)趨勢(shì)?未來又要朝著怎樣的方向發(fā)展?
A: 解讀人類基因,探索復(fù)雜疾病,需要對(duì)大人群進(jìn)行大規(guī)模測(cè)序,而最大的人群,就是全人類。
全人類大約80億人,按照“676”高精度基因組的標(biāo)準(zhǔn),如果我們想要在50年內(nèi)對(duì)全人類進(jìn)行測(cè)序,需要的測(cè)序通量要達(dá)到每年測(cè)序2.4億人。實(shí)現(xiàn)這樣的目標(biāo)也不是不可能,如果地球上有1000個(gè)測(cè)序?qū)嶒?yàn)室,每個(gè)實(shí)驗(yàn)室每天測(cè)序1000個(gè)人,就可以實(shí)現(xiàn)這樣的目標(biāo)。
人類為了交通,建造了公路鐵路和橋梁和機(jī)場(chǎng),讓我們暢行無阻;我們?yōu)榱顺缘煤?,建造了?shù)不勝數(shù)的農(nóng)場(chǎng)、養(yǎng)殖場(chǎng)和餐館;我們?yōu)榱爽F(xiàn)代化的生活和工作,建造了大型商場(chǎng)、建造了摩天大樓,能容納幾萬人在里面。
那么,我為什么不建造更多的實(shí)驗(yàn)室來檢測(cè)我們每個(gè)人的基因,使得我們每個(gè)人從出生起就能夠擁有從頭組裝的個(gè)人基因組數(shù)據(jù),從而識(shí)別和預(yù)防可能產(chǎn)生的疾病呢?這對(duì)每個(gè)人的健康意義重大,我們需要盡快建立這樣的體系。
健康是每個(gè)人的根本訴求。健康來源于兩個(gè)方面,一方面是環(huán)境,是我們所生存的過程;另一方面就是遺傳,就是基因,是與生俱來的從我們父母那邊繼承來的信息。
環(huán)境和基因是人類永恒的主題,我們?cè)趲兹f年的發(fā)展歷程中學(xué)會(huì)了控制環(huán)境,現(xiàn)在也逐漸理解和學(xué)會(huì)了怎樣控制基因。通過技術(shù)的進(jìn)步,把好的基因傳遞給我們的下一代,每個(gè)人才會(huì)越來越健康、人類的發(fā)展才會(huì)越來越好。