您現(xiàn)在的位置:首頁(yè) > 科技 > 正文

環(huán)球快資訊:基因測(cè)序20年后,終于搞清了垃圾DNA是干啥的

時(shí)間:2023-07-01 16:57:19    來(lái)源:科普中國(guó)網(wǎng)    

1990年,國(guó)際人類(lèi)基因組計(jì)劃啟動(dòng),到2003年,絕大多數(shù)人類(lèi)基因組已獲得測(cè)定。人們驚奇地發(fā)現(xiàn),人類(lèi)的基因并非一條完整的信息鏈,而是被許多不能編碼遺傳信息的序列切割得支離破碎。這些不能編碼遺傳信息的DNA在當(dāng)時(shí)被稱(chēng)為“垃圾”。大自然為什么要在人類(lèi)基因里放置那么多的垃圾?二十年來(lái),隨著科學(xué)家的努力,真相逐漸浮出水面:這些垃圾DNA自有作用,而其中非常重要的一類(lèi)就叫做“內(nèi)含子”。


(相關(guān)資料圖)

撰文 | 玉寶(中科院遺傳發(fā)育所博士)

內(nèi)含子的發(fā)現(xiàn)

龍生龍,鳳生鳳,遺傳是我們生活中隨處可見(jiàn)的現(xiàn)象??茖W(xué)家很早就猜測(cè),一定是有什么物質(zhì)能把上一代的性狀傳遞給下一代。十九世紀(jì)中葉,奧地利科學(xué)家孟德?tīng)枺℅regor Johann Mendel)根據(jù)他多年的植物雜交實(shí)驗(yàn)結(jié)果假想出“遺傳因子”這樣一個(gè)獨(dú)立的遺傳單位,并認(rèn)為生物的所有性狀都是通過(guò)遺傳因子來(lái)傳遞的。1903年,美國(guó)生物學(xué)家沃爾特·薩頓(Walter Sutton)和德國(guó)生物學(xué)家鮑維里(Theodor Heinrich Boveri)提出遺傳因子位于染色體上,染色體是遺傳物質(zhì)的載體。1909年,丹麥遺傳學(xué)家約翰遜(Wilhelm Johannsen)提出了“Gene”(基因)的概念,以此來(lái)替代孟德?tīng)柤俣ǖ摹斑z傳因子”。從此,“基因”一詞一直在遺傳學(xué)中沿用至今。

約翰遜認(rèn)為,“基因”背后應(yīng)該有一個(gè)化學(xué)實(shí)體。人們相信只要弄清了基因的結(jié)構(gòu),基因如何編碼遺傳信息、遺傳信息如何傳代就很容易解釋了。在二十世紀(jì)五十年代以前,基因的結(jié)構(gòu)并不清晰,直到1953年美國(guó)分子生物學(xué)家沃森(James Watson)和英國(guó)生物學(xué)家克里克(Francis Crick)發(fā)現(xiàn)DNA的雙螺旋結(jié)構(gòu),這個(gè)問(wèn)題才得以解決。但科學(xué)家對(duì)基因的編碼方式提出了多種理論,例如“一個(gè)基因一個(gè)酶(蛋白)”就是流行于四十年代的理論。后來(lái)人們發(fā)現(xiàn),這個(gè)理論遇到的例外越來(lái)越多:不少基因發(fā)揮功能的實(shí)體是RNA,或者數(shù)個(gè)基因編碼一個(gè)蛋白,或者一個(gè)基因編碼數(shù)個(gè)蛋白。因此,“基因”的定義變得越來(lái)越復(fù)雜。

1977年,美國(guó)科學(xué)家夏普(Philip Sharp)與英國(guó)科學(xué)家理查德·羅伯茨(Richard Roberts) 在研究腺病毒遺傳時(shí),各自用電鏡技術(shù)獨(dú)立發(fā)現(xiàn)了內(nèi)含子[1, 2],并提出了“斷裂基因理論”,兩人因此榮獲1993年的諾貝爾生理學(xué)或醫(yī)學(xué)獎(jiǎng)。電鏡技術(shù)對(duì)于內(nèi)含子的發(fā)現(xiàn)功不可沒(méi),它的分辨率能夠看到納米尺度的DNA或RNA分子。不過(guò),內(nèi)含子的命名另有其人。在1978年的一篇短文中,美國(guó)科學(xué)家沃特·吉爾伯特(Walter Gilbert)提議用“intron(內(nèi)含子)”指代mRNA前體中的非編碼序列。mRNA是基因由DNA序列“翻譯”成蛋白質(zhì)序列的模板。

1980年,吉爾伯特與弗雷德里克·桑格(Frederick Sanger)、保羅·伯格(Paul Berg)因發(fā)明基因測(cè)序技術(shù)而共同獲得諾貝爾化學(xué)獎(jiǎng)。

斷裂基因理論認(rèn)為,真核生物的基因組中,基因的序列是不連續(xù)的,在基因的編碼區(qū)域之間含有大量的不編碼序列,從而打斷了對(duì)應(yīng)的蛋白質(zhì)的氨基酸序列。內(nèi)含子,一般指的是真核生物基因中不編碼蛋白質(zhì),是在mRNA加工過(guò)程中被剪切掉的DNA序列。這個(gè)剪切反應(yīng)由“剪接體(spliceosome)”完成;剪接體的結(jié)構(gòu)十分復(fù)雜,由100多個(gè)“零件”組成。

圖1 轉(zhuǎn)錄過(guò)程中內(nèi)含子被剪切的示意圖。在真核細(xì)胞基因轉(zhuǎn)錄過(guò)程中,“剪接體”行使功能將內(nèi)含子去除,將外顯子(綠色)組合到一起,形成成熟的mRNA。圖源:李宏彬等

內(nèi)含子的功能

真核細(xì)胞蛋白質(zhì)編碼基因與原核細(xì)胞的最大區(qū)別,就在于前者中存在內(nèi)含子而后者沒(méi)有。通常,內(nèi)含子的長(zhǎng)度遠(yuǎn)比編碼蛋白的外顯子序列長(zhǎng)。內(nèi)含子的存在,使得真核細(xì)胞在傳代和基因表達(dá)時(shí)消耗了大量的物質(zhì)和能量,這無(wú)疑會(huì)增加機(jī)體的生存負(fù)擔(dān)。那么,這么長(zhǎng)的非編碼片段嵌在基因里,到底有什么用呢?

內(nèi)含子發(fā)現(xiàn)之后的20年里,人們對(duì)它的起源和功能方面的研究較少。實(shí)際上,直到21世紀(jì)初,人類(lèi)基因組草圖剛完成那幾年,還有一個(gè)流行的說(shuō)法:“人類(lèi)基因組中95%的序列都是垃圾DNA”。相信有讀者記得當(dāng)時(shí)的這個(gè)說(shuō)法。當(dāng)然,那時(shí)候人們所說(shuō)的垃圾序列中,就包括了內(nèi)含子。在科研人員的不斷努力下,“垃圾DNA”的說(shuō)法逐漸被推翻,內(nèi)含子的重要功能也逐步清晰起來(lái)。

一系列研究發(fā)現(xiàn),內(nèi)含子有助于維持基因的穩(wěn)定,還會(huì)參與基因的表達(dá)和調(diào)控。具體來(lái)說(shuō),基因中的內(nèi)含子與外顯子通過(guò)可變剪接產(chǎn)生不同的外顯子組合,進(jìn)而翻譯出多種蛋白質(zhì),提高了蛋白質(zhì)組的復(fù)雜性;內(nèi)含子中的增強(qiáng)子(序列)等調(diào)控元件可以調(diào)控基因的轉(zhuǎn)錄效率;內(nèi)含子中的一些RNA元件還可以避免轉(zhuǎn)錄提前終止。

早期研究發(fā)現(xiàn),內(nèi)含子可以維持基因轉(zhuǎn)錄時(shí)DNA序列的穩(wěn)定:防止基因在轉(zhuǎn)錄時(shí)形成“R環(huán)”(R-loop)。所謂R環(huán),顧名思義就是“R”形的結(jié)構(gòu),它是指由轉(zhuǎn)錄出的RNA鏈與打開(kāi)的雙鏈DNA的其中一條發(fā)生堿基互補(bǔ)配對(duì),形成RNA-DNA雜合鏈的結(jié)構(gòu),同時(shí),未配對(duì)的另一條DNA鏈處于游離狀態(tài)(見(jiàn)圖2)。而內(nèi)含子的存在可以減少R環(huán)形成,保持基因組DNA的穩(wěn)定性。不過(guò),R環(huán)也并不都是“壞的”,后來(lái)人們發(fā)現(xiàn)細(xì)胞中的R環(huán)也是有生物功能的——它可以調(diào)節(jié)基因表達(dá),如轉(zhuǎn)錄起始和延伸、表觀遺傳調(diào)控等。另外,R環(huán)的失調(diào)與DNA損傷、基因組不穩(wěn)定、基因高頻重組也有關(guān)。

圖2. 基因轉(zhuǎn)錄時(shí)形成“R環(huán)”(R-loop)的兩種方式。圖源:張譯勻等

內(nèi)含子還有許多其他的功能。幾年前,加拿大舍布魯克大學(xué)的Elela團(tuán)隊(duì)和美國(guó)麻省理工學(xué)院的Bartel團(tuán)隊(duì)同時(shí)發(fā)表了兩篇論文**[4, 5]**,表明內(nèi)含子可以協(xié)助機(jī)體應(yīng)對(duì)營(yíng)養(yǎng)缺乏的壓力,使其“扛餓”。

Elela團(tuán)隊(duì)逐個(gè)敲除了釀酒酵母的200多個(gè)內(nèi)含子,看看是否會(huì)影響酵母的生存能力。通過(guò)測(cè)序以及相應(yīng)的表型分析,研究人員發(fā)現(xiàn)內(nèi)含子具有調(diào)控酵母適應(yīng)營(yíng)養(yǎng)匱乏(饑餓)的功能。Bartel團(tuán)隊(duì)則發(fā)現(xiàn)酵母中有34個(gè)內(nèi)含子一直存在于細(xì)胞中,以剪切后的全長(zhǎng)或線(xiàn)性形式存在,它們受到經(jīng)典的TOR代謝通路的調(diào)控,在營(yíng)養(yǎng)匱乏時(shí)能夠減緩酵母的生長(zhǎng)速度,提高了酵母的適應(yīng)性和生存率。這些內(nèi)含子發(fā)揮應(yīng)對(duì)逆境的功能,與其所在基因的功能無(wú)關(guān)。內(nèi)含子關(guān)乎機(jī)體的生死存亡,那么在它生物演化過(guò)程中得以保留也就可以理解了。

內(nèi)含子可以分為四類(lèi):Ⅰ型內(nèi)含子、Ⅱ型內(nèi)含子、剪接體內(nèi)含子、tRNA內(nèi)含子。其中,一般意義上的內(nèi)含子就是剪接體內(nèi)含子,顧名思義就是自帶剪接體的內(nèi)含子,其”剪接體”的蛋白立體結(jié)構(gòu)已被解析出來(lái)。生成mRNA的剪接反應(yīng)非常精準(zhǔn),錯(cuò)誤率極低——要知道,若移碼錯(cuò)位一個(gè)堿基,就會(huì)導(dǎo)致后續(xù)轉(zhuǎn)錄過(guò)程發(fā)生異常,無(wú)法生成蛋白質(zhì)或生成錯(cuò)誤的蛋白質(zhì)。

Ⅰ型內(nèi)含子存在于細(xì)菌、噬菌體、原生生物、真菌中,能夠自我剪接。Ⅱ型內(nèi)含子存在于細(xì)菌和細(xì)胞器基因組中,同樣能夠自我剪接,但是機(jī)制與1型內(nèi)含子不同,與剪接體內(nèi)含子的剪接機(jī)制類(lèi)似。tRNA內(nèi)含子存在于真核細(xì)胞和古菌中,剪接過(guò)程需要內(nèi)切酶和ATP。

內(nèi)含子的產(chǎn)生機(jī)制

真核細(xì)胞里到底是怎么出現(xiàn)內(nèi)含子的?

關(guān)于內(nèi)含子的產(chǎn)生機(jī)制,目前比較流行的解釋是“introner理論”[6],它可以解釋剪接體內(nèi)含子的起源。introners可以看做是基因組中的“寄生蟲(chóng)”,在基因組中通過(guò)“復(fù)制”“粘貼”的方式“制造”了大量?jī)?nèi)含子。2009年,科學(xué)家在微單胞藻中發(fā)現(xiàn)了introner,隨后在鞭毛藻、某些真菌、尾索動(dòng)物中也發(fā)現(xiàn)了它的蹤跡。

科學(xué)家的多項(xiàng)研究表明,這個(gè)“復(fù)制”“粘貼”的過(guò)程可以在整個(gè)基因組中大規(guī)模地重復(fù):在整個(gè)生物演化過(guò)程中,introner在不同的真核生物中不停制造著內(nèi)含子。比如,在過(guò)去的十萬(wàn)年中,真菌基因組中的多數(shù)內(nèi)含子都是Introner引入的**[7]**。

圖3. Introner如何“制造”內(nèi)含子? Introner把內(nèi)含子序列插入基因組中,從而“割裂”原有的DNA序列,生成新的外顯子。圖源:Merrill Sherman

研究發(fā)現(xiàn),在一些物種中,introner產(chǎn)生的序列與DNA轉(zhuǎn)座子有很強(qiáng)的相似性,例如Polarella glacialis和Micromonas這兩種藻類(lèi)就是這樣。DNA轉(zhuǎn)座子代表了一個(gè)更大的遺傳元件家族,又稱(chēng)轉(zhuǎn)座元件或“跳躍基因”;轉(zhuǎn)座子可以將自身序列大量拷貝并插入基因組中。introner和轉(zhuǎn)座子的這種的相似性,提示了一部分內(nèi)含子可能來(lái)源于轉(zhuǎn)座子。Introner機(jī)制產(chǎn)生的內(nèi)含子往往在短期內(nèi)大量出現(xiàn)在基因組中,帶有很強(qiáng)的隨機(jī)性,這可以解釋為什么內(nèi)含子在真核生物基因組中的分布并不均勻。

不過(guò),目前introner只發(fā)現(xiàn)于部分物種。例如,內(nèi)含子的涌現(xiàn)似乎在水生生物中更常見(jiàn):內(nèi)含子出現(xiàn)在水生生物基因組中的可能性是陸生生物基因組的6倍多。此外,近3/4的含有內(nèi)含子的水生物種,其基因組擁有多個(gè)序列相似的內(nèi)含子。這種序列相似的現(xiàn)象其實(shí)就是基因水平轉(zhuǎn)移,即基因序列從一個(gè)物種轉(zhuǎn)移到另一個(gè)物種。這種形式的基因轉(zhuǎn)移,往往發(fā)生在水生環(huán)境或物種共生的情況下,例如宿主和寄生蟲(chóng)之間。

水生環(huán)境有助于水平基因轉(zhuǎn)移,是因?yàn)樵谒越橘|(zhì)中各種遺傳物質(zhì)可以自由流動(dòng)。單細(xì)胞生物在水中很容易吸收或融合外源DNA;更復(fù)雜的多細(xì)胞生物在水中產(chǎn)卵或受精,也有機(jī)會(huì)接觸到外源DNA或RNA。有研究發(fā)現(xiàn),在將近300多個(gè)硬骨魚(yú)類(lèi)基因組中曾發(fā)生了近1000個(gè)基因水平轉(zhuǎn)移或內(nèi)含子插入事件**[8]**。相比之下,陸地生物之間發(fā)生基因水平轉(zhuǎn)移的頻率要低得多。

內(nèi)含子對(duì)生物演化的意義

同樣是真核生物,哺乳動(dòng)物的內(nèi)含子比酵母的更多更長(zhǎng)。例如,人類(lèi)內(nèi)含子序列長(zhǎng)度約占基因組的25%,每個(gè)基因平均約有9個(gè)內(nèi)含子,這樣有助于基因?qū)崿F(xiàn)復(fù)雜多樣的功能。人類(lèi)mRNA前體中內(nèi)含子的長(zhǎng)度差異非常大,可以從50個(gè)堿基到百萬(wàn)個(gè)堿基不等。

內(nèi)含子在物種間及物種內(nèi)部的分布也不均衡。同一物種不同個(gè)體的同一基因中,有的有內(nèi)含子,有的沒(méi)有;不同物種同一基因的內(nèi)含子的長(zhǎng)度、數(shù)目和所處位置等都不相同。如Sccoxl.2b和Ancoxl.3這兩個(gè)同源基因的內(nèi)含子,其序列有70%相同,但內(nèi)含子旁邊的外顯子排列順序差異很大,這可能是內(nèi)含子在不同物種中發(fā)生了轉(zhuǎn)移的結(jié)果。

內(nèi)含子的存在需要有相應(yīng)的機(jī)制保證。真核生物因?yàn)榧?xì)胞中有核膜,為基因轉(zhuǎn)錄和翻譯過(guò)程在空間上的分離提供了基礎(chǔ),同時(shí)細(xì)胞中的大量線(xiàn)粒體可以提供能量,所以?xún)?nèi)含子的存在有其物質(zhì)基礎(chǔ)。而原核生物,沒(méi)有核膜結(jié)構(gòu),轉(zhuǎn)錄和翻譯是同步的,所以原核生物無(wú)需內(nèi)含子來(lái)保持DNA序列的穩(wěn)定性。

科學(xué)家認(rèn)為,內(nèi)含子有助于推動(dòng)基因家族或物種的演化?;蚪M通過(guò)組合外顯子和內(nèi)含子,通過(guò)可變剪接的機(jī)制制造新的變異,生成新的調(diào)控模式或功能模塊(酶、蛋白質(zhì)、通路等)。例如,可以產(chǎn)生毒素的物種通常需要在基因?qū)用婵焖俳M合,進(jìn)而生成新的毒液(復(fù)雜的肽類(lèi)混合物),以適應(yīng)不同的獵物或應(yīng)對(duì)天敵。動(dòng)物的免疫系統(tǒng)則需要快速重排MHC基因,不斷產(chǎn)生新的抗體或抗原呈遞細(xì)胞,以應(yīng)對(duì)生活環(huán)境中多變的抗原。這種快速進(jìn)化機(jī)制在自然界中很普遍,內(nèi)含子往往會(huì)參與到這些機(jī)制當(dāng)中。

參考文獻(xiàn)

[1] Berget SM et al. Spliced segments at the 5" terminus of adenovirus 2 late mRNA. PNAS. 1977, 74 (8): 3171–3175.

[2] Chow LT, et al. "An amazing sequence arrangement at the 5" ends of adenovirus 2 messenger RNA". Cell. 1977, 12 (1): 1–8.

[3] Gilbert W. Why genes in pieces. Nature. 1978, 271 (5645): 501.

[4] Elela AS et al. Introns are mediators of cell response to starvation. Nature. 2019, 565(7741): 612-617.

[5] Bartel DP. Excised linear introns regulate growth in yeast. Nature 2019, 565(7741): 606-611

[6] A.Z. Worden, et al. Green evolution and dynamic adaptations revealed by genomes of the marine picoeukaryotes Micromonas. Science, 2009, 324 (5924), 268-272

[7] Ate van der Burgt et al. Birth of New Spliceosomal Introns in Fungi by Multiplication of Introner-like Elements. Current Biology, 2012: 22(13), 1260-1265

[8] Zhang HH et al.Horizontal transfer and evolution of transposable elements in vertebrates. Nat Commun. 2020, 11(1):1362.

本文受科普中國(guó)·星空計(jì)劃項(xiàng)目扶持

出品:中國(guó)科協(xié)科普部

特 別 提 示

1. 進(jìn)入『返樸』微信公眾號(hào)底部菜單“精品專(zhuān)欄“,可查閱不同主題系列科普文章。

2. 『返樸』提供按月檢索文章功能。關(guān)注公眾號(hào),回復(fù)四位數(shù)組成的年份+月份,如“1903”,可獲取2019年3月的文章索引,以此類(lèi)推。

版權(quán)說(shuō)明:歡迎個(gè)人轉(zhuǎn)發(fā),任何形式的媒體或機(jī)構(gòu)未經(jīng)授權(quán),不得轉(zhuǎn)載和摘編。轉(zhuǎn)載授權(quán)請(qǐng)?jiān)凇阜禈恪刮⑿殴娞?hào)內(nèi)聯(lián)系后臺(tái)。

標(biāo)簽:

相關(guān)新聞

凡本網(wǎng)注明“XXX(非現(xiàn)代青年網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和其真實(shí)性負(fù)責(zé)。

特別關(guān)注

熱文推薦

焦點(diǎn)資訊