演化是個變廢為寶的大師,新基因可從“垃圾DNA”中產(chǎn)生
這似乎是不可能的——神秘的新基因竟會從“垃圾”DNA中產(chǎn)生,但最新的數(shù)據(jù)卻支持這個理論。
和人類一樣,基因也有家族——穿越時(shí)間的紐帶將它們與一位始祖聯(lián)系在一起。那個祖先不斷復(fù)制和擴(kuò)散,每經(jīng)過一個循環(huán)都會有些許改變。
過去40年的大多數(shù)時(shí)間里,科學(xué)家們都認(rèn)為這就是新基因誕生的基本方式——從已有基因的拷貝中產(chǎn)生。原來的版本繼續(xù)忠實(shí)地執(zhí)行使命,新的版本則獲得了演化出新功能的自由。
然而,某些基因似乎是要挑戰(zhàn)這個最初的觀點(diǎn)。它們沒有已知的親戚,和別的基因毫無相似之處。它們就像分子版的神秘野獸——隱藏在偏遠(yuǎn)雨林的深處,似乎與地球上其他任何生物都毫不相干。
“孤兒基因”從何而來的謎團(tuán)已經(jīng)困擾了科學(xué)家?guī)资?。但近幾年來,一種曾被視為異端邪說的解釋變得越來越有影響力——許多孤兒基因來自所謂的“垃圾DNA”,也就是基因與基因之間神秘的非編碼DNA片段。加州大學(xué)戴維斯分校的生物學(xué)家David Begun形容道:“不知怎的,遺傳功能就這樣出現(xiàn)了。”
新基因產(chǎn)生的鼓點(diǎn) 在老鼠世系的演化歷史(圖中紅線所示)中,新的基因似乎是集中在幾個時(shí)間點(diǎn)上出現(xiàn)。大約800萬年前的新基因產(chǎn)生高峰與地球走出“雪球”狀態(tài)的時(shí)間一致,在此之前,地球幾乎完全是冰封的。最近的一次高峰代表著許多新產(chǎn)生的基因,它們中有許多此后將在演化中消失。如果所有的基因都是通過復(fù)制產(chǎn)生的,它們應(yīng)該全部在生命起源不就之后產(chǎn)生,也就是大約38億年前(圖中綠線所示)。圖片來源:Tautz and Domazet-Lo?o,,Nature Reviews Genetics,2011
這種從非編碼DNA到基因的轉(zhuǎn)變曾被認(rèn)為是不可能的。然而,從酵母、果蠅到老鼠和人類,越來越多來自不同生物的例子已經(jīng)讓大多數(shù)專家相信這些從頭起源基因(de novo genes)的確存在,一些科學(xué)家認(rèn)為它們甚至可能是很常見的。就在不久前,在維也納舉行的分子生物學(xué)與演化學(xué)會(Society for Molecular Biology and Evolution)年會上公布的一項(xiàng)研究新識別出了600個潛在的人類基因。巴塞羅那馬爾醫(yī)院研究所(Hospital del Mar Research Institute)的演化生物學(xué)家Mar Albà 作了這場報(bào)告。他說:“人們原來認(rèn)為從頭起源基因是很罕見的,但現(xiàn)在他們開始越來越頻繁地發(fā)現(xiàn)這類基因。”
研究人員開始意識到,從頭起源基因可能是基因組重要的一部分,但依然不清楚它們的數(shù)量有多少,功能是什么。更重要的是,這類基因的突變會導(dǎo)致災(zāi)難性的后果。德國明斯特大學(xué)(University of Münster)的生物信息學(xué)家Erich Bornberg-Bauer說:“看來,這些新的基因通常也是最重要的基因?!?
追蹤孤兒基因
成千上萬的已知基因家族中,許多基因的產(chǎn)生能夠用標(biāo)準(zhǔn)的基因復(fù)制模型解釋。但這個模型也有局限,它意味著絕大多數(shù)新基因的創(chuàng)造活動在生物演化史的極早期就都完成了,35億年前最早的生物大分子就已創(chuàng)立了一系列遺傳學(xué)的基本結(jié)構(gòu)單元,之后生命每歷經(jīng)一輪循環(huán)都只能對這些結(jié)構(gòu)單元做細(xì)微的改動。然而,如果生命的工具箱內(nèi)容如此有限,今天地球上如此豐富多彩的生物王國又是如何通過演化產(chǎn)生的呢?Bornberg-Bauer指出:“如果新的零件只能從舊的產(chǎn)生,我們將很難解釋演化過程中根本性的變化?!?
20世紀(jì)90年代,隨著DNA測序技術(shù)的興起,第一條證據(jù)出現(xiàn)了,它說明嚴(yán)格的復(fù)制模型是不足以解釋所有基因的起源的。在分析酵母基因組的過程中,研究人員發(fā)現(xiàn)有三分之一的酵母基因和來自其他生物體的已知基因沒有相似性。當(dāng)時(shí),許多科學(xué)家認(rèn)為這些孤兒屬于還未被發(fā)現(xiàn)的基因家族,但這個假設(shè)沒有得到證實(shí)。近十年來,科學(xué)家對成千上萬種生物的DNA進(jìn)行了測序,但許多孤兒基因依然沒能被歸類,它們的來源依然是一個謎。
2006年,Begun發(fā)現(xiàn)了第一個證據(jù),非編碼DNA中的確能產(chǎn)生新的基因。他比較了標(biāo)準(zhǔn)實(shí)驗(yàn)室果蠅(Drosophila melanogaster)和其他果蠅物種的基因序列。不同種果蠅的基因組大部分是相似的,但Begun和他的同事發(fā)現(xiàn)了幾個基因,它們僅僅在一兩個物種中存在,意味著它們不是已有基因祖先的后代。Begun 提出,果蠅非編碼DNA的“隨機(jī)”序列可能可以通過突變轉(zhuǎn)化為有功能的基因。
然而,從隨機(jī)的DNA序列中創(chuàng)造基因看起來幾乎是不可能的,這簡直就像是把一罐印了字母的積木塊隨意地倒在地上,指望它們能自動拼成一句通順的句子。“垃圾DNA”必須積累一定的突變,使它能被細(xì)胞讀取、轉(zhuǎn)錄為RNA,或是成為調(diào)控元件,指示基因應(yīng)該在何時(shí)何地被激活。并且,和句子一樣,基因也要有開頭和結(jié)尾,一定要有短序列指明它在哪里開始、又在哪里結(jié)束。
此外,基因產(chǎn)生的RNA或蛋白質(zhì)必須是有用的。新產(chǎn)生的基因可能是有害的,可能會產(chǎn)生有害蛋白,就像阿爾茨海默病患者大腦中凝集成塊的蛋白質(zhì)一樣。圖森市亞利桑那大學(xué)的生物學(xué)家Joanna Masel告訴我們:“蛋白質(zhì)很容易錯誤折疊并帶來破壞。鑒于隨機(jī)序列的產(chǎn)物會造成很多麻煩,這就很難解釋它們是怎樣制造出有用的新蛋白質(zhì)的?!盡asel正在研究演化是怎樣解決這個問題的。
Begun的假設(shè)面臨的另一個挑戰(zhàn)是,把從頭起源基因和那些經(jīng)歷巨變后與不再與祖先相像的基因區(qū)分開來不是件容易的事。(確定真正的從頭起源基因很有難度,這依然是該領(lǐng)域內(nèi)爭論的來源之一。)
十年前,馬普演化生物學(xué)研究所的生物學(xué)家Diethard Tautz和許多研究人員一樣,對Begun的想法持懷疑態(tài)度。Tautz找到了孤兒基因產(chǎn)生的另一種解釋:一些神秘的基因演化得非常快,使得它們與祖先的相似之處難以被辨識;另一些則由已有基因碎片的重新組合產(chǎn)生。
后來,他的研究團(tuán)隊(duì)偶然發(fā)現(xiàn)了Pldi基因,這個基因是用前阿森納球員波多爾斯基(Lukas Podolski)的名字命名的。小鼠、大鼠和人類都有這段序列。在后兩個物種里,這段DNA保持沉默,也就是說不會被轉(zhuǎn)化為RNA或蛋白質(zhì)。它只在小鼠里有活性,能夠被轉(zhuǎn)錄為RNA,并且有著重要的作用。雄性小鼠如果缺失這個基因,它們的精子將會游動得更遲緩,睪丸會更小。
研究人員成功追蹤到了將這段沉默的非編碼DNA轉(zhuǎn)化為活性基因的一系列變異。這項(xiàng)研究顯示,該基因的確是從頭產(chǎn)生的,而不是屬于已有的基因家族,只是在演化過程中變得面目全非了。Tautz說:“這時(shí)候我想,好吧,它(從頭起源基因)一定是可能的?!?
蜂擁而至的新基因
科學(xué)家現(xiàn)在已經(jīng)確定了不少支持基因從頭產(chǎn)生的明白無誤的例子:酵母中一個決定有性還是無性生殖的基因;果蠅和其他雙翅目昆蟲中一個關(guān)鍵的飛行基因;還有一些只在人類中發(fā)現(xiàn)的基因,它們的功能尚未查明。
在今年的分子生物學(xué)與演化學(xué)會年會上,Albà及其合作者發(fā)布了他們的成果。使用強(qiáng)大的RNA分析新技術(shù),他們在人類和黑猩猩的基因組中鑒別出了幾百個推定為從頭起源的基因,這個數(shù)目是此前研究得到的基因數(shù)目的整整10倍。Albà小組找到的600個人類特有的基因中,80%是全新的,之前還從來沒有被發(fā)現(xiàn)過。
不幸的是,破譯從頭起源基因的功能要比鑒別它們困難得多。但至少,它們中的一部分不是等閑之輩。證據(jù)表明,一部分新基因很快變得至關(guān)重要,比如果蠅20%的新基因是生存所必需的。還有很多新基因帶有自然選擇的痕跡,說明它們對生物體有所貢獻(xiàn)。
至少有一個人類的新基因在腦中表達(dá)得很活躍,使得一些科學(xué)家猜測這樣的基因可能推動了腦的演化。還有的突變與癌癥相關(guān),說明它們在細(xì)胞中有著重要的功能。都柏林圣三一學(xué)院的遺傳學(xué)家,曾鑒定了第一個人類的從頭起源基因的Aoife McLysaght說:“功能失常會導(dǎo)致如此嚴(yán)重的后果,這說明該基因的正常功能很重要,或是它能造成很大的影響?!?
水性楊花的蛋白質(zhì)
對從頭起源基因的研究也在促進(jìn)一個更大的觀念轉(zhuǎn)變,它們改變了我們對蛋白質(zhì)形態(tài)和功能的理解。從頭起源基因通常很短,產(chǎn)生的蛋白質(zhì)比較小。傳統(tǒng)的看法認(rèn)為蛋白質(zhì)應(yīng)該會折疊成一個精確的結(jié)構(gòu),而從頭起源的新蛋白有著更為無序的結(jié)構(gòu),這讓它們較為松弛,能夠和種類更多的分子結(jié)合。用生物化學(xué)的說法,這些新生的蛋白質(zhì)是混雜(promiscuous)的。
科學(xué)家對這些短鏈蛋白質(zhì)的行為依然知之甚少,很大程度上是因?yàn)槌R?guī)的篩查技術(shù)容易忽略它們。大多數(shù)尋找基因及其相應(yīng)蛋白質(zhì)的手段會挑出與已知基因相似的較長序列。Begun說:“我們很容易漏掉它們?!?
這樣的現(xiàn)狀正在改變,科學(xué)家意識到了短鏈蛋白質(zhì)的重要性,正開始采用探測基因的新技術(shù),從頭起源基因的數(shù)目很可能因此而有爆炸式的增長。Masel說:“我們還不知道這些較短基因的具體功能,對于它們的生物學(xué)功能,我們還有很多要探索?!?
科學(xué)家還想弄清一個特別令人困惑的問題:從頭起源基因是怎樣整合入驅(qū)動細(xì)胞運(yùn)作的復(fù)雜反應(yīng)網(wǎng)絡(luò)的。這就像一輛自行車自發(fā)長出了一個新零件,又很快地將它整合進(jìn)自己的機(jī)械裝置之中,盡管沒有這個零件自行車也能很好地運(yùn)作。Begun說:“這個問題非常有吸引力,但也是完全未知的?!?
一個叫做ESRG的人類特有基因是這個謎團(tuán)很好的例子,它的一些片段在猴子和其他靈長類中也有發(fā)現(xiàn)。但這個基因只在人類中有活性,并對維護(hù)最初的胚胎干細(xì)胞非常重要??墒?,猴子和黑猩猩無需它也能很好地制造胚胎干細(xì)胞。McLysaght指出:“這個人類特有基因執(zhí)行的功能必定先于此基因存在,因?yàn)槠渌镆灿羞@些干細(xì)胞?!?
“新基因如何獲得功能?它又是如何成為細(xì)胞生命過程的一部分?”McLysaght說,“對我來說,這是眼下最為重要的問題。”
- 上一篇:我國局部省份擬將基因測序納入醫(yī)保,二胎優(yōu)生有望普及 2015/11/3
- 下一篇:基因測序發(fā)展新態(tài)勢:在上游發(fā)展三四代技術(shù),在下游完成樣本積累 2015/10/21