非常優(yōu)秀的研究總結(jié),值得學(xué)習(xí)領(lǐng)會(huì)和思考。因?yàn)樽謹(jǐn)?shù)太多,可以去作者的博文地址http://www.huangshujia.me/2017/01/02/2017-01-02-cancer-genomics-review.html仔細(xì)閱讀,文章的框架比簡(jiǎn)書(shū)查看更為清晰。
【注】本文同時(shí)發(fā)于泛基因fungenomics以及微信公眾號(hào)。
癌癥,一種慢性的基因病。
簡(jiǎn)介
在癌癥研究中,每個(gè)癌癥樣品呈現(xiàn)在研究人員眼前的已經(jīng)是一個(gè)發(fā)生了改變的基因組,其中包含著獨(dú)特且難以預(yù)測(cè)的諸多點(diǎn)突變、序列的插入缺失、易位、融合以及其他畸變。并且,這些發(fā)生的變異中,許多往往都是之前所未觀察到的(Novel mutations),它們也不會(huì)只存在于基因組的編碼區(qū)域中,因而為了能夠真正做到全面研究癌癥基因組本身所發(fā)生的所有突變事件,全基因組測(cè)序已被視為腫瘤基因變異研究中 唯一 嚴(yán)謹(jǐn)?shù)姆椒ā?/p>
然而,在所有這些變異中,卻只有少數(shù)的幾個(gè)主導(dǎo)著癌癥這一疾病的發(fā)展和演變。要有效揭示這一演變和發(fā)展的過(guò)程,就需要監(jiān)控基因表達(dá)水平上的變化,那么RNA-Seq便是用以確定這些遺傳改變是否會(huì)影響疾病發(fā)展有用技術(shù)。但遺傳改變有可能影響所有的細(xì)胞過(guò)程,包括染色質(zhì)結(jié)構(gòu)、DNA甲基化、RNA剪接異構(gòu)體、RNA編輯和microRNA(miRNA)等。這就意味著,只有對(duì)所有這些獨(dú)立的過(guò)程都進(jìn)行檢測(cè)和綜合分析,才能在癌癥研究中取得真正的突破。這些內(nèi)容我們都將在下文一一展開(kāi)。
當(dāng)前基因組測(cè)序技術(shù)的一大特點(diǎn)是在于能夠在很短的時(shí)間內(nèi)并行測(cè)得數(shù)十億(甚至數(shù)百億)的獨(dú)立序列片段——read,而每個(gè)read來(lái)源于單個(gè)的DNA分子。由此產(chǎn)生的數(shù)據(jù)我們可將其視為是對(duì)DNA分子的隨機(jī)抽樣,這反過(guò)來(lái)代表腫瘤樣品中每個(gè)細(xì)胞的基因組的情況。這是我們解開(kāi)癌癥的原因和機(jī)制的一種強(qiáng)大工具。
腫瘤異質(zhì)性
癌癥基因組的突變是復(fù)雜的。
每個(gè)人都攜帶一套獨(dú)特的來(lái)自父母遺傳的胚系突變(germline mutations)信息。但隨著癌癥的發(fā)展,體細(xì)胞突變(Somatic mutations)和基因組重排(genomics rearrangements)會(huì)逐漸增加。這些改變往往會(huì)引發(fā)耐藥性以及轉(zhuǎn)移。越來(lái)越多的研究證據(jù)表明,這些過(guò)程竟然可以是 有意的!——它們其實(shí)可以認(rèn)為是癌細(xì)胞面臨藥物刺激的過(guò)程中不斷進(jìn)化的結(jié)果。我們想要全面地理解這一復(fù)發(fā)和耐藥性的原因,就有必要進(jìn)行縱向?qū)嶒?yàn),按照癌癥的發(fā)展過(guò)程,分階段采集樣品來(lái)進(jìn)行研究。
如上圖,這是處于正常組織背景下的多克隆腫瘤(polyclone tumor)。大多數(shù)的腫瘤樣品都會(huì)同時(shí)包含腫瘤細(xì)胞和正常細(xì)胞,如基質(zhì)細(xì)胞、血管和免疫細(xì)胞。并且腫瘤本身也常常包含幾種不同的克隆亞型(clone types),每一種都有著不同的治療反應(yīng)和復(fù)發(fā)可能。
根據(jù)傳統(tǒng)病理學(xué)的估計(jì),大部分研究的結(jié)果其實(shí)都只集中在那些腫瘤細(xì)胞比例 >60% 的區(qū)域中。并且為了確定哪些突變是腫瘤特異的,通常都要包含來(lái)自同一個(gè)體的正常組織樣本作為參考。
然而,腫瘤本身也往往是異質(zhì)性的。在癌癥發(fā)展的過(guò)程中,個(gè)別細(xì)胞會(huì)發(fā)生新的突變,包含這些新突變的細(xì)胞會(huì)繼續(xù)增殖,形成克隆亞型。因此,對(duì)于晚期癌癥我們通常檢測(cè)到的都是一個(gè)多克隆腫瘤,其中每一個(gè)克隆有一套獨(dú)特的突變信息、獨(dú)特的病理學(xué)和藥物反應(yīng)機(jī)制。這其實(shí)也正是癌癥難以完全治療的原因,而它的這種 異質(zhì)性其實(shí)正是腫瘤基因組復(fù)雜性導(dǎo)致的一種表型性質(zhì)。目前的深度測(cè)序可以檢測(cè)樣本中含量低至1%的克隆。
腫瘤內(nèi)的異質(zhì)性。體細(xì)胞突變的逐步累積產(chǎn)生了一個(gè)異質(zhì)的多克隆腫瘤,其中不同克隆可能對(duì)治療的反應(yīng)不同。
而且,異質(zhì)性一般還可以分兩種情況討論,第一種情況指的是:同一個(gè)病人的腫瘤細(xì)胞具有異質(zhì)性。處于腫瘤發(fā)生的不同時(shí)期的腫瘤細(xì)胞的基因突變情況不同,造就了每一個(gè)腫瘤細(xì)胞群體內(nèi)還有許多亞群(subclones),腫瘤細(xì)胞在通過(guò)轉(zhuǎn)移時(shí),就會(huì)有屬于不同亞群的腫瘤細(xì)胞去侵入新的地方,形成新的腫瘤;第二種情況指的是:除了同一病人的不同腫瘤細(xì)胞會(huì)造成腫瘤的異質(zhì)性外,腫瘤的異質(zhì)性還體現(xiàn)在不同病人可能得了相同的腫瘤,但是那個(gè)『相同』未必真是相同——僅僅是表型相同,不代表著基因型也相同。
在某些基因中,突變頻繁發(fā)生在同一個(gè)位置,這應(yīng)該有特定的機(jī)制在起作用,這些有規(guī)律性的情況都會(huì)稍微容易對(duì)付。然而遺憾的是,對(duì)于大多數(shù)的基因,突變顯然是隨機(jī)出現(xiàn)在整個(gè)基因中的,這其實(shí)說(shuō)明了DNA的復(fù)制和修復(fù)機(jī)制失靈了。
圖中為兩個(gè)假定的基因,他們有著兩種不同的突變模式。深灰色框代表外顯子組,而紅色柱子代表存在突變的位置。A: 特定位置的頻發(fā)突變可能表示有產(chǎn)生突變的生物學(xué)機(jī)制的參與。B: 散發(fā)突變存在于整個(gè)基因中,如P53,可能是由于復(fù)制和修復(fù)機(jī)制的失效。我們可以通過(guò)測(cè)序檢測(cè)這兩種情況下的突變。
參考文獻(xiàn)
2012年Ding Li等人發(fā)表在Natrue上的一項(xiàng)研究弄清了急性髓細(xì)胞白血病(AML)的復(fù)發(fā)原因。他們發(fā)現(xiàn)了兩個(gè)一般機(jī)理:(1)原發(fā)腫瘤中的始發(fā)克隆(founding clone)獲得突變,進(jìn)化成復(fù)發(fā)克隆;(2)始發(fā)克隆的一個(gè)亞克隆挺過(guò)了初次治療,獲得了更多突變并在復(fù)發(fā)時(shí)增殖。在一個(gè)病例中,原發(fā)腫瘤里原本僅占5.1%的亞克隆在復(fù)發(fā)后卻成長(zhǎng)為主要的克隆。而且對(duì)于所有的病例,化療并不能夠根除這些始發(fā)克隆。這項(xiàng)研究直接表明了在診斷后和初次治療后檢測(cè)并根除掉那些原本不起眼的小細(xì)胞群體有多么的重要!
Ding L., Ley T. J., Larson D. E., Miller C. A., Koboldt D. C., et al. (2012) Clonal evolution in relapsed acute myeloid leukaemia revealed by whole-genome sequencing. Nature 481: 506-510同樣是2012年,同樣是Ding Li這波人,同樣是研究AML,他們這次發(fā)現(xiàn)大約三分之一的骨髓增生異常綜合征患者會(huì)發(fā)展成繼發(fā)性急性髓細(xì)胞白血病(AML)。這個(gè)研究的目的是為了確定骨髓增生異常綜合征中的突變,它們有可能預(yù)測(cè)AML的進(jìn)展。他們對(duì)七名繼發(fā)性AML患者的七組皮膚和骨髓樣品以及先前的骨髓增生異常綜合征的配對(duì)骨髓樣品一并做了全基因組測(cè)序。結(jié)果發(fā)現(xiàn),在所有病例中,占主導(dǎo)地位的繼發(fā)性AML克隆都是來(lái)自一個(gè)骨髓增生異常綜合征的始發(fā)克隆。這其實(shí)就是說(shuō),骨髓增生異常綜合征樣品包含了對(duì)預(yù)后很重要的突變,針對(duì)這些突變的治療方案是可能改善預(yù)后的。
Walter M. J., Shen D., Ding L., Shao J., Koboldt D. C., et al. (2012) Clonal architecture of secondary acute myeloid leukemia. N Engl J Med 366: 1090-1098繼續(xù)腫瘤治療和預(yù)后的話題,Gerlinger M這一波人發(fā)起了一項(xiàng)研究,利用全外顯子組測(cè)序來(lái)研究多個(gè)樣品,這些樣品不僅來(lái)自兩名患者體內(nèi)的原發(fā)腎癌,還包括了患者相關(guān)轉(zhuǎn)移部位的空間分隔區(qū)域。最后,他們?cè)谠l(fā)腫瘤中看到了廣泛存在的異質(zhì)性現(xiàn)象!而且還特別指出了在每個(gè)腫瘤區(qū)域內(nèi)有63%-69%的體細(xì)胞突變是無(wú)法檢測(cè)到的。同時(shí),還檢測(cè)了同一腫瘤不同區(qū)域內(nèi)預(yù)后良好和不良的基因表達(dá)特征。這其實(shí)還是突出了在突變積累之前早期診斷的重要性,以及對(duì)較大腫瘤需要進(jìn)行多個(gè)部位的活檢。利用同一名患者的多個(gè)樣本得到的信息,他們能夠重建疾病的發(fā)展進(jìn)程!這是一種極為強(qiáng)大的方法,不僅能檢測(cè)引發(fā)事件,還能檢測(cè)表現(xiàn)出平行進(jìn)化的基因。平行進(jìn)化通常是基因在進(jìn)化壓力下的一種表現(xiàn),其實(shí)也表示那些基因可能成為有效的治療靶點(diǎn)。
Gerlinger M., Rowan A. J., Horswell S., Larkin J., Endesfelder D., et al. (2012) Intratumor heterogeneity and branched evolution revealed by multiregion sequencing. N Engl J Med 366: 883- 892。
轉(zhuǎn)移
腫瘤的轉(zhuǎn)移是一個(gè)復(fù)雜的過(guò)程,其中癌細(xì)胞脫離原發(fā)腫瘤,通過(guò)血液或者淋巴系統(tǒng)循環(huán)到身體的其他部位。在新部位,細(xì)胞繼續(xù)繁殖,最終形成更多腫瘤,這些腫瘤包含了反映其組織來(lái)源的細(xì)胞。腫瘤(胰腺癌和葡萄膜腫瘤)轉(zhuǎn)移的能力大大增加了它們的致死性。關(guān)于轉(zhuǎn)移腫瘤的克隆結(jié)構(gòu)、轉(zhuǎn)移酶之間的系統(tǒng)發(fā)育關(guān)系、轉(zhuǎn)移和原發(fā)部位的平行進(jìn)化規(guī)模,腫瘤如何擴(kuò)散,以及腫瘤微環(huán)境在轉(zhuǎn)移部位決定中的作用如何等,許多這些基本問(wèn)題目前仍然沒(méi)有很好地解決。
轉(zhuǎn)移瘤可能來(lái)源于原發(fā)腫瘤中一個(gè)主要克隆(如上圖:Metastasis1),也可能來(lái)源于次要克隆(Metastasis2)。轉(zhuǎn)移瘤也會(huì)經(jīng)歷克隆進(jìn)化(如Metastasis1所示)
參考文獻(xiàn)
Hsieh A. C., Liu Y., Edlind M. P., Ingolia N. T., Janes M. R., et al. (2012) The translational landscape of mTOR signalling steers cancer initiation and metastasis. Nature 485: 55-61
這篇文章證明了前列腺癌基因組經(jīng)由致癌mTOR通路的特殊翻譯機(jī)制,這其中產(chǎn)生了一個(gè)特定的基因群,它們參與了細(xì)胞增殖、代謝和侵襲。隨后作者對(duì)一類(lèi)翻譯控制前侵襲信使RNA進(jìn)行了功能鑒定,并指出了這些mRNA主導(dǎo)了癌癥侵襲和轉(zhuǎn)移。
基因組突變
所有的腫瘤在其發(fā)展的過(guò)程中都會(huì)不斷積累體細(xì)胞突變(somatic mutations)。大多數(shù)常見(jiàn)的腫瘤與不同的癌基因相關(guān)聯(lián),這些癌基因以低頻率發(fā)生突變。從大型癌癥數(shù)據(jù)庫(kù)中觀察到的一個(gè)最令人驚訝的現(xiàn)象是癌癥間甚至各個(gè)癌癥類(lèi)型內(nèi)的顯著遺傳異質(zhì)性。然而,似乎只有有限的細(xì)胞通路對(duì)腫瘤的細(xì)胞生物學(xué)很重要。目前很多人正在編輯收錄各種癌癥類(lèi)型的體細(xì)胞突變綜合列表,這對(duì)于更好地了解這種疾病背后的機(jī)制將有很大的指引作用。
研究參考
Nik-Zainal S., Alexandrov L. B., Wedge D. C., Van Loo P., Greenman C. D., et al. Mutational processes molding the genomes of 21 breast cancers. Cell 149: 979-993
這篇文章中研究了21個(gè)乳腺癌基因組,并給出了它的一個(gè)體細(xì)胞突變列表。發(fā)現(xiàn)帶BRCA1或者BRCA2突變的癌癥會(huì)有一種特別的替換突變特征和與眾不同的缺失圖譜。文章中還描述了一種局部的超突變現(xiàn)象,這稱為『kataegis』(kataegis,希臘語(yǔ)中『雷雨』的意思,文中指的是在一個(gè)小區(qū)域中出現(xiàn)大量突變的機(jī)制,如下圖)。并且這些區(qū)域中的堿基替換幾乎都發(fā)生在TpC二核苷酸的胞嘧啶上!
這是Kataegis圖像。縱軸是突變間距(對(duì)數(shù)刻度)。這個(gè)圖中基因組內(nèi)大部分的突變都有著
106bp 106bp
至
106bp 106bp
的突變距離。其中超突變區(qū)即是表現(xiàn)為突變間距較低的簇。
Govindan R., Ding L., Griffith M., Subramanian J., Dees N. D., et al. Genomic landscape of non-small cell lung cancer in smokers and never-smokers. Cell 150: 1121-1134
這是另一篇文章,主要是對(duì)17個(gè)非小細(xì)胞肺癌(NSCLC)患者的肺癌及癌旁正常組織樣本進(jìn)行了全基因組和轉(zhuǎn)錄組測(cè)序。值得注意的是吸煙者中所觀察到的突變頻率比不吸煙者高10倍!這是通過(guò)深度測(cè)序揭示出的這些群體間所不同的克隆模式。而且其中所有經(jīng)過(guò)驗(yàn)證的EGFR和KRAS突變都存在于原始克隆中,這其實(shí)也就表明了它們?cè)诎┌Y啟動(dòng)中可能發(fā)揮非常重要的作用。
鑲嵌性
對(duì)于這個(gè)現(xiàn)象我們也同樣通過(guò)實(shí)際的研究來(lái)說(shuō)明。AML(急性髓細(xì)胞白血病)基因組中發(fā)現(xiàn)的大多數(shù)突變實(shí)際上是隨機(jī)事件,在造血干細(xì)胞/祖細(xì)胞(HSPC)獲得原始突變之前就存在了;但是隨著克隆的擴(kuò)增,細(xì)胞的突變歷史被『捕獲』了。如何理解這里的『捕獲』?其實(shí)說(shuō)的就是,原本那些突變都沒(méi)什么鳥(niǎo)用,就擺在那無(wú)所事事,但是,在許多情況下,偏偏只需要再來(lái)一個(gè)或者兩個(gè)額外的突變來(lái)協(xié)助就能共同作用,最后產(chǎn)生惡性的原始腫瘤克隆!
原發(fā)腫瘤和轉(zhuǎn)移的鑲嵌性。非同義點(diǎn)突變和插入缺失(綠色塊)的區(qū)域分布的假設(shè)熱圖。行代表來(lái)自七個(gè)原發(fā)腫瘤區(qū)域和六個(gè)轉(zhuǎn)移區(qū)域的樣品。
研究參考
Abyzov A., Mariani J., Palejev D., Zhang Y., Haney M. S., et al. (2012) Somatic copy number mosaicism in human skin revealed by induced pluripotent stem cells. Nature 492: 438-442
這里作者發(fā)現(xiàn)了一個(gè)現(xiàn)象:平均而言,iPSC細(xì)胞系表現(xiàn)出2個(gè)拷貝數(shù)變異(CNV),而這些CNV在iPSC來(lái)源的成纖維細(xì)胞中不明顯。他們發(fā)現(xiàn),至少50%的CNV以低頻體細(xì)胞變異存在于親本的成纖維細(xì)胞中。根據(jù)這一觀察,他們估計(jì)大約30%的成纖維細(xì)胞的基因組中攜帶體細(xì)胞CNV,這表明體細(xì)胞鑲嵌性廣泛存在于人體中。
基因融合
基因融合是非常普遍的,也是癌癥的一個(gè)重要特征。現(xiàn)在的研究發(fā)現(xiàn),一個(gè)強(qiáng)啟動(dòng)子與一個(gè)下游功能基因(比如:原癌基因)的融合在某些癌癥中很普遍。據(jù)估計(jì),半數(shù)的前列腺癌含有TMPRSS2和ETS轉(zhuǎn)錄因子家族成員之間的融合。基因融合是由兩個(gè)原本分開(kāi)的基因或位點(diǎn)融合形成的。他們可能形成一種基因產(chǎn)物,很多時(shí)候表現(xiàn)出來(lái)的功能都是全新的,與兩個(gè)融合的基因個(gè)體都不同。這種陰差陽(yáng)錯(cuò)的情況可能引起致癌機(jī)制的激活,就像費(fèi)城染色體陽(yáng)性急性淋巴細(xì)胞白血病一樣。這種基因融合導(dǎo)致BCR-ABL酪氨酸激酶表達(dá),從而激活細(xì)胞增殖。有幾種機(jī)制會(huì)導(dǎo)致基因融合的發(fā)生,這個(gè)現(xiàn)象是一些癌癥類(lèi)型的特點(diǎn)。胰腺癌的特點(diǎn)便是染色體重排的頻繁斷裂-融合-橋循環(huán)。目前有幾種方法可以通過(guò)測(cè)序研究融合事件,如對(duì)腫瘤的全基因組測(cè)序和mRNA-Seq。
mRNA-Seq與全基因組測(cè)序組合的方法對(duì)于發(fā)現(xiàn)基因融合及其機(jī)制特別高效。原因就是mRNA-Seq可以提供直接的證據(jù),來(lái)支持觀察到的融合是否發(fā)生,并同時(shí)為融合基因是否表達(dá)提供了證據(jù)。而全基因組測(cè)序可以發(fā)現(xiàn)那些mRNA-Seq所發(fā)現(xiàn)不了的區(qū)域的信息,如基因間區(qū)和UTR。
由折回倒位所引起的融合事件可捕獲基因組中遙遠(yuǎn)區(qū)域的片段,如著絲粒重復(fù)或參與體細(xì)胞重排的區(qū)域。在這個(gè)例子中,6號(hào)染色體上的片段被插入到19號(hào)染色體上的重復(fù)區(qū)域之間。注意19號(hào)染色體的第二個(gè)拷貝是倒置的,這是折回倒位的特點(diǎn)。
MED1(紅色)與幾個(gè)伙伴基因(藍(lán)色):ACSF2,USP32 和 STXBP4形成基因融合。
實(shí)驗(yàn)上的設(shè)計(jì)參考
以Pair-end進(jìn)行全基因組測(cè)序是目前檢測(cè)基因融合最準(zhǔn)確、最全面的工具,這些融合包括重復(fù)、倒位、通讀和單堿基插入缺失。可以說(shuō)Pair-end是檢測(cè)融合基因成功與否的一個(gè)關(guān)鍵因素。
另外就是高深度測(cè)序結(jié)合更長(zhǎng)的讀長(zhǎng)可以分辨融合連接中微同源的單堿基。而且這種能力是測(cè)序獨(dú)有的。
研究參考
Robinson D. R., Wu Y. M., Kalyana-Sundaram S., Cao X., Lonigro R. J., et al. Identification of recurrent NAB2-STAT6 gene fusions in solitary fibrous tumor by integrative sequencing. Nat Genet 45: 180-185
文章主要是利用了全外顯子組和轉(zhuǎn)錄組測(cè)序發(fā)現(xiàn)了轉(zhuǎn)錄抑制因子NAB2與轉(zhuǎn)錄激活因子STAT6的基因融合現(xiàn)象。其中27個(gè)獨(dú)立性纖維性腫瘤(SFT)的轉(zhuǎn)錄組測(cè)序發(fā)現(xiàn)所有腫瘤中存在NAB2-STAT6基因融合。NAB2-STAT6基因融合的過(guò)表達(dá)誘導(dǎo)了培養(yǎng)細(xì)胞的增殖,并激活了EGR應(yīng)答基因的表達(dá),最后導(dǎo)致了腫瘤。Seshagiri S., Stawiski E. W., Durinck S., Modrusan Z., Storm E. E., et al. Recurrent R- spondin fusions in colon cancer. Nature 488: 660-664
這一篇文章則主要分析了70個(gè)原發(fā)性人結(jié)腸癌的外顯子組、轉(zhuǎn)錄組和拷貝數(shù)變異。拷貝數(shù)和RNA-Seq的數(shù)據(jù)分析確定了在一部分結(jié)直腸癌中存在IGF2的擴(kuò)增和相應(yīng)過(guò)表達(dá)。他們還利用RNA-Seq,在10%的結(jié)直腸癌中發(fā)現(xiàn)了與R-脊椎蛋白家族成員(RSPO2和RSPO3)相關(guān)的基因融合。這項(xiàng)研究表明了綜合多項(xiàng)技術(shù)去了解復(fù)雜的癌癥基因組很重要。Thompson-Wicking K., Francis R. W., Stirnweiss A., Ferrari E., Welch M. D., et al. (2012) Novel BRD4-NUT fusion isoforms increase the pathogenic complexity in NUT midline carcinoma. Oncogene
這篇文章則提到了PER-624中一種新的BRD4-NUT融合竟然編碼了一種功能蛋白,并且它對(duì)這些細(xì)胞的致癌機(jī)制很關(guān)鍵。BRD4-NUT融合轉(zhuǎn)錄本是通過(guò)易位后的RNA剪接而產(chǎn)生的,這似乎是這些癌癥的一個(gè)共同特征。這種有助于融合基因的替代異構(gòu)體表達(dá)的機(jī)制是第一次報(bào)道。Wen H., Li Y., Malek S. N., Kim Y. C., Xu J., et al. (2012) New fusion transcripts identified in normal karyotype acute myeloid leukemia. PLoS ONE 7: e51203
在這項(xiàng)研究中,作者運(yùn)用雙端RNA-Seq來(lái)發(fā)現(xiàn)染色體核型中的融合,它們經(jīng)傳統(tǒng)的細(xì)胞遺傳學(xué)分析未檢測(cè)到異常。他們發(fā)現(xiàn)了臨近基因間的融合轉(zhuǎn)錄本以及7個(gè)只存在于正常核型中的融合本。
染色體碎裂
這是一個(gè)不希望發(fā)生的現(xiàn)象,染色體碎裂是一個(gè)一次性的細(xì)胞危機(jī),在單次事件中發(fā)生數(shù)十次至數(shù)百次基因組重排。這種災(zāi)難性事件的后果是復(fù)雜的局部重排和拷貝數(shù)變異,其中染色體上2個(gè)(偶爾3個(gè))拷貝的有限范圍可被檢測(cè)。這種單次災(zāi)難性事件的模式不同于癌癥發(fā)展的逐步積累突變的典型模式。在突變積累的癌癥發(fā)展模式中,拷貝數(shù)無(wú)上限,因此通常有一個(gè)較大的范圍。據(jù)估計(jì),在所有癌癥及其不同亞型之間,染色體碎裂的發(fā)生概率約2-3%,而在骨癌中發(fā)生概率則大約25%。
染色體碎裂的圖示。
研究參考
Rausch T., Jones D. T., Zapatka M., Stutz A. M., Zichner T., et al. (2012) Genome Sequencing of Pediatric Medulloblastoma Links Catastrophic DNA Rearrangements with TP53 Mutations. Cell 148: 59-71
文章提到一名Sonic-Hedgehong髓母細(xì)胞瘤(SHH-MB)患者的大量、復(fù)雜的染色體重排,此患者帶有生殖細(xì)胞系TP53突變(Li-Fraumeni綜合征)。同時(shí)將規(guī)模擴(kuò)大到11名Li-Fraumeni綜合征患者的篩查,發(fā)現(xiàn)有36%的腫瘤表現(xiàn)出與染色體碎裂一致的重排。這比一般腫瘤群體所觀察到的2%染色體碎裂發(fā)生率要高得多。P53的生殖細(xì)胞系突變與一些腫瘤中凋亡中止導(dǎo)致染色體碎裂的假說(shuō)是一致的。
拷貝數(shù)變異(CNV)
結(jié)構(gòu)性變異影響基因量——可轉(zhuǎn)錄基因的功能拷貝數(shù)。腫瘤發(fā)展、藥物反應(yīng)及耐藥性的發(fā)生通常是由基本的基因擴(kuò)增和刪除來(lái)驅(qū)動(dòng)的。這些基因組上的改變可分成大的畸變和小的畸變。大的畸變包括整個(gè)染色體或部分染色體的丟失或重復(fù),這被稱為非整倍體。小的畸變可能只包含一個(gè)堿基,比如點(diǎn)突變和小片段的插入缺失。與健康的基因組不同,這些基因表達(dá)的改變會(huì)受到轉(zhuǎn)錄因子的嚴(yán)格調(diào)控,癌癥基因組則通過(guò)基因的重復(fù)和刪除來(lái)適應(yīng)和逃避這種調(diào)控。癌癥耐藥性的發(fā)生正是此反應(yīng)的速度和效率的絕佳證明。
基因表達(dá)
基因表達(dá)分析測(cè)定基因轉(zhuǎn)錄、RNA加工和表觀遺傳控制的產(chǎn)物。因此,基因表達(dá)分析不僅可以看出這些過(guò)程的『健康』程度,也可以深入研究細(xì)胞里面的分子機(jī)制。基于芯片的mRNA分析曾在癌癥的基因變得研究中廣泛使用,但基于測(cè)序的mRNA分析(mRNA-Seq)的出現(xiàn)代表我們測(cè)定和解析基因表達(dá)產(chǎn)物能力的又一次飛躍。mRNA-Seq可檢測(cè)修飾過(guò)的RNA和表達(dá)水平極低的RNA的能力讓它特別適合癌癥研究。基于mRNA-Seq的方法也可檢測(cè)非常快的轉(zhuǎn)錄變化、剪接異構(gòu)體、融合基因以及可變聚腺苷酸化位點(diǎn)。
Feng H., Qin Z. and Zhang X. (2012) Opportunities and methods for studying alternative splicing in cancer with RNA-Seq. Cancer Lett
這篇綜述關(guān)注了RNA-Seq在研究癌癥相關(guān)的可變剪切中的應(yīng)用。文中包含一個(gè)生物信息學(xué)工具列表,以及有關(guān)估計(jì)可變剪切異構(gòu)體的表達(dá)水平的詳盡討論。
利用RNA-Seq研究癌癥中基因表達(dá)和選擇性剪接的典型生物信息學(xué)流程。首先,將短read定位到參考基因組或轉(zhuǎn)錄組。在定位之后,估算注釋基因和轉(zhuǎn)錄本的表達(dá)與剪接。
van Delft J., Gaj S., Lienhard M., Albrecht M. W., Kirpiy A., et al. (2012) RNA-Seq provides new insights in the transcriptome responses induced by the carcinogen benzo[a]pyrene. Toxicol Sci 130: 427-439
作者發(fā)現(xiàn),RNA-Seq所檢測(cè)到的基因比芯片技術(shù)多約20%,而表達(dá)差異明顯的基因更是接近三倍之多。因此,他們檢測(cè)到的受影響的通路和生物學(xué)機(jī)制達(dá)2-5倍。作者還在許多基因中發(fā)現(xiàn)了可變異構(gòu)體的表達(dá),包括細(xì)胞死亡和DNA修復(fù)的調(diào)控因子,如TP53、BCL2和XPA,它們與基因毒性反應(yīng)相關(guān)。他們還發(fā)現(xiàn)了功能未知的新亞型,如已知轉(zhuǎn)錄本的片段、帶有額外外顯子的轉(zhuǎn)錄本、內(nèi)含子保留或外顯子跳躍事件。
Kaur H., Mao S., Li Q., Sameni M., Krawetz S. A., et al. (2012) RNA-Seq of human breast ductal carcinoma in situ models reveals aldehyde dehydrogenase isoform 5A1 as a novel potential target. PLoS ONE 7: e50249
作者將三個(gè)DCIS模型(MCF10.DCIS、SUM102和SUM225)的表達(dá)與三維(3D)覆蓋培養(yǎng)的非致癌乳腺上皮細(xì)胞的MCF10A模型進(jìn)行了比較,確定了DCIS模型共用的表達(dá)變化。他們發(fā)現(xiàn),差異表達(dá)的基因編碼了與多個(gè)信號(hào)通路相關(guān)的蛋白。Meyer J. A., Wang J., Hogan L. E., Yang J. J., Dandekar S., et al. (2013) Relapse-specific mutations in NT5C2 in childhood acute lymphoblastic leukemia. Nat Genet 45: 290-294
作者利用RNA測(cè)序,報(bào)道了診斷和復(fù)發(fā)相配對(duì)的骨髓標(biāo)本的轉(zhuǎn)錄本圖譜,這些標(biāo)本來(lái)自十名患有小兒B淋巴細(xì)胞白血病的個(gè)體。轉(zhuǎn)錄組測(cè)序鑒定出20個(gè)新獲得的突變,它們不存在于最初的診斷中,而2名個(gè)體帶有復(fù)發(fā)特異的突變。帶有NT52C2突變的所有個(gè)體都在初步診斷后36個(gè)月內(nèi)復(fù)發(fā)。
實(shí)驗(yàn)設(shè)計(jì)上的注意事項(xiàng)
RNA-Seq已成為一種研究腫瘤分子變化的常規(guī)應(yīng)用,大部分研究人員采用生產(chǎn)商的試驗(yàn)流程。rRNA的去除可提高信噪比,實(shí)現(xiàn)低表達(dá)轉(zhuǎn)錄本的檢測(cè)。
癌癥中的體細(xì)胞突變基本上是 de novo。測(cè)序不需要關(guān)于突變的先驗(yàn)知識(shí),即可準(zhǔn)確定位突變以及得到轉(zhuǎn)錄本豐度。
腫瘤通常包含各種細(xì)胞。mRNA-Seq的可延伸檢測(cè)范圍和準(zhǔn)確性對(duì)檢測(cè)微小的表達(dá)變化非常寶貴。只要腫瘤轉(zhuǎn)錄本包含了獨(dú)特的體細(xì)胞突變或剪接變異體,那么就可將它與正常的細(xì)胞區(qū)分開(kāi)來(lái)。
二代雙端對(duì)讀測(cè)序檢測(cè)基因融合的靈敏度取決于許多因素,包括表達(dá)水平、轉(zhuǎn)錄本長(zhǎng)度、所使用的樣品制備方法以及cDNA文庫(kù)的片段長(zhǎng)度。
大部分實(shí)驗(yàn)方案采用poly(A)富集的RNA制備方法來(lái)測(cè)定mRNA水平。然而,非編碼RNA,如miRNA,也在細(xì)胞的生物學(xué)中發(fā)揮重要作用,并常常介導(dǎo)對(duì)腫瘤生長(zhǎng)和存活很關(guān)鍵的過(guò)程。非編碼RNA可通過(guò)現(xiàn)有的poly(A)-(rRNA去除)實(shí)驗(yàn)方案輕松分析。
RNA表達(dá)是組織和細(xì)胞類(lèi)型特異的。在選擇腫瘤-正常對(duì)照中的對(duì)照時(shí),應(yīng)考慮這一點(diǎn)。
選擇性剪接
癌癥的生物起源、發(fā)展、轉(zhuǎn)移與轉(zhuǎn)錄組中的許多變異相關(guān)聯(lián)。癌癥特異的選擇性剪接是個(gè)普遍存在的現(xiàn)象,也是個(gè)主要的轉(zhuǎn)錄后調(diào)控機(jī)制,涉及到許多癌癥類(lèi)型。
Seo J. S., Ju Y. S., Lee W. C., Shin J. Y., Lee J. K., et al. (2012) The transcriptional landscape and mutational profile of lung adenocarcinoma. Genome Res 22: 2109-2119
作者分析了韓國(guó)200個(gè)肺腺癌。他們?cè)贚MTK2、ARID1A、NOTCH2和SMARCA4中發(fā)現(xiàn)了新的驅(qū)動(dòng)突變。他們還發(fā)現(xiàn)了45個(gè)融合基因,其中8個(gè)是嵌合的絡(luò)氨酸激酶。在17個(gè)反復(fù)發(fā)生的選擇性剪接事件中,原癌基因MET中的第14號(hào)外顯子跳過(guò)可能是癌癥驅(qū)動(dòng)因素。這項(xiàng)研究表明了這種癌癥的復(fù)雜性以及運(yùn)用幾種技術(shù)的價(jià)值。Liu J., Lee W., Jiang Z., Chen Z., Jhunjhunwala S., et al. (2012) Genome and transcriptome sequencing of lung cancers reveal diverse mutational and splicing events. Genome Res 22: 2315- 2327
作者對(duì)19個(gè)肺癌細(xì)胞系和3組肺部腫瘤/正常樣本配對(duì)開(kāi)展了全基因組測(cè)序和轉(zhuǎn)錄組測(cè)序。他們鑒定出106個(gè)與癌癥特異性的異常剪接相關(guān)的剪接位點(diǎn)突變,包括一些已知的癌癥相關(guān)基因中的突變。RAC1b是RAC1 GTP酶的一個(gè)異構(gòu)體,含有一個(gè)額外的外顯子,被認(rèn)為在肺癌中優(yōu)先上調(diào),并對(duì)MAP2K(MEK)抑制劑PD-0325901敏感。Thompson-Wicking K., Francis R. W., Stirnweiss A., Ferrari E., Welch M. D., et al. (2012) Novel BRD4-NUT fusion isoforms increase the pathogenic complexity in NUT midline carcinoma. Oncogene
這篇文章發(fā)現(xiàn)了PER-624中一種新的BRD4-NUT基因融合編碼了一種功能蛋白,它對(duì)這些細(xì)胞的致癌機(jī)制很關(guān)鍵。BRD4-NUT融合轉(zhuǎn)錄本是通過(guò)易位后的RNA剪接而產(chǎn)生的,這似乎是這些癌癥的一個(gè)共同特征。這種現(xiàn)象以及促進(jìn)融合基因的可變異構(gòu)體表達(dá)的機(jī)制,過(guò)去一直未被發(fā)現(xiàn)。
RNA編輯
在我們?nèi)梭w中,DNA和RNA序列之間的差異也被稱之為 RNA編輯,這是一種廣泛存在的現(xiàn)象。最頻繁的RNA編輯類(lèi)型是通過(guò)腺苷脫氨酶作用于RNA(ADAR)從而實(shí)現(xiàn)由腺苷到肌苷的轉(zhuǎn)換。然后緊接著,剪接和翻譯機(jī)制會(huì)將肌識(shí)別為鳥(niǎo)苷。在一些腫瘤基因組比正常基因組有著更更比例的RNA-DNA差異。
Jiang Q., Crews L. A., Barrett C. L., Chun H. J., Court A. C., et al. (2013) ADAR1 promotes malignant progenitor reprogramming in chronic myeloid leukemia. Proc Natl Acad Sci U S A 110: 1041-1046
作者發(fā)現(xiàn),慢性髓細(xì)胞白血病(CML)急變期的祖細(xì)胞有著更高的IFN-r通路基因表達(dá)以及BCR-ABL擴(kuò)增。在CML發(fā)展期間,他們還發(fā)現(xiàn)IFN應(yīng)答的ADAR1 p150亞型的表達(dá)增強(qiáng),并且腺苷-肌苷的RNA編輯增加。
MicroRNA和非編碼RNA
MicroRNA(miRNA)的長(zhǎng)度很短,大小集中在17bp-25bp之間,屬于非編碼RNA(ncRNA)家族的成員。它們調(diào)控多種不同的生物學(xué)功能,包括發(fā)育、細(xì)胞增殖、細(xì)胞分化、信號(hào)轉(zhuǎn)導(dǎo)、凋亡、代謝和細(xì)胞壽命。
通過(guò)RNA-誘導(dǎo)沉默復(fù)合物(RISC)與轉(zhuǎn)錄本的3-UTR或者與編碼區(qū)中的識(shí)別位點(diǎn)相互作用。miRNA的一個(gè)主要作用是抑制基因的轉(zhuǎn)錄后表達(dá)。在多種癌癥中,許多miRNA位于存在序列缺失刪除或擴(kuò)增的基因組區(qū)域,這表明它們很可能在癌癥的發(fā)展過(guò)程中扮演很重要的角色。miRNA的編輯位點(diǎn)已經(jīng)在近年來(lái)的研究中被發(fā)現(xiàn)了,表明RNA編輯和miRNA介導(dǎo)的調(diào)控之間可能存在著關(guān)聯(lián)。同時(shí)由于miRNA的測(cè)定簡(jiǎn)單、相對(duì)穩(wěn)定,并且在大量mRNA的控制上起作用,這就讓miRNA成為癌癥診斷以及治療期間的檢測(cè)和分期過(guò)程中極具吸引力的標(biāo)志物。
Law P. T., Qin H., Ching A. K., Lai K. P., Co N. N., et al. (2013) Deep sequencing of small RNA transcriptome reveals novel non-coding RNAs in hepatocellular carcinoma. J Hepatol
這篇文章描述了一種新的PIWI-互作RNA(piRNA)piR-Hep1,它參與了肝臟腫瘤發(fā)展。與周?chē)8闻K相比,46.6%的肝癌細(xì)胞(HCC)存在piR-Hep1表達(dá)上調(diào)。piR-Hep1的沉默抑制了細(xì)胞活力、運(yùn)動(dòng)和侵襲。作者還發(fā)現(xiàn)miR-1323在HCC中的大量表達(dá),以及它與肝硬化背景下所產(chǎn)生的腫瘤的獨(dú)特關(guān)聯(lián)。
實(shí)驗(yàn)設(shè)計(jì)上的注意事項(xiàng)
測(cè)序深度與檢測(cè)靈敏度是直接相關(guān)的。在典型的實(shí)驗(yàn)中,如果測(cè)序流動(dòng)槽(Flowcell)的一條通道(lane)只上一個(gè)樣本,那么測(cè)序深度會(huì)非常高,這能實(shí)現(xiàn)極其靈敏的檢測(cè)。基于此原因,miRNA的測(cè)序深度很少成為考慮因素。在篩查應(yīng)用中,或不需要如此高深度檢測(cè)的研究中,樣品可加上測(cè)序Index標(biāo)簽,從而能夠在同一個(gè)測(cè)序lane中上樣多個(gè)不同的樣本。需要注意的是,在設(shè)計(jì)miRNA的測(cè)序深度時(shí),要時(shí)刻記住miRNA控制基因表達(dá),因而miRNA水平的小變化可能影響許多編碼蛋白。
新發(fā)現(xiàn)的miRNA應(yīng)當(dāng)通過(guò)功能分析(如Ago2結(jié)合或敲除實(shí)驗(yàn))來(lái)確認(rèn)。
實(shí)驗(yàn)應(yīng)當(dāng)包含足夠的樣品,以便結(jié)論具有真正的統(tǒng)計(jì)意義和高的可信度。一般來(lái)說(shuō),建立一個(gè)可能的假設(shè)相對(duì)來(lái)說(shuō)是比較容易的,只要能證明miRNA存在于患者的腫瘤中,即便樣本數(shù)量不多也是足夠的。但是要真正驗(yàn)證假設(shè)就沒(méi)那么容易了,通常需要大量的患者來(lái)檢驗(yàn),并建立統(tǒng)計(jì)學(xué)可信度。目前,關(guān)于如何在測(cè)序研究中建立統(tǒng)計(jì)學(xué)可信度和多重檢驗(yàn)糾正,還沒(méi)有特別公認(rèn)的方法。當(dāng)前基于測(cè)序的miRNA分析并沒(méi)有實(shí)現(xiàn)miRNA表達(dá)的絕對(duì)定量,而僅是不同miRNA(如腫瘤-正常配對(duì))的相對(duì)量。
樣品分層是癌癥樣品的一個(gè)問(wèn)題。一個(gè)特定的癌癥表型可能代表幾種不同的病因和機(jī)理。為了要進(jìn)行嚴(yán)格的分析,應(yīng)當(dāng)有足夠多的樣品量,從而能夠充分代表每個(gè)腫瘤亞型。而miRNA的表達(dá)會(huì)隨著腫瘤的發(fā)展而變化,因此在實(shí)驗(yàn)設(shè)計(jì)時(shí)應(yīng)建立腫瘤分期和分級(jí)。
RNA-蛋白結(jié)合(CLIP-Seq)
在人類(lèi)細(xì)胞中,大多數(shù)mRNA(或前體mRNA)與核不均一性核糖蛋白(hnRNP)相結(jié)合,形成大的hnRNP-RNA復(fù)合物。hnRNA蛋白在RNA加工的所有關(guān)鍵環(huán)節(jié)中都發(fā)揮重要作用,包括前體mRNA剪接以及mRNA出核、定位、翻譯和穩(wěn)定性。幾十種RNA結(jié)合蛋白(RBP)和基因的hnRNP蛋白與癌癥相關(guān)聯(lián)。
RNA-蛋白的相互作用可通過(guò)交聯(lián)免疫沉淀測(cè)序(CLIP-Seq)來(lái)測(cè)定。在CLIP-Seq中,細(xì)胞經(jīng)過(guò)紫外線處理,讓RBP與RNA復(fù)合物共價(jià)交聯(lián)。細(xì)胞隨后被裂解,RBP-RNA復(fù)合物被免疫共沉淀,從而測(cè)序相應(yīng)的RNA。
Wilbert M. L., Huelga S. C., Kapeli K., Stark T. J., Liang T. Y., et al. LIN28 binds messenger RNAs at GGAGA motifs and regulates splicing factor abundance. Mol Cell 48: 195-206
LIN28是個(gè)保守的RNA結(jié)合蛋白,它與多能性、重編程和腫瘤的形成相關(guān)。在各種不同的癌細(xì)胞和原發(fā)腫瘤組織中都發(fā)現(xiàn)LIN28的異常上調(diào)。在這篇文章中,作者利用CLIP-Seq鑒定了大約四分之一分布于人類(lèi)轉(zhuǎn)錄本中LIN28的結(jié)合位點(diǎn)。從這些結(jié)合位點(diǎn)中他們發(fā)現(xiàn),LIN28與mRNA中富含環(huán)結(jié)構(gòu)的GGAGA序列結(jié)合。同時(shí)還發(fā)現(xiàn)了,LIN28的表達(dá)能夠?qū)е驴勺兗羟兄械南掠巫兓?/p>
表觀遺傳和甲基化
癌癥發(fā)展過(guò)程中的表觀遺傳改變與異常的基因表達(dá)相關(guān)聯(lián)。近期的研究證據(jù)表明,表觀遺傳上的改變可能在癌癥 起始中 發(fā)揮作用。表觀遺傳的控制是通過(guò)多個(gè)不同過(guò)程進(jìn)行介導(dǎo)的,包括DNA修飾(甲基化或乙酰化)、組蛋白修飾和核小體重塑。發(fā)現(xiàn)控制表觀基因組的基因發(fā)生突變,在人類(lèi)癌癥中是一個(gè)相當(dāng)普遍的現(xiàn)象。NGS測(cè)序技術(shù)提供了一整套工具,可定位突變并測(cè)定它們對(duì)癌癥發(fā)展的影響。
癌癥中表觀遺傳修飾物的基因突變。在不同類(lèi)型的癌癥中經(jīng)常觀察到三類(lèi)表觀遺傳修飾物發(fā)生突變,這突出了遺傳學(xué)和表觀遺傳學(xué)之間的串?dāng)_。表觀遺傳修飾物的突變有可能引起癌癥的全基因組表觀遺傳改變。了解遺傳和表觀遺傳變化的關(guān)系將為癌癥治療提供新的見(jiàn)解。
DNA修飾
DNA修飾目前可以很容易地通過(guò)多種技術(shù)來(lái)進(jìn)行測(cè)定。不同技術(shù)的選擇取決于所需的通量和分辨率。
Bert S. A., Robinson M. D., Strbenac D., Statham A. L., Song J. Z., et al. Regional activation of the cancer genome by long-range epigenetic remodeling. Cancer Cell 23: 9-22
文章作者通過(guò)協(xié)同的長(zhǎng)距離表觀遺傳激活(LREA)技術(shù),鑒定出一種結(jié)構(gòu)域基因去調(diào)控的機(jī)制。這些區(qū)域通常會(huì)跨越1Mb的基因組長(zhǎng)度,包括關(guān)鍵癌基因、microRNA和癌癥的生物標(biāo)志物基因。LREA結(jié)構(gòu)域中基因啟動(dòng)子的特點(diǎn)是活性染色體標(biāo)記的的獲得和抑制標(biāo)記的丟失。Brastianos P. K., Horowitz P. M., Santagata S., Jones R. T., McKenna A., et al. Genomic sequencing of meningiomas identifies oncogenic SMO and AKT1 mutations. Nat Genet 45: 285-289
為了鑒定和驗(yàn)證腦膜瘤中的體細(xì)胞遺傳改變,作者對(duì)17個(gè)腦膜瘤進(jìn)行了全基因組或外顯子組測(cè)序,并對(duì)另外48個(gè)腫瘤進(jìn)行了靶向測(cè)序。他們所觀察到的突變譜是分布廣泛,但他們證實(shí)了43%的腫瘤中存在病灶NF2失活,并在另外8%的腫瘤中發(fā)現(xiàn)表觀遺傳修飾物的改變。Duncan C. G., Barwick B. G., Jin G., Rago C., Kapoor-Vazirani P., et al. A heterozygous IDH1R132H/WT mutation induces genome-wide alterations in DNA methylation. Genome Res 22: 2339-2355
腦膠質(zhì)瘤、急性骨髓性白血病和軟骨瘤中經(jīng)常發(fā)生NADP+依賴的異檸檬酸脫氫酶IDH1和IDH2的單等位點(diǎn)基因點(diǎn)突變。作者表明,IDH1R132H等位基因的雜合表達(dá)足以誘導(dǎo)這些腫瘤特有的以DNA甲基化為特征的全基因組改變。這說(shuō)明了IDH1R132H/WT突變體是推動(dòng)人類(lèi)癌細(xì)胞的表觀遺傳不穩(wěn)定性的原因。Zhang J., Benavente C. A., McEvoy J., Flores-Otero J., Ding L., et al. A novel retinoblastoma therapy from genomic and epigenetic analyses. Nature 481: 329-334
視網(wǎng)膜母細(xì)胞瘤是一種發(fā)生于視網(wǎng)膜的侵襲性兒童癌癥,由RB1失活所引發(fā),但潛在機(jī)理仍然未知。在此類(lèi)高度侵襲性的癌癥中,許多基因都參與其中,但RB1是唯一的已知發(fā)生突變的癌基因。與有限的體細(xì)胞突變不同,相對(duì)正常的成視網(wǎng)膜細(xì)胞,腫瘤的甲基化圖譜表現(xiàn)出巨大的改變。最驚人的結(jié)果之一是人視網(wǎng)膜母細(xì)胞瘤中原癌基因脾絡(luò)氨酸激酶(SYK)的誘導(dǎo)表達(dá)。SYK是腫瘤細(xì)胞生存所必需的。研究人員接著表明,小分子抑制劑對(duì)SYK的抑制導(dǎo)致培養(yǎng)和體內(nèi)的視網(wǎng)膜母細(xì)胞瘤的細(xì)胞死亡。
實(shí)驗(yàn)設(shè)計(jì)上的注意事項(xiàng)
每種組織和細(xì)胞類(lèi)型都有著獨(dú)特的甲基化模式;因此必須獲得感興趣的組織以便分析。癌癥研究中,腫瘤組織-癌旁正常組織的配對(duì)可簡(jiǎn)化分析。
通過(guò)重亞硝酸氫鹽測(cè)序所產(chǎn)生的超大量CpG標(biāo)志物很難解釋,且可靠的統(tǒng)計(jì)學(xué)分析目前仍然困難重重。不過(guò),下面一些實(shí)際的方法可簡(jiǎn)化分析:
- RRBS-Seq通過(guò)限制覆蓋度而簡(jiǎn)化分析;
- 綜合分析大大改善了結(jié)果的可解釋性。例如,將表達(dá)分析與甲基化分析相結(jié)合,讓我們可專注于表達(dá)水平改變的基因;
- 將分析限制在某個(gè)感興趣的基因或區(qū)域中。這種方法對(duì)GWAS的后續(xù)研究很有效,也適合已有實(shí)驗(yàn)證據(jù)說(shuō)明目的區(qū)域存在基因調(diào)控或染色質(zhì)重塑的研究。與降低代表性的方法不同。這種方法實(shí)現(xiàn)了更多區(qū)域的分析,因此可獲得更多信息。
組織培養(yǎng)物應(yīng)當(dāng)謹(jǐn)慎使用。隨著時(shí)間的推移和組織增殖,培養(yǎng)物的甲基化水平可能已經(jīng)改變,不大能代表原先的組織樣本。
組蛋白修飾
組蛋白修飾通常指的是甲基化和乙酰化。組蛋白H3K9、H3K27和H4K20的甲基化與基因轉(zhuǎn)錄的抑制相關(guān),而H3K4和H3K36的三甲基化與活性轉(zhuǎn)錄的染色質(zhì)相關(guān)。組蛋白乙酰化幾乎總是與染色質(zhì)可接近性和轉(zhuǎn)錄活性水平的增高相關(guān)。通過(guò)操控染色質(zhì)狀態(tài)和DNA可接近性,表觀遺傳修飾在各個(gè)發(fā)育階段、組織類(lèi)型和疾病中都對(duì)基因表達(dá)的控制起著關(guān)鍵作用。
Wilkinson A. C., Ballabio E., Geng H., North P., Tapia M., et al. (2013) RUNX1 is a key target in t(4;11) leukemias that contributes to gene activation through an AF4-MLL complex interaction. Cell Rep 3: 116-127
這篇文章報(bào)道了一種轉(zhuǎn)化機(jī)制,其中兩個(gè)致癌融合蛋白合作激活目的基因,然后調(diào)節(jié)其下游產(chǎn)物的功能。
實(shí)驗(yàn)設(shè)計(jì)上的注意事項(xiàng)
每種組織和細(xì)胞類(lèi)型都有著獨(dú)特的甲基化模式;因此必須獲得目的組織以便分析。
組蛋白修飾可以通過(guò)各種ChIP-Seq方法進(jìn)行檢測(cè),原理是通過(guò)抗體與目標(biāo)甲基化組蛋白進(jìn)行特異結(jié)合。
同樣,組織培養(yǎng)物應(yīng)當(dāng)謹(jǐn)慎使用。隨著時(shí)間的推移和組織增殖,培養(yǎng)物的甲基化水平可能已經(jīng)改變,不大能代表原先的組織樣本。
染色質(zhì)結(jié)構(gòu)與重排
染色體重排需要DNA雙鏈斷裂的形成和連接。這些事件的發(fā)生,會(huì)破壞基因組的完整性,并經(jīng)常在白血病、淋巴瘤和肉瘤中觀察到。并且特定基因間的反復(fù)的基因融合在不同的個(gè)體中均觀察到,這表明這些基因一定在細(xì)胞周期中的某個(gè)階段他們之間的物理位置非常接近。
這是一個(gè)設(shè)想的三維、具有轉(zhuǎn)錄活性的復(fù)合物,它包含了致密的環(huán)化位置。這個(gè)示意圖是基于檢測(cè)到的成環(huán)事件,并假設(shè)所有成環(huán)事件都能發(fā)生在單個(gè)細(xì)胞內(nèi)。在這個(gè)模型中,所有小環(huán)匯集到一個(gè)共同的核心(藍(lán)色球)。環(huán)降低了轉(zhuǎn)錄活性復(fù)合物的物理大小,從而推動(dòng)轉(zhuǎn)錄因子接近待定的基因組位點(diǎn)。
檢測(cè)染色質(zhì)相互作用。在三維空間中,相同或不同染色體上遠(yuǎn)端的基因組區(qū)域相互作用,而這種相互作用是由一個(gè)或多個(gè)DNA結(jié)合蛋白介導(dǎo)的。a) ChIP-Seq 利用染色質(zhì)免疫共沉淀來(lái)鑒定DNA和蛋白的相互作用。人們采用各種DNA-片段化方法和核酸外切酶,來(lái)縮小片段的大小分布。b)染色質(zhì)構(gòu)像捕獲實(shí)驗(yàn)利用一個(gè)連接步驟將互作的染色質(zhì)片段相連接。這種方法可鑒定與遙遠(yuǎn)序列相結(jié)合的蛋白。c)配對(duì)末端標(biāo)簽測(cè)序分析染色質(zhì)相互作用(ChIA-PET)同樣也利用連接步驟來(lái)檢測(cè)染色質(zhì)相互作用,將不相鄰的互作區(qū)域配對(duì)。然而,ChIA-PET利用染色質(zhì)免疫共沉淀(ChIP)步驟,只能鑒定特定蛋白的相互作用,如RNA聚合酶II。
參考文獻(xiàn)
Papantonis A., Kohro T., Baboo S., Larkin J. D., Deng B., et al. TNFalpha signals through specialized factories where responsive coding and miRNA genes are transcribed. EMBO J 31: 4404- 4414
作者利用測(cè)序以及染色體構(gòu)像捕獲(3C)和ChIA-PET表明,TNF_alpha誘導(dǎo)響應(yīng)基因聚集在分散的『NF-B工廠』。一些『工廠』還專門(mén)轉(zhuǎn)錄編碼miRNA的響應(yīng)基因,這些miRNA靶定下調(diào)的mRNA。Rocha P. P., Micsinai M., Kim J. R., Hewitt S. L., Souza P. P., et al. Close proximity to Igh is a contributing factor to AID-mediated translocations. Mol Cell 47: 873-885
細(xì)胞核組織可決定『脫靶』活性以及融合伴侶的選擇。這項(xiàng)研究表明,絕大多數(shù)已知的活化誘導(dǎo)胞嘧啶核苷脫氨酶(AID)介導(dǎo)的Igh轉(zhuǎn)位伴侶在類(lèi)型轉(zhuǎn)換過(guò)程中與此位點(diǎn)接觸的染色體結(jié)構(gòu)中被發(fā)現(xiàn)。此外,這些相互作用結(jié)構(gòu)域可用來(lái)鑒定被AID靶定的其他基因。Theodoratou E., Montazeri Z., Hawken S., Allum G. C., Gong J., et al. Systematic meta- analyses and field synopsis of genetic association studies in colorectal cancer. J Natl Cancer Inst 104: 1433-1457
這篇研究文章表明,T細(xì)胞特異的轉(zhuǎn)錄因子GATA3在介導(dǎo)增強(qiáng)子接近調(diào)控區(qū)域上扮演了重要角色,這些調(diào)控區(qū)域參與了雌激素受體(ESR1)介導(dǎo)的轉(zhuǎn)錄。GATA3沉默導(dǎo)致在雌激素刺激之前輔助因子和活性組蛋白標(biāo)記的整體重新分配。Hakim O., Resch W., Yamane A., Klein I., Kieffer-Kwon K. R., et al. (2012) DNA damage defines sites of recurrent chromosomal translocations in B lymphocytes. Nature 484: 69-74
作者發(fā)現(xiàn),在培養(yǎng)的小鼠B淋巴細(xì)胞中,缺乏經(jīng)常性的DNA損傷時(shí),Igh或Myc與其他所有基因之間的易位與它們的接觸頻率直接相關(guān)。反過(guò)來(lái),與經(jīng)常性位點(diǎn)指向的DNA損傷相關(guān)的易位與DNA斷裂形成的速率成正比。他們認(rèn)為,非定向重排反映了細(xì)胞核結(jié)構(gòu),而DNA斷裂形成決定了包括驅(qū)動(dòng)B細(xì)胞惡性腫瘤在內(nèi)的經(jīng)常性易位的位置和頻率。
綜合分析(多組學(xué)分析)
所有的生物過(guò)程都是相互關(guān)聯(lián)的,而在癌細(xì)胞發(fā)生過(guò)程的任何一個(gè)變化都會(huì)影響其他所有過(guò)程。突變可能影響所表達(dá)的活性,繼而又影響DNA甲基化,再就影響其他許多基因的表達(dá)等等一連串的反應(yīng)。每個(gè)個(gè)體都有著大量的特有突變,再加上這一連串的事件,能夠讓人們深入研究各種用于區(qū)分癌癥的疾病表型。綜合分析可以使揭示癌癥生物學(xué)的真正復(fù)雜性向前邁進(jìn)了一步。研究人員如今能夠檢測(cè)大部分的單個(gè)過(guò)程,但認(rèn)識(shí)和治療癌癥的真正進(jìn)步將來(lái)自于對(duì)所有這些過(guò)程的綜合分析,也就是常說(shuō)的多組學(xué)分析。
參考文獻(xiàn)
Weischenfeldt J., Simon R., Feuerbach L., Schlangen K., Weichenhan D., et al. (2013) Integrative genomic analyses reveal an androgen-driven somatic alteration landscape in early-onset prostate cancer. Cancer Cell 23: 159-170
作者發(fā)現(xiàn),早發(fā)性前列腺癌的形成涉及到雄激素驅(qū)動(dòng)的結(jié)構(gòu)重排。相比之下,老年發(fā)病的前列腺癌積累了非雄激素相關(guān)的結(jié)構(gòu)重排,表明一種不同的腫瘤形成機(jī)制。Cowper-Sal lari R., Zhang X., Wright J. B., Bailey S. D., Cole M. D., et al. (2012) Breast cancer risk- associated SNPs modulate the affinity of chromatin for FOXA1 and alter gene expression. Nat Genet 44: 1191-1198
作者表明,與乳腺癌風(fēng)險(xiǎn)相關(guān)的SNP集中在FOXA1和ESR1的順?lè)唇M(cistrome),以及組蛋白H3賴氨酸4單甲基化(H3K4me1)的表觀基因組。大多數(shù)的風(fēng)險(xiǎn)相關(guān)SNP調(diào)控FOXA1在遠(yuǎn)端調(diào)控元件的染色質(zhì)親和力,這導(dǎo)致等位基因特異的基因表達(dá)。Peifer M., Fernandez-Cuesta L., Sos M. L., George J., Seidel D., et al. (2012) Integrative genome analyses identify key somatic driver mutations of small-cell lung cancer. Nat Genet 44: 1104-1110
作者發(fā)現(xiàn)了TP53和RB1失活的證據(jù),并在編碼組蛋白修飾物的基因中發(fā)現(xiàn)了反復(fù)的突變。此外,他們還在PTEN、SLIT2和EPHA7中觀察到突變,以及FGFR1絡(luò)氨酸激酶基因的病灶擴(kuò)增。這種綜合分析表明,組蛋白修飾可能與小細(xì)胞肺癌(SCLC)有關(guān)。
技術(shù)參考
一個(gè)良好的實(shí)驗(yàn)設(shè)計(jì)可以提高技術(shù)性能,從而產(chǎn)生最易解釋和可靠的結(jié)果。這里重點(diǎn)強(qiáng)調(diào)研究人員在設(shè)計(jì)實(shí)驗(yàn)時(shí)必須牢記的生物學(xué)和技術(shù)的特性。
癌癥中的實(shí)驗(yàn)設(shè)計(jì)面臨一些獨(dú)特的挑戰(zhàn)。典型的腫瘤樣本包含兩個(gè)基因組:遺傳自父母的生殖細(xì)胞系(germline)和在疾病發(fā)展過(guò)程中積累的體細(xì)胞突變(somatic mutations)。腫瘤細(xì)胞在樣本中的比例可能在10%-100%之間。腫瘤基因組也是動(dòng)態(tài)的,會(huì)快速積累 de novo 突變。因此,每一個(gè)腫瘤中又可能同時(shí)包含幾個(gè)克隆亞型。
目前大部分已發(fā)表研究的樣本量都非常小,可被視為僅是提出了相關(guān)的假說(shuō)。而隨著越來(lái)越多的測(cè)序信息被我們所獲得,大部分癌癥類(lèi)型可根據(jù)其分子表型,被分成多個(gè)亞群。這嚴(yán)重降低了實(shí)驗(yàn)的能力,并增加了嚴(yán)格分析所需的樣本數(shù)量。部分解決這一難題的方案是在探索階段利用全基因組測(cè)序來(lái)尋找新的突變。在第二階段,利用全外顯子組或靶向測(cè)序來(lái)確認(rèn)新發(fā)現(xiàn)的這些突變,并確定他們?cè)诖笮完?duì)列中的豐度。然而,在未來(lái),統(tǒng)計(jì)學(xué)上嚴(yán)謹(jǐn)?shù)娜蚪M測(cè)序?qū)嶒?yàn)有可能是非常大的,需要數(shù)千個(gè)樣本。
使用NGS測(cè)序技術(shù)進(jìn)行深度測(cè)序是指多次生成定位到同一區(qū)域的序列片段,有時(shí)達(dá)上百次。但由于每條序列片段是從單個(gè)DNA分子中產(chǎn)生的,故提高深度測(cè)序能夠?qū)崿F(xiàn)原始樣品中低至1%的克隆的檢測(cè)。比較同一個(gè)體的腫瘤和癌旁正常組織的序列,我們可以很容易識(shí)別浸潤(rùn)組織的序列片段。最佳的讀取深度將取決于癌癥類(lèi)型和所需的靈敏度,但一般建議為正常基因組最低為40倍的覆蓋深度,而癌癥基因組需要80倍以上的覆蓋深度。在腫瘤高度異質(zhì)時(shí),可能需要腫瘤不同部位的多次活檢,才能包含所有的細(xì)胞類(lèi)型。
在這個(gè)假定的例子中,腫瘤含有兩個(gè)癌癥克隆和鄰近組織。腫瘤樣本中正常細(xì)胞所產(chǎn)生的序列(圖中:比對(duì)中的前兩個(gè)序列)可通過(guò)與鄰近正常組織所產(chǎn)生的序列比較后確定。腫瘤樣本中的剩余序列可分為兩組,分別代表主要和次要的腫瘤克隆。次要克隆,若不及時(shí)治療,可能在復(fù)發(fā)時(shí)成為腫瘤的主要組分。在實(shí)際分析中,腫瘤樣本至少要有40倍的覆蓋深度,并覆蓋靶定的基因集合、全外顯子組或全基因組。
檢測(cè)癌癥基因組中的體細(xì)胞突變通常有三種方法:全基因組測(cè)序、全外顯子組測(cè)序和靶向基因測(cè)序。下表簡(jiǎn)要介紹了每種方法的有點(diǎn)和缺點(diǎn)。在比較多發(fā)性骨髓瘤的全基因組和外顯子組測(cè)序時(shí),半數(shù)的蛋白編碼突變通過(guò)染色體畸變(如易位)而存在,其中大部分不能單獨(dú)被外顯子組測(cè)序而發(fā)現(xiàn)。靶向重測(cè)序是一種有用的技術(shù),可收錄超大隊(duì)列中已知癌癥相關(guān)基因的突變。從長(zhǎng)遠(yuǎn)來(lái)看,隨著我們對(duì)基因組的了解日益加深,并且我們處理和解釋大型數(shù)據(jù)集的能力的提高,全基因組測(cè)序無(wú)疑是最好的腫瘤分子鑒定方法。而在短期內(nèi),靶向基因測(cè)序可為患者匹配出市場(chǎng)上已有的藥物,讓他們立刻受益。
參考來(lái)源
Illumina cancer research