首先,在進入正題之前,有必要介紹一下TCGA(The Cancer Genome Atlas)數據庫的建立,和它帶給腫瘤學研究的歷史性變革(PS:用四個堿基的縮寫來命名這個項目真是不能再妙了?。?。直白的說, 進入21 世紀以來,個性化醫療的產生使人類對腫瘤的診斷和治療早已不再停留在簡單的表觀階段,人們渴望通過“上帝視角”來探索腫瘤產生和轉移的根本基因學根源,而Next-generation sequencing 的發展使得高效的全基因組測序成為了可能。在這樣的大背景下,NCI和 NHGRI 在2005 年發起了 TCGA project,在十多年的歷程中,TCGA收錄了美國和加拿大地區 11,000 多個病人樣本,涵蓋33 個腫瘤亞型,約 2.5 PB 的腫瘤樣本高通量基因組測序結果。生物信息分析結合收錄的病人診斷和治療信息,腫瘤病理學信息,對腫瘤學的研究推進可以說是質的飛躍。在這之后,多個國家先后發起了類似的項目,于是在人類用智慧與腫瘤做斗爭的同時,也隨之產生了很多意外而有意思的發現。
1. 偽裝者:披著乳腺癌外表的”卵巢癌“
之所以把它放在第一位,那是因為它可是TCGA 宣傳手冊上的官方事例,原文的描述是"surprising new
findings"。這篇文章的出處是 2012 年TCGA 團隊在 Nature 上發表的對乳腺癌亞型的綜合分析。原文請戳Comprehensivemolecular portraits of human breast tumours.
在個性化醫療發展之前,人們在給腫瘤下定義時,一般都會習慣性把一個器官或者組織上發生的腫瘤歸為一類,無論亞型一不一致,診斷或者治療都會在這個大背景下去展開。例如在乳腺癌中,有四種病理學亞型Luminal A, Luminal B, HER2+, Basal-like. 前兩者一般都有高ER 和 PR 表達,于是Hormone therapy 再合適不過,HER2+ 腫瘤的治療也隨著單抗類藥物Herceptin 的研發而逐漸明朗,但是basal-like(三陰性)乳腺癌確一直找不到一個明確的治療方法,更多時候只是普通的化療。簡單地說,在這項研究中,科學家通過相關性分析,發現Basal-like 這一亞型的基因表達譜和其他三種亞型大相徑庭,但是卻和惡性卵巢癌和鱗狀上皮肺癌組織的基因表達有著高度的相似性。
[if !vml]
[endif]
這圖來自原文的Figure5b,四列是 TCGA 對四種乳腺癌亞型的基因表達,七行是來自于另一個數據庫GSE2109 中的七中不同部位腫瘤的基因表達,圖中的顏色代表這一行和這一列腫瘤組織基因表達的相關性,黃色為高度相似,藍色為高度差異。我們可以看到在Basal 這一列中,除了和乳腺癌樣本中的 Basal 部分高度相似意外,還和惡性卵巢癌,以及肺癌中鱗狀上皮亞型的那部分有著高度的基因表達相似性。但是和乳腺癌的其他亞型去比卻是一片藍。簡而言之,這個在臨床上死亡率頗高的亞型簡直就是在披著乳腺癌的外表蠱惑人心,實則和卵巢癌以及肺癌高度相似!
有什么意義?因為三陰性乳腺癌除了BRCA1/2 和 TP53 之外并沒有什么令人驚喜的driver mutation, 但是由于 gene
amplification 和信號通路的高度相似性,所以給人們的啟發是可以考慮用治療惡性卵巢癌的方法去嘗試這一亞型。其實近幾年類似的研究還有很多,例如食道癌和頭頸部癌癥也有高度相似性。
這些發現的重要意義在于,人們今后對腫瘤的分類將會不再簡單從組織和器官的亞型出發,而是直接用Gene siganture 去定義,并且至今從基因表達譜去關聯腫瘤的治療方案。
2. 蝴蝶效應:一個堿基突變引起的全基因組重編程風暴
想象一下,在你的體細胞的23 對染色體的基因組內,有著約三十億個堿基對,而三十億分之一的概率下,某一個細胞的某一個堿基發生了某一個點突變,瞬間引起了這個細胞整個基因表達譜中上萬個基因表達程度發生劇變,而劇變的后果就是造成了這個突變細胞從此開掛,在腫瘤產生和轉移的大路上勢如破竹。
這一系列驚為天人的連鎖反應,其實對于生物信息學研究者來說并不意外,但是的確讓人細思極恐。那么,一個堿基的突變是怎么產生這個蝴蝶效應的呢?
舉個我比較熟悉的例子吧,還是乳腺癌。2013年來,通過對臨床腫瘤組織的基因組測序,人們發現在雌激素受體陽性的乳腺癌樣本中,有30% 的病人樣本在芳香化酶抑制劑治療后會在雌激素受體第八個外顯子的一個特定位點出現一個熱點突變(對應雌激素受體蛋白序列上的AF2 domain)。最常見的就是 ESR1 基因DNA 上 1610 位的A 會突變為 C,而這個簡單的單一堿基突變會繼而引起雌激素受體蛋白序列發生錯義突變,第537 位的酪氨酸會突變為絲氨酸(Y537S),而這樣突變的后果就是在功能上造成了雌激素受體不依賴于雌激素的持續激活。由于雌激素受體是個著名的核內轉錄因子,整個基因組上有約100000 個雌激素受體轉錄結合元件,雌激素受體的轉錄調控對這些基因而言,有的是抑制轉錄,有的是增強轉錄,而這些基因又會去改變它們關系密切的其他基因,這樣一傳十,十傳百,上萬個基因表達量的改變可想而知。下面就放個heatmap 證明一下。
[if !vml]
[endif]
圖出自2016 年 10 月剛剛出爐的文章,Simak
Ali 課題組用 Cripsr/cas9 構建了基因組層面編輯的雌激素受體基因ESR1 上 A1610C 的突變細胞模型(Y537S),和野生型的細胞一起做了RNA 測序。熱圖很直觀,藍色代表低表達,紅色代表高表達,每一行都是一個基因。相信肉眼就能給人足夠的沖擊力,上萬個基因表達的區別僅僅來自于一個堿基的突變!
感慨一下,這就是腫瘤,一個擁有不可思議的微觀超能力,并且不斷奪走人類生命的撒旦。
3. 隱藏的殺意:沉默突變在腫瘤中不再沉默
先不多說,放一個截屏。
[if !vml]
[endif]
這是一個可以讓NCS 三大主流期刊同時發文的話題。沉默突變,顧名思義,就是堿基發生了突變,但是其編碼的氨基酸并未改變。腫瘤研究的很長一段時間里,科學家的目光都放在了錯義或者無義突變上。這本身看來非常有道理,那些經典的driver mutation 都是錯義突變導致蛋白產物功能改變的結果。沉默突變嘛,一如既往的沉默在人們的視線中。
但是,隨著高通量測序的發展,人們開始意識到,這些沉默突變明明十分危險。一個基因上的沉默突變對腫瘤生長和轉移的影響多種多樣。這里簡單舉兩個例子。
第一個例子來自于2006 年一篇 Science 的文章。A
"Silent" Polymorphism in the MDR1 Gene Changes Substrate Specificity。文章的最驚人之處在于點出了為什么沉默突變,也能造成兩個氨基酸序列一模一樣的蛋白擁有功能變化。文章關注于著名的編碼外排泵蛋白p-gp 的耐藥基因 MDR1 上點C3435T 沉默突變,他們發現這個突變的雖然沒有改變蛋白上的氨基酸序列,但是由于蛋白翻譯系統對這個密碼子的識別速度較慢,導致了整個蛋白的翻譯過程變慢,從而在內質網和高爾基體中發生折疊時的構想發生了輕微變化,最終導致了p-gp 蛋白的外排作用更強,從而使得腫瘤細胞更加耐藥。
第二個例子來自于2005 年的一篇 PNAS,(http://www.pnas.org/content/102/18/6368.short).一個意大利課題組關注了囊胞性纖維綜合癥的關鍵調控基因CFTR 位于第 12 外顯子邊緣的一個沉默突變。他們發現這個沉默突變引起蛋白改變的關鍵步驟在于成熟mRNA 的切割,由于負責 RNA 切割的內切酶無法識別這個突變后的轉錄產物,所以直接導致了第12 外顯子的所有編碼序列被全部切除,繼而蛋白也發生了失活,失去了調控元件以后一切都有利于囊胞性纖維綜合癥的惡化方向發展,腫瘤也就不期而至。
其實還有很多其他研究發現了不同的機制,例如沉默突變的引入直接改變了DNA 的甲基化,在表觀遺傳層面就發生了區別。
我們都知道腫瘤的產生離不開突變,可是面對無處不在的突變,真正的殺手實在撲朔迷離。
以上幾個比較有意思的例子,都是我在平時的研究中所碰到的,也算在此拋磚引玉。
最后,引用一句話吧。來自腫瘤基因組研究領域世界公認的領袖級科學家,英國桑格研究院(Wellome
Trust Sanger Institute)主任 Sir
Michael Stratton (在英國當一個科學家被冠以“Sir”的頭銜,已然超然世外),我有幸在2016 年的波特蘭國際乳腺癌研究大會上聽過他的報告,并和他有過交流,他當時的一句話十分有震撼力,大概的意思是:“在人基因組中只有2% 的部分編碼蛋白,但是腫瘤的突變卻涵蓋了整個基因組,有錯義的,有無義的,也有沉默的。對腫瘤的斗爭需要人們突破傳統的生物學觀念,用更加長遠而廣闊的視野去分析和看待基因組和突變。腫瘤不可怕,可怕的是停滯不前的目光。”