日期:2019年2月9日——2019-Week6
分類:「思路,方法」
題目:An integrated chromatin accessibility and transcriptome landscape of human pre-implantation embryos
DOI: https://www.nature.com/articles/s41467-018-08244-0.pdf
雜志: Nature Communications , 21 January 2019
關鍵詞: LiCAT-seq, embryonic genome activation (EGA), chromatin accessibility (CA), gene expression (GE)
介紹
這篇文章研究的是植入前胚胎的染色質可及性和轉錄組圖譜,這個生物學問題去年也發表過一些高質量的文章,如:
- Li L., et al. Single-cell multi-omics sequencing of human early embryos. Nat.
Cell Biol. 20, 847–858 (2018).- Wu, J. et al. Chromatin analysis in human early development reveals
epigenetic transition during ZGA. Nature 557, 256 (2018).- Gao, L. et al. Chromatin accessibility landscape in human early embryos and its association with evolution. Cell 173, 248–259. e215 (2018).
那么這篇文章有什么創新和獨特的地方,以及有什么不足的地方?
- 首先這篇文章報道了一種新的方法 LiCAT-seq
LiCAT-seq可以用于微量細胞同時分析染色質的可及性和基因表達圖譜的方法。 - 發現了在人類植入前胚胎發育過程中,DUX4誘導了EGA基因和 MLT2A1元件處染色質結構的重塑。
關于DUX4在EGA過程中扮演的重要作用,之前也有研究報道,這篇文章從數據分析的角度補充了DUX4調控的細節,揭示了DUX4結合的一些基因,并且發現了內源性逆轉錄病毒在與DUX4的結合,這個結果雖說不是新的發現,但是補充完善了以前的機制,但是缺乏實驗驗證,整篇文章沒有實驗驗證得出來的結論,這是這篇文章的一個不足。 - 提供了完整的代碼和數據資源
LiCAT-seq的介紹
首先裂解分離mRNA和細胞核,然后對mRNA和染色質可及性平行建庫,之后轉錄組用Smart-seq2單細胞轉錄組測序,ATAC-seq建庫測序的方法他們做了些優化,LiCAT-seq可實現最少可用于10個細胞的建庫和分析的目的。
技術上的優化主要是以下兩個方面:
- Tn5轉座酶標記后充分裂解細胞核
- 預擴增后使用Tn5接頭的引物純化基因組DNA
轉錄組和染色質可及性圖譜的整體變化
他們主要關注從受精卵( zygote)到囊胚(blastocyst )時期以及卵母細胞(oocytes)和精子( sperm)時期轉錄組和染色質可及性圖譜的變化。受精卵到囊胚經歷了2、4、8細胞和桑葚胚(morula),其中囊胚時期細分為內細胞團(ICM)和滋養外胚層(TE)。所以共包括9個時期。
他們通過對ATAC-seq peaks數目的統計觀察到從2細胞到胚胎發育晚期,染色質可及性的區域逐漸增多,卵子時期染色質可及性區域非常少,只有54個peaks,但是精子的染色質可及性卻明顯不同,開放區域還是較多的,有趣的是受精卵時期的染色質可及性出現短暫的增強。他們進一步比較了精子和卵子時期染色質可及性的區域重合部分很少,而且精子的開放區域分布在gene-poor區域,與其他時期明顯不同(fig 1d), 在卵子和胚胎發育其他時期reads數和gene數成正比,精子展現出相反的規律(fig 1e),精子染色質可及性區域的gene數目少的特征可能對母本的TFs的結合至關重要,從而促使完成父本的重編程。
另外他們也用Y叔ChIPseeker R包對開放區域的基因組分布特征做了統計,并用PCA對ATAC-seq和RNA-seq數據分析,觀察胚胎發育每個時期變化的關系。
聚類然后分析每個模塊的轉錄組和染色質可及性圖譜
胚胎基因組的激活( embryonic genome activation ,EGA)是胚胎植入前發育的重要事件。為了探究染色質可及性對EGA的影響作用,作者采用Mfuzz的聚類方法,將2細胞到桑葚胚時期的CA圖譜聚成6類。
他們主要關注EGA中上調的基因,并將上調的基因與CA每個cluster相匹配觀測啟動子與遠端區域的染色質可及性的變化,總體上CA和GE動態變化展現出相似的趨勢。另外他們還挑選出特定的基因展示了CA和GE的變化。
整合RNA-seq和 ATAC-seq分析轉錄因子
用Homer鑒定胚胎發育每個時期染色質可及性差異區域的關鍵轉錄因子,如圖a所示,展示了每個時期特異的轉錄因子的富集信號和基因表達水平。之前的研究報道過DUX4在EGA過程中發揮著重要的作用,但是缺乏人植入前胚胎的表觀數據,對DUX4如何調控其靶基因的機制并不是很清晰,因此,他們接下來主要關注DUX4在EGA過程中發揮作用的機制。
從轉錄組數據他們發現DUX4, NFY 和SP1在4細胞時期表達量高,在隨后的時期急劇減少。那么DUX4的結合與染色質可及性有什么關系呢?他們接下來通過DUX4的ChIP-seq數據,發現DUX4在2細胞和4細胞時期富集信號強,隨后減少。并且發現DUX4的結合區域與CA的cluster 1重合比例最大,這也表明了DUX4在EGA起始中扮演的重要作用。
作者將DUX4結合位置的上下游10kb內的基因定義為DUX4的靶基因,然后觀察其靶基因的動態表達情況,并將表達模式歸結為3類。第1類,基因的表達在4,8細胞時期短暫升高,第2類,基因的表達在胚胎發育過程中逐漸降低,表明這些基因最初可能是母系轉錄本,第3類,基因的表達在胚胎發育過程中逐漸升高,表明DUX4可能起始了其他TFs的結合。DUX4可能通過誘導染色質結構重塑來激活EGA基因。
這一部分選擇哪個TF做進一步探究需要熟悉相關的研究進展,哪些因子的作用是已知的,哪些是未知的,是否真正發揮作用需要通過實驗驗證,文章的這一部分做的并不是很完善。
逆轉錄轉座子的染色質可及性和基因表達圖譜的分析
這一部分算是文章的一個亮點,探究了逆轉座子的染色質可及性和基因表達圖譜。
逆轉座子認為是古病毒感染的殘留物,占人類基因組的40%以上,包括LTR/ERV( long terminal repeats containing elements,termed “LTR retrotransposons” or “endogenous retroviruses (ERVs)”)和LTR-lacking elements(such as LINEs, SINEs, and SVA elements),可作為調控元件影響宿主基因的轉錄。
他們觀察到ERV元件最早的開放出現在4細胞期(如:LTR12C 和MLT2A1),另外OTX4和DUX家族的TFs在MLT2A1處顯著富集,在LTR12C未出現相同的的富集。接下來計算了人ESCs中OTX4和DUX4的結合位點與4細胞階段可接近的MLT2A1元件的交叉點,他們發現在4細胞階段30.2%的MLT2A1元件被DUX4結合,只有9.5%被OTX2結合,表面DUX4在激活MLT2A1發揮的作用強于OTX2。
以上的結果表明DUX4通過結合到MLT2A1元件來激活HERVL,這是EGA期間ERV激活的主要事件。