染色質可及性(二):ATAC-seq數據分析

0. ATAC-seq能做什么?

ATAC-seq可用于:

  • 得到在不同組織或不同條件下對應 可及性區域(NFR fragment)
  • 得到 核小體位置(Mononucleosome fragments)
  • 鑒定重要轉錄因子和生成 轉錄因子結合區域的特征(footprint)
  • 生成 表觀基因組圖譜(peaks)
NFR fragments:開放染色質中兩個核小體之間的Linker DNA片段;Mononucleosome fragment:核小體單體上結合的DNA片段;peaks:fragment組成的峰;footprint:轉錄因子足跡

ATAC-seq分析流程概覽


ATAC-seq分析流程概覽

1. ATAC-seq數據比對后質控

本文掠過 堿基質控 -->mapping-->序列篩選(去duplicated reads 和 去除線粒體基因組 )的步驟

1.1 插入片段質控

插入片段大小的分布可以用來判斷ATAC-seq實驗的質量。插入片段大小的理論分布為:NFR fragments(<100 bp)、核小體單體(~200 bp)、核小體二聚體(~400 bp)和核小體三聚體(~600 bp),每個位置上都會有對應的特征性的峰分布(如下圖)


橫坐標-片段長度;縱坐標-標準化后的reads數;兩個峰圖都大體得在100pb, 200bp, 400bp, 600bp略有峰型(箭頭標注)

1.2 TSS富集峰圖

NFR的片段(下圖:黑線實線)應該在基因的轉錄起始位點(TSS)周圍富集,而核小體結合區域的片段(下圖:紅色虛線)應該在TSS處被形成低谷


NFR的片段--黑線實線;核小體結合區域的片段--紅色虛線

2. Shifting reads

由于Tn5是以二聚體的方面結合到染色體上的,其跨度大致是9bp,在分析的時候便需要回補這個9bp的堿基差。具體的做法是將正鏈和負鏈,reads應分別偏移 +4 bp和 -5 bp,以便實現TF足跡和基序的堿基對相關分析。

3. Peak Calling

許多ChIP-seq數據的Peak calling軟件可以用于ATAC-seq數據,而 ENCODE 項目 選擇MACS2作為ATAC-seq的標準Peak calling軟件。為了保持數據一致可對比,很多研究者也都采用MACS2軟件。Peak calling的結果通常以bed格式或bdg格式進行展示。

ENCODE項目(Encyclopedia of DNA Elements,DNA元件百科全書)是一個由美國國家人類基因組研究所(NHGRI)在2003年9月發起的一項公共聯合研究項目,旨在找出人類基因組中所有的功能組件。這是繼完成 “人類基因組計劃” 后國家人類基因組研究所開始的最重要的項目之一。

Peak Calling軟件根據原理主要分為兩大類:Count-based方法和Shaped-based方法。一般Count-based方法的軟件更易于使用和解釋結果。這些軟件采用不同的統計方法比較目標區域和隨機背景區域的reads分布形狀。其中HMMRATAC是專門為ATAC-seq開發的軟件,除了比較占用內存之外,其性能還是很不錯的。

Peak calling軟件匯總:Count-based方法的軟件結果表現差異不大,但Shaped-based方法的軟件結果與Count-based軟件結果非常不同

4. Peak differential analysis

目前沒有專門為ATAC-seq開發的差異peak分析軟件。差異peak分析首先通過尋找候選區域(共有peak或根據bin劃分的基因組),然后標準化后對這些區域內的片段進行計數,最后在相同坐標內與其他處理條件的樣本進行統計學比較。


Peak differential analysis相關工具

5. Peak annotation

一般情況下,軟件會關聯Peak與 “距離其最近的基因” 或者 “調控元件” 來進行peak注釋, HOMER、ChIPseeker、ChIPpeakAnno等軟件都可以把peak分配到最近或重疊的基因、外顯子、內含子、啟動子、5'UTR、3’UTR和其他基因組功能區。隨后可以用GO、KEGG、Reactome等數據庫做peak關聯基因功能富集分析。

6. Motif 相關分析

開放的染色質區域一般可以結合特定的轉錄因子進而影響轉錄過程,轉錄因子識別的DNA序列即為motif。對motif的分析包括 motif富集分析轉錄因子footprint分析

6.1 motif富集分析

目前適用最普遍的motif數據庫是JASPAR數據庫,其中收錄了很多物種的motif數據。
首先獲得每個peak區域里的motif位置和頻率,然后與隨機背景或另一種條件的背景進行比較,最后得到motif富集的結果。

6.2 轉錄因子footprint分析

轉錄因子footprit 是指一個轉錄因子結合在DNA上,阻止Tn5酶切割,在染色質開放區域留下一個相對缺失的位置。
目前該分析需要解決的3個問題:
(1)建庫時Tn5酶切會產生9bp的粘性末端切口,經過末端修復補齊后,原始reads在預處理時經過移位才可以準確檢測到footprint(前面介紹的軟件已經解決)
(2)Tn5酶切具有5‘端偏好性
(3)某些瞬時結合的轉錄因子footprint信號比較弱

目前轉錄因子footprint分析根據算法分為兩類: de novo 和 motif-centric

  • de novo:該類型的軟件需要通過理論計算來鑒別轉錄因子的footprint信息,并且消除Tn5酶切時的5’偏好性。目前只有HINT-ATAC可以處理ATAC-seq數據特有的偏好性。該方法在一些低質量和新發現的一些motif上具有優勢。
  • Motif-centric:此類方法主要關注已知TF的結合位點,主要軟件有MILLIPEDE、DeFCoM等。聯合ChIP-seq數據的Motif-centric方法在footprint分析上優于de nove的方法,但是這些ChIP-seq數據來源于特定的轉錄因子和特定的細胞類型,通用性并不強。

Postscript: ATAC-seq數據可以通過聯合分析RNA-seq數據來發現哪些差異表達的基因是受染色質可及性調控的,進一步可以推測這些差異表達的基因哪些是受開放染色質中具有motif和footprint的轉錄因子調控的,因此ATAC-seq與RNA-seq的聯合分析有助于破譯基因調控網絡和細胞異質性。

參考鏈接:http://www.lxweimin.com/p/77462a146e29
參考文獻:From reads to insight: a hitchhiker’s guide to ATAC-seq data analysis

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 229,565評論 6 539
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 99,115評論 3 423
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 177,577評論 0 382
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 63,514評論 1 316
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 72,234評論 6 410
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,621評論 1 326
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,641評論 3 444
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,822評論 0 289
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 49,380評論 1 335
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 41,128評論 3 356
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 43,319評論 1 371
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,879評論 5 362
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,548評論 3 348
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,970評論 0 28
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 36,229評論 1 291
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 52,048評論 3 397
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 48,285評論 2 376

推薦閱讀更多精彩內容