參考:
https://www.bilibili.com/video/BV1XJ411r7bJ/?spm_id_from=333.788.videocard.0
定義
而轉錄組測序即是利用高通量測序技術,將細胞或組織中的全部或部分mRNA, miRNA, lnc RNA 進行測序分析的技術。
RNA-seq 應用
通過RNA-seq,也就是轉錄組測序,可以幫助我們了解各種比較條件下所有基因的表達差異包括:
正常組織與腫瘤組織;
藥物治療前后的表達差異;
發育過程中,不同發育階段,不同組織的表達差異……
不僅可以檢測,RNA 表達的差異,還有RNA 結構的差異。
轉錄組的主要目的之一便是尋找 基因表達的差異
。
測序方法(Truseq-RNA)
原始RNA樣本清理
由于獲取的RNA 大部分都是rRNA,只有2%, 3% 是mRNA 及其余的lncRNA, tRNA, miRNA 等。
因此主要用于RNA-seq 測定的mRNA 只占了很小的比例。而獲得的大部分的RNA,tRNA 在各個物種和組織中是非常保守的,如果不是特別測定,一般不會得到什么有效信息。
RNA 建庫過程
介紹illumina 的Truseq-RNA 建庫方法。
1)雜交
利用真核生物mRNA 尾部PolyA 修飾的特性,進行雜交。
2)打成短序列
將磁珠回收,也就篩選出了mRNA,再對這些片段洗脫,并打成短片段。
3)逆轉錄
將短片段的RNA 進行逆轉錄,獲得第一鏈cDNA。
4)合成雙鏈
利用引物合成雙鏈cDNA。
5)連接接頭與擴增
到這一步,就和一般的基因測序一樣了。
再進行擴增,也就建立了標準的測序文庫。
接著就可以拿去測序了。
RNA 質量要求
RNA 必須要有比較高質量,因為開始的雜交是連接3' 的序列,因此如果mRNA 發生了降解,則遠離3' 端的序列就很容易被洗脫掉了。
質量檢測
根據兩個峰的質量進行打分(RIN
值,最高10分,建議8分以上),通常來說這兩個峰值越高越尖,打分越高,質量也越高。
數據分析
比對
將測序數據比對到基因組上。
質量控制
通常通過檢測比對后的RNA 分布進行判斷。
檢測RNA 片段有多少在3' 位置,又有多少在5' 位置。
如果左邊顯著不如右邊飽滿,則可能大部分的mRNA 發生了降解。
RPKM值(標準化處理)
具體計算參考:https://www.yuque.com/mugpeng/nwmnq7/cf7lm6
本質上就是一個數值的標準化處理。
差異分析
火山圖對比不同樣本的基因表達量對比。橫軸反映差異的大小,縱軸反映差異的顯著性。
相同差異大小的樣本,可能由于其樣本統計數的差異,因而造成了顯著性的差異(置信程度,結果更可信)。
聚類分析
對基因表達進行分群,可以找出它們的共同或不同特征。
富集分析
可以將差異基因富集到不同功能上,探尋它們的功能特性。
從上到下基因的功能定義越來越精準,顏色越深,其富集程度越高。
通路分析
結構變異檢測
建議測序數據在10G 以上,以保證測序的覆蓋度。
可變剪接
一般人類樣本,可以發現5000~20000個可變剪接。
融合基因
融合基因指,某個基因頭融合到了其他基因的身體上。