WGCNA:加權基因共表達網絡分析

加權基因表達網絡分析(Weighted gene co-expression network analysis, WGCNA),又叫權重基因共表達網絡分析,其根本思想是根據基因表達模式的不同,挖掘出相似表達模式的基因,定義為模塊(module)的一種算法。具有相似表達模式的基因很可能是緊密共調控的,功能緊密相關的或同一條信號通路或過程的成員,有其特定的生理意義。芯片原始數據由R語言預處理后,得到基因表達數據,然后由maSigPro包處理得到整個肝再生過程和肝癌發生發展過程中的差異表達用來構建加權基因共表達網絡。然后根據基因表達的相似性(共表達的基因)把網絡分成幾個模塊,把每個模塊和外部特征(比如時間點,病理進程等)進行關聯,同時和maSigPro結果進行對比,鑒定模塊中的關鍵基因(driver gene或hub gene),進行可視化。

1. 構建加權相關性基因網絡軟閾值的選擇

WGCNA中對基因表達值之間的相關系數取n次冪,這是和普通聚類的最大不同,其直接結果是把基因間相關性的強弱的差異放大。假如某兩對基因之間未取冪之前的相關系數差異為4倍,假如對各自相關系數取4次冪,則這種差異就變為256倍,強弱關系分明。對每兩對基因(ij)之間的相關系數的冪取某特定的值β,以此來計算所有基因之間的相關性,也就是adjacency矩陣:

aij = |cor (i , j) | β

由這些相關性系數,可以構建網絡,其中基因作為網絡中的節點(nodes),而aij作為邊的權重,高相關性代表強連接,反之亦然。每個基因的連接性(度)的大小反應了和這個基因相連的基因的多少。WGCNA提供幾種相關性的算法,其中包括Pearson correlation(cor()函數)、Biweight mid-correlation(bicor()函數)、Spearman correlation(cor(x, method=“spearman”)函數)本研究中采用WGCNA默認的Pearson相關,Pearson correlation計算快速,但對離群值敏感。

可以看出,adjacency的結果直接取決于β的取值,其取值的高低直接影響模塊的構建和模塊內基因的劃分。根據接近無尺度網絡(scale-free network)的最低值來確定β值。在隨機網絡中,一般認為每個節點的重要性是一樣的,而實際上,許多領域的許多類型網絡都是無尺度網絡。無尺度網絡對生物的進化有重要意義,因為大部分nodes是連接度小的基因,這樣在某些不利的條件下,只要位于關鍵節點的基因保持其穩定性,那么整個網絡都可以保持很好的“彈性形變”,不會崩潰而導致毀滅性災難。而一旦選擇了合適的構建無尺度網絡的β值,一方面,少數的節點有很多連接(也就是hub基因),另一方面,大多數的點有少的連接度。WGCNA給出了如何選擇這個閾值的方法,其函數是pickSoftThreshold()。

2 加權共表達網絡的構建和模塊識別

一旦選擇好了構建網絡的β值,那么從網絡構建到模塊識別需要四個步驟

2.1 第一,通過拓撲重疊計算每兩個基因之間的不相似性。

兩個基因之間相似性通過拓撲重疊(TOM)來計算。簡單說,如果基因ij有很多相同的鄰接基因,那么TOM(ij)就很高,這意味著基因有相似的表達模式。TOM(ij)= 0表示基因ij的網絡沒有共同的鄰接基因,而TOM(ij)= 1表示,基因ij有著完全一樣的網絡鄰接基因。TOM作為相似度的度量可以被轉換為相異度,disTOM=1-TOM。

2.2 第二,得到基因聚類樹

根據基因表達之間的相似性,進行等級聚類。然后通過基因間的不相似性轉換,得到基因聚類樹。

2.3第三,通過對樹的剪切把表達一致相基因劃分到相同模塊中。

一般采取動態混合切割算法。

2.4 第四,合并相似模塊

通過模塊特征基因(module eigengenes,ME)合并非常相似的模塊。ME代表了一個模塊所包含的基因的表達數據,可以代表這個模塊進行數學運算,比如可以和其他模塊進行關聯,可以聚類(再次),可以和外部特征關聯。通過ME對模塊進行聚類后,設定一定閾值合并,通常這個閾值設置為0.15~0.25之間。并且,一般只merge一次,但如果仍然有一些模塊非常相似或者想要更大的模塊,也可以再次merge。

得到每個模塊所包含的基因后,可以對每個模塊進行生物功能等分析,也可以對感興趣的模塊篩選hub基因(會另外再寫hub基因篩選等)。但一般會把模塊和外部特征聯系(比如疾病狀態,疾病分期,時間序列的某些重要時間點等),所以下一步要把模塊與外部信息(traits)關聯。

3 基因模塊與外部信息關聯

一旦把基因模塊與外部特征相關的信息關聯在一起,就可以找到對所感興趣的信息相關的模塊和基因。因為前面已經得到了ME,所以可以利用cor(MEs, datTraits)函數計算模塊與外部信息的相關系數,并且可以計算其p值,WGCNA提供了其相關性可視化的函數labeledHeatmap(),結果得到的是每個模塊與外部特征的相關性矩陣。從中可以發現與感興趣的外部特征高度相關的模塊。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,967評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,273評論 3 415
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,870評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,742評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,527評論 6 407
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 55,010評論 1 322
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,108評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,250評論 0 288
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,769評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,656評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,853評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,371評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,103評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,472評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,717評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,487評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,815評論 2 372

推薦閱讀更多精彩內容