一文看懂火山圖
- 火山圖可用于展示兩組樣本間基因表達(dá)水平差異的分布狀況。
- 橫軸log2 fold change差異表達(dá)倍數(shù)(Fold Change值,簡稱FC,根據(jù)log2 fold change值的正負(fù)判斷這些基因的表達(dá)量是上升了還是下降了),差異越大的基因分布X軸在兩端。
- 縱坐標(biāo)用-log10 p-value表示,對P值進(jìn)行-log10的轉(zhuǎn)化,-log10(p-value=0.05)約等于1.30,(-log10(0.01))=2,可知縱軸越往上走P值越小,而P值越小表示越顯著。所以我們進(jìn)行-log10(p -value)轉(zhuǎn)化后,值越大就表示差異越顯著。
- 當(dāng)然,將橫縱坐標(biāo)換下解讀是類似的。
接下來讓我們看幾張圖
123.png
結(jié)果解讀
- 上圖以|logFC|=0.606且p-value=0.05為截?cái)鄻?biāo)準(zhǔn)。
- logFC>0.606且p-value<0.05定義為上調(diào)的基因,
- logFC<-0.606且p-value<0.05定義為上調(diào)的基因。
- 圖中紅色 的點(diǎn)表示上調(diào)的基因,藍(lán)色 的點(diǎn)表示下調(diào)的基因,黑點(diǎn) 是無顯著差異的基因。
- 兩條紅豎線外側(cè)為差異表達(dá)倍數(shù)為2倍以上的基因。
- B1橫線以上表示p-value<0.05,
- B2橫線以上表示p-value<0.01。
- 區(qū)域1表示|FC|在2倍以內(nèi)且p-value>0.05,區(qū)域2和區(qū)域3表示:|FC|>2倍且p-value<0.01的基因。
懂了基礎(chǔ)的知識后,就去看看別人是如何描述的吧
案例一
1.png
1.1.png
順便把他它翻譯下:差異表達(dá)基因的火山圖。Y坐標(biāo)是|log2(fold change)|,X坐標(biāo)是?log10(p值)。每個(gè)點(diǎn)代表一個(gè)基因。紅點(diǎn)是顯著表達(dá)上調(diào)的基因。綠點(diǎn)是顯著表達(dá)下調(diào)的基因。黑點(diǎn)是無顯著差異的基因。
案例二
下面讓我們來看一個(gè)“正常一點(diǎn)”的火山圖。它的的解讀應(yīng)該就比較簡單了!
它在方法中的描述的是:
2.png
它的結(jié)果是:
2.1.png
這里有幾個(gè)細(xì)節(jié)問題。
問題1:為什么火山圖是對稱的呢?
通過對logFC值的箱線圖可以看出。
3.png
問題2:為什么對P值進(jìn)行-log10的轉(zhuǎn)化?
轉(zhuǎn)換前后的火山圖對比。交互式的火山圖可以試試plotly包哦!
4.png
參考來源:
- Qiu C C, Su Q S, Zhu S Y, et al. Identification of Potential Biomarkers and Biological Pathways in Juvenile Dermatomyositis Based on miRNA-mRNA Network[J]. BioMed Research International, 2019, 2019.
- Lin X D, Wu Y P, Chen S H, et al. Identification of a five‐mRNA signature as a novel potential prognostic biomarker in pediatric Wilms tumor[J]. Molecular genetics & genomic medicine, 2019: e1032.
- 感謝jimmy老師在畫圖以及在處理代碼過程中的指導(dǎo),還有推薦了Rmarkdown這個(gè)神器。