測序行業的蓬勃發展,帶來微生物組學日新月異的變化。目前,單一組學的文章不斷“貶值”,前沿研究的目光從單一組學逐步拓展至多組學對貫穿分析,即結合多個組學的分析角度,從多個層面闡述生物學機制。
微生物多組學貫穿分析策略十分豐富:如常見的16s與宏基因組貫穿分析,可以驗證物種的特征、豐富功能的探究;而16s與代謝組的貫穿分析思路同樣常見于高分文章中,通過16s探究不同處理/環境下菌群的物種組成變化,結合代謝組對應的代謝物的變化,進而找到不同處理/環境下引發細菌豐度差異最終導致代謝表型差異的機制。參考閱讀《選好思路和方法,給自己一篇多組學高分文章 》
在16s與代謝組貫穿分析中,相關性熱圖是一個重要的分析手段,主要用于逐一呈現細菌物種與代謝物間的相關性高低,是篩選潛在關聯的物種與代謝物的主要途徑,對于下游的實驗起到指導意義。此類相關性熱圖在高分文章中頻繁出現,足見其重要性(圖1、圖2)。
圖1 物種代謝物熱圖(2015,Cell Host& Microbe,IF=15.753 )[1]
圖2 物種代謝物熱圖(2018,NatureMedicine,IF=30.641)[2]
那么,該如何畫出此類高分文章中的相關性熱圖呢?這里,以16s與代謝組的數據為例,向大家分享如何使用R語言進行兩個組學數據的相關性計算、繪制相關性熱圖。
1.加載R包
psych包用于計算相關性、p值等信息
library(psych)
pheatmap包用于繪制相關性熱圖
library(pheatmap)
reshape2包用于輸出數據的整合處理
library(reshape2)
2.讀入數據
讀取微生物豐度信息表
表頭需帶有分類水平、物種名稱等關鍵信息
第一列為樣本名稱信息
phy <-read.table(file = "phy.xls", sep = "t", header = T,row.names= 1)
圖3 微生物豐度信息表格
讀取代謝物信息表
met <-read.table(file = "met.xls", sep = "t", header = T,row.names= 1)
圖4 代謝物豐度信息表格
3.計算相關性、p值
計算相關性矩陣(可選:”pearson”、”spearman”、”kendall”相關系數)、p值矩陣
cor <-corr.test(phy, met, method = "pearson",adjust= "none")
提取相關性、p值
cmt <-cor$r
pmt <- cor$p
head(cmt)
head(pmt)
4.數據保存
輸出相關系數表格,第一行為代謝物信息,第一列為物種信息
cmt.out<-cbind(rownames(cmt),cmt)
write.table(cmt.out,file= "cor.txt",sep= "t",row.names=F)
圖5 相關性系數表格
輸出p值表格,第一行為代謝物信息,第一列為物種信息
pmt.out<-cbind(rownames(pmt),pmt)
write.table(pmt.out,file= "pvalue.txt",sep= "t",row.names=F)
圖6 p值表格
以關系對的形式輸出表格
第一列為物種名,第二列為代謝物名,第三、第四列對應顯示相關系數與p值
df <-melt(cmt,value.name= "cor")
df$pvalue <- as.vector(pmt)
head(df)
write.table(df,file= "cor-p.txt",sep= "t")
圖7 關系對信息
5.繪制顯著性標記
對所有p值進行判斷,p< 0.01的以“*”標注,p值 0.01<p< 0.05的以“”標注
if(!is.null(pmt)){
ssmt <- pmt< 0.01
pmt[ssmt] <- '**'
smt <- pmt > 0.01& pmt < 0.05
pmt[smt] <- '*'
pmt[!ssmt&!smt]<- ''
} else{
pmt <- F
}
6.繪制相關性熱圖
自定義顏色范圍
mycol<-colorRampPalette(c("blue","white","tomato"))(800)
繪制熱圖,可根據個人需求調整對應參數
scale=”none” 不對數據進行均一化處理 可選 "row", "column"對行、列數據進行均一化
cluster_row/col=T 對行或列數據進行聚類處理,可選F為不聚類
border=NA 各自邊框是否顯示、顏色,可選“white”等增加邊框顏色
number_color=”white” 格子填入的顯著性標記顏色
cellwidth/height=12 格子寬度、高度信息
pheatmap(cmt,scale = "none",cluster_row = T, cluster_col = T, border=NA,
display_numbers = pmt,fontsize_number = 12, number_color = "white",
cellwidth = 20, cellheight =20,color=mycol)
圖8 R語言繪制的物種+代謝物相關性熱圖
圖片保存,代碼中輸入”filename=”,或在R語言軟件中點擊“文件-另存為” 進行保存
pheatmap(cmt,scale = "none",cluster_row = T, cluster_col = T, border=NA,
display_numbers = pmt, fontsize_number = 12, number_color = "white",
cellwidth = 20, cellheight = 20,color=mycol,filename= "heatmap.pdf")
參考文獻
[1]Kostic AD, Gevers D, Siljander H, et al. The dynamics ofthe human infant gut microbiome in development and in progression toward type 1diabetes. Cell Host Microbe. 2015;17(2):260–273.doi:10.1016/j.chom.2015.01.001
[2]Hoyles, Lesleyet al. “Molecular phenomics and metagenomics of hepatic steatosis innon-diabetic obese women.” Nature medicine vol. 24,7 (2018):1070-1080. doi:10.1038/s41591-018-0061-3
原文 https://www.sohu.com/a/366652239_278730