前言
還記得Immugent最開始做數據挖掘時,最常做的分析之一就是用ESTIMATE包來評估腫瘤組織的免疫浸潤情況,雖然得到的結果只有stromal score,immune score,estimate score和pirity score四個值,但是其準確性是相當高的!當然后面出現了很多新型的反卷積軟件,細胞類型頁越來越細化,但是ESTIMATE包依然頻繁出現在最新發表的各類文章中。
ESTIMATE包是從表達數據推斷腫瘤純度的基礎,但缺乏相關介紹文檔,而且有時它的功能在做得不夠的情況下越界。tidyestimate包是ESTIMATE的更新,目的是在維護這個包的優秀功能時,增加它的文檔和功能范圍。
下面Immugent就來介紹一下tidyestimate包。。。
代碼流程
首先回顧一下優秀的ESTIMATE包,它最初的文章在2013年發表在NC上,起點還是挺高的。
image.png
這么優秀的包,當然引用率是非常客觀的,截止到目前已經被4000+的文章引用過了。
image.png
install.packages("tidyestimate")
#or
devtools::install_github("KaiAragaki/tidy_estimate")
這次更新的特點主要包括以下內容:
image.png
那么下面就開始探索一下這個新包吧!
library(tidyestimate)
dim(ov)
#> [1] 17256 10
head(ov)[,1:5]
#> s516 s518 s519 s520 s521
#> C9orf152 4.8815 4.5757 3.7395 3.6960 4.1597
#> ELMO2 7.2981 7.5554 7.5332 7.3824 7.3079
#> CREB3L1 5.5692 5.7004 5.9597 5.7700 5.2190
#> RPS11 13.3899 13.8488 13.6429 13.6546 13.5698
#> PNMA1 9.3480 10.0092 10.4310 9.5399 9.6423
#> MMP2 7.6182 8.0369 8.9551 10.3875 7.4141```
這個新包繼續延續之前之前簡便的特點,運行起來也很簡便,一行代碼搞定。
scores <- ov |>
filter_common_genes(id = "hgnc_symbol", tell_missing = FALSE, find_alias = TRUE) |>
estimate_score(is_affymetrix = TRUE)
> 461 of 488 missing genes found matches using aliases.
>
> Found 10364 of 10391 genes (99.74%) in your dataset.
> Number of stromal_signature genes in data: 141 (out of 141)
> Number of immune_signature genes in data: 141 (out of 141)
scores
> sample stromal immune estimate purity
> 1 s516 -285.49841 165.75062 -119.7478 0.8323791
> 2 s518 -429.16931 99.71302 -329.4563 0.8490421
> 3 s519 -60.98619 -368.70314 -429.6893 0.8567232
> 4 s520 1927.51431 2326.15984 4253.6742 0.3348246
> 5 s521 -673.84954 141.72775 -532.1218 0.8643812
> 6 s522 1447.95517 1166.51854 2614.4737 0.5497248
> 7 s523 -271.15756 -928.44921 -1199.6068 0.9094242
> 8 s525 965.61804 1310.27775 2275.8958 0.5905450
> 9 s526 545.99467 2149.10473 2695.0994 0.5398002
> 10 s527 -710.44370 1303.08009 592.6364 0.7699846
They can also be plotted in context of the Affymetrix profiled tumors used to generate the ESTIMATE model:
scores |>
plot_purity(is_affymetrix = TRUE)
A more detailed version of this example can be found in the vignette of this package.
* * *
## 說在最后
Immugent已經對tidyestimate包做過一些簡單的測試,在沒有降低準確性的同時,確實提速了不少。但是有一說一,tidyestimate包其實還可以做一些別的方面的升級,比如增加數據的適用性,或者聯合其它分析流程,畢竟現在主打的就是一個集合與多功能。
好啦,本次介紹到這里就結束啦,我們下次再會~~