遇到批次效應(yīng)
做單細(xì)胞數(shù)據(jù)分析時(shí),我們常常用到不同時(shí)期或不同測序平臺(tái)的數(shù)據(jù),即使是同樣的細(xì)胞類型也可能不能聚類到一個(gè)細(xì)胞群中。
精確的單細(xì)胞轉(zhuǎn)錄組(scRNA-seq)數(shù)據(jù)檢索和注釋需要:1. 克服數(shù)據(jù)集之間的批次效應(yīng);2. 跨物種、平臺(tái)、具有高質(zhì)量注釋的scRNA-seq數(shù)據(jù)庫。
近日,北京大學(xué)生物醫(yī)學(xué)前沿創(chuàng)新中心(BIOPIC)、北京未來基因診斷高精尖創(chuàng)新中心(ICG)、北京大學(xué)生命科學(xué)學(xué)院生物信息中心(CBI)、蛋白質(zhì)與植物基因研究國家重點(diǎn)實(shí)驗(yàn)室的研究團(tuán)隊(duì)在《Nature Communications》上發(fā)布了基于深度學(xué)習(xí)模型的scRNA-seq數(shù)據(jù)檢索和注釋的新方法Cell BLAST,以及具備高質(zhì)量注釋的scRNA-seq參考數(shù)據(jù)庫ACA,為有效利用現(xiàn)有數(shù)據(jù)進(jìn)行細(xì)胞注釋和跨數(shù)據(jù)集研究提供了新的工具和資源。
Cell BLAST是什么?
一個(gè)自帶高質(zhì)量參考數(shù)據(jù)庫的scRNA-seq數(shù)據(jù)檢索/注釋工具
克服批次效應(yīng)
Cell BLAST使用對(duì)抗自編碼器進(jìn)行轉(zhuǎn)錄組數(shù)據(jù)降維,利用對(duì)抗學(xué)習(xí)策略來消除數(shù)據(jù)集間的批次效應(yīng)。
自帶高質(zhì)量注釋參考庫:ACA
通過收集大量已發(fā)表的單細(xì)胞轉(zhuǎn)錄組數(shù)據(jù),研究團(tuán)隊(duì)建立了一個(gè)涵蓋2,989,582個(gè)單細(xì)胞、8個(gè)物種、27個(gè)不同的組織器官的數(shù)據(jù)庫:Animal Cell Atlas (ACA);同時(shí),對(duì)ACA中的細(xì)胞注釋進(jìn)行了詳細(xì)的整理,并使用Cell Ontology構(gòu)建了一套結(jié)構(gòu)化的細(xì)胞類型標(biāo)注,用于統(tǒng)一不同數(shù)據(jù)集中的標(biāo)注以及支持細(xì)胞類型的推斷。
Cell BLAST能做什么?
細(xì)胞類型鑒定、發(fā)現(xiàn)新細(xì)胞類型、注釋連續(xù)細(xì)胞狀態(tài)...
類比BLAST,Cell BLAST可以在參考數(shù)據(jù)集中檢索與用戶提供的query細(xì)胞最相似的細(xì)胞,并借助這些相似細(xì)胞在數(shù)據(jù)庫中的注釋信息,對(duì)query細(xì)胞的注釋信息進(jìn)行推斷。
除了可以用于細(xì)胞類型鑒定,Cell BLAST能靈敏地發(fā)現(xiàn)參考數(shù)據(jù)集中不存在的、未知的細(xì)胞類型;研究團(tuán)隊(duì)用一系列造血干細(xì)胞分化的數(shù)據(jù)集驗(yàn)證了Cell BLAST還能用于注釋連續(xù)細(xì)胞狀態(tài)。
* 用戶可以直接上傳待注釋的scRNA-seq數(shù)據(jù),用ACA中的參考數(shù)據(jù)集進(jìn)行細(xì)胞檢索和自動(dòng)注釋。ACA中的數(shù)據(jù)集也可以在download頁面下載。
?? Cell BLAST訪問地址:https://cblast.gao-lab.org/
* 如果由于機(jī)密性的原因不希望上傳數(shù)據(jù),或者更喜歡定制,平臺(tái)也提供了Python軟件包Cell BLAST,用戶可以使用軟件包在自定義的參考數(shù)據(jù)集上進(jìn)行模型訓(xùn)練、檢索和定制化分析。
??? Python軟件包Cell BLAST:https://github.com/gao-lab/Cell_BLAST
首發(fā)公號(hào):國家基因庫大數(shù)據(jù)平臺(tái)??
參考文獻(xiàn)
Cao, Z., Wei, L., Lu, S.?et al.?Searching large-scale scRNA-seq databases via unbiased cell embedding with Cell BLAST.?Nat Commun?11,?3458 (2020).?
信息來源于“北大科研”公眾號(hào),圖片來源于Cell BLAST官網(wǎng)和參考文獻(xiàn),如有侵權(quán)請(qǐng)聯(lián)系刪除。