作者,Evil Genius~~
空間轉錄組的運用方向:轉錄、蛋白
ST最適合回答三種生物問題:首先可以闡明組織的細胞類型組成;第二類問題與細胞相互作用有關;最后可以幫助闡明組織成分之間的分子相互作用。
2018年單細胞轉錄組技術被Science 評為年度突破技術;2019年單細胞多組學被Nature Methods 雜志評為年度技術,預示著單細胞多組學研究將成為趨勢,其中,單細胞結合空間轉錄組研究,使單細胞在三維空間領域的研究成為新熱點。2020年空間轉錄組技術被 Nature Methods評為年度技術,進一步證實該技術具有巨大的發展空間,后續空間轉錄組技術將會在各個研究領域改變我們了解復雜組織的方式。
空間轉錄組學在發現疾病因子、建立空間圖譜、描繪空間藍圖等方面已得到了廣泛的應用和推廣,但其潛力遠不止于此。例如,在細胞間通訊的研究中,不同細胞類型的相互作用是從轉錄組學數據和已知的配體受體復合物中推斷出來,然而,單個細胞之間正在進行的相互作用很難被立即捕捉到。無論是在組織中還是在培養環境中,空間相鄰的細胞更有可能相互作用,這正是空間轉錄組發揮作用的地方,因此,將空間轉錄組學引入細胞間通訊研究是值得期待的。此外,單細胞組學技術在許多方面促進了空間轉錄組學的發展,例如可以從細胞分型提供標記基因,這反過來又可以利用空間位置信息協助單細胞組學區分亞群。此外,由于基于圖像的空間研究方法可以提供亞細胞視圖來觀察單個細胞內的分子行為,這使得分析基因-基因相互作用組、基因調控網絡和多模態組學成為可能。
空間轉錄組數據探索
空間轉錄組數據的探索,重點圍繞“細胞組成-空間結構-區域功能”這一分析過程,如三級淋巴結構的成熟情況、免疫細胞的浸潤程度、癌和癌旁交接區的細胞特征,以及胎兒肝臟造血的“網兜”結構和胰腺胰島功能團的組成等。
空間轉錄組的一般分析思路如下:
結合scRNA-seq數據反卷積算法或Marker gene/功能評分等方式,判斷空間stop的細胞類型/組成;
通過無監督降維聚類分析,將基因表達模式相似的stop聚成一類,結合細胞類型鑒定結果,分析空間結構中細胞的組成;
分析不同區域(或聚類)間的相互作用關系,如癌和癌旁交接區中細胞受體-配體分析,腫瘤細胞侵襲軌跡的擬時序分析等;
針對感興趣的區域做功能富集評分,分析組織結構功能;
選擇關注的組織區域,明確細胞組成與功能結構的關系,提出關鍵結論。
空間轉錄組的經典分析內容
1、空間注釋
為了能更好地理解空間轉錄組數據,識別組織切片上的細胞類型組成,首先會進行空間細胞類型鑒定。鑒于轉錄組具有獨特的空間和時間異質性,聯合同一個組織的scRNA-seq數據,可更準確的鑒定空間細胞類型。如SPOTlight、SpatialDWLS、RCTD、Cell2location、CellTrek和MIA等方法,各有優勢。我們選擇其中最常用的進行介紹。
1.1 Cell2location分析
Cell2location軟件針對不同組織,采用負二項式回歸來預估每個cluster的平均表達譜,基于參考的scRNA-seq數據應用貝葉斯模型從空間轉錄組數據中解析細胞類型并創建細胞圖譜。此外,Cell2location還可以對細胞類型豐度的NMF(非負矩陣分解)進行估計,NMF產生了一組空間細胞類型豐度分布圖,用于捕捉共定位的細胞類型。
1.2 MIA分析
MIA分析(multimodal intersection analsysis)通過計算某區域的差異基因與scRNA-seq數據鑒定的細胞類型差異基因之間的重疊程度,來推斷特定組織區域中特定細胞類型的富集情況。
1.3 SPOTlight分析
每個空間spot大約包含1-10個細胞,因此需要解析每個spot內的細胞組成,這種分析一般稱為去卷積分析(deconvolution)。SPOTlight基于NMF(非負矩陣因式分解)的方法,將scRNA-seq數據集作為參考,使用因子分析來預測每個spot可能的單細胞組成,從而實現在空間上定位scRNA-seq數據中亞群。
1.4 空間spot評分
若沒有同一樣本scRNA-seq數據,且只關心特定幾種細胞類型空間位置時,我們可以用特定細胞類型的marker基因(也可以來源于其他scRNA-seq數據),采用ssGSEA和Seurat的AddModuleScore等軟件對空間spot進行評分,從而鑒定細胞類型的空間位置。需要注意的是每個樣本的score閾值不同,需要根據樣本實際情況進行判斷。
在明確空間spot的細胞類型/組成之后,可后續進行一系列高級分析,如腫瘤惡性細胞推斷、擬時序分析、細胞通訊受配體分析和空間臨近距離分析等,進一步進行數據挖掘。
2、CNV分析
CNV(Copy number variation,拷貝數變異)是基因結構變異(Structural Variant,SV)的重要組成部分。Broad 研究所開發的CNV分析工具inferCNV,常用于scRNA-seq數據中惡性細胞的鑒定。以正常細胞為參考,通過與參考細胞相比的基因表達強度的相對變化來表示基因的擴增或者缺失。有文章表明,用inferCNV軟件從空間轉錄組數據推斷出的絕大多數CNV與Bulk WES數據一致,說明其從空間轉錄組數據推斷出CNV的可靠。此外,SPATA等軟件也可以用于CNV分析。
最后可以根據區分的惡性細胞和非惡性細胞結果,將數據映射到空間切片上。黃色代表非惡性細胞,藍色代表惡性細胞。
3、細胞空間相對位置
組織切片上的細胞分布和基因表達特征,是空間轉錄組學的研究重點。根據組織學或病理學結果,選定某些spot為中心,可以分析不同組織深度上對應的空間特征,探索組織切片上結構區域的功能變化。3.1單向距離分析根據空間區域劃分結果,應用GSEA(或GSVA等其他評分軟件)可分析不同區域的功能/通路富集變化。例如,由正常過渡到病理狀態的切片,可分析通路的組織動態變化。從normal區到病理區(如腫瘤區),每5個spot寬度劃分為一個與transition分界線平行區域,對每個區域分別做hallmark pathways的GSVA通路富集分析??砂l現與病理狀態相關的通路從normal到病理區通路活性變化。
3.2 雙向距離分析
首先選定參考點(或稱為中心點),計算其他細胞到中心點的歐氏距離。在此距離上做細胞類型密度曲線,可看出不同距離上共定位的細胞。將距離從零到遠,分為四個層級:reference(0),start(1/3分位距離處),middle(2/3分位距離處),end(最遠處)。分析各層級上的特異性基因,并進行GO功能注釋。在組織切片中識別有顯著深度變化的基因,檢驗基因表達是否特異性地依賴于空間距離;然后對距離特異性基因,基于表達量進行相似性聚類,并對每個聚類出來的類進行GO富集分析。
3.3 空間梯度變化分析(Spatial gradient change analysis)對完整的病理組織,可以探究從病理中心到四周,信號通路的激活變化。先按照徑向將每個組織切片分為4個部分,再將每個部分分為4個小部分;然后按照環形每5個spot做一次分割,即可分為18個環形區域(A-1.1表示A-1區域的cluster1,以此類推),計算通路激活程度與圓心距的相關性。
4、空間模式
腫瘤樣本空間cluster的分布呈現兩種不同的模式,一種呈“塊狀”,cluster間邊界清晰(如HCC-1T和HCC-3T),另一種呈“不連續的混合”(如HCC-2T)。為了定量評價這一特征,引入了一個名為“空間連續性度的度量”概念,該度量通過比較每個點與其相鄰點之間的聚類身份一致性來計算。聯合另一指標“轉錄組多樣性程度”(用于測量每個切片中腫瘤區域的整體轉錄組異質性),可定量地發現HCC-1、HCC-3和HCC-4患者的L(癌和癌旁交接區)和T(腫瘤區)切片腫瘤區域具有較高的空間連續性和較低的轉錄組多樣性。
5、空間微環境(臨近結構微環境)
特定細胞組成的特殊結構,才能發揮必要的功能,因此分析空間轉錄組切片上的細胞組成十分必要。如下圖,胎兒造血干細胞/多能祖細胞(HSCs/MPPs)擴增單元的鑒定過程。
首先選擇切組織片上要研究的特定spots,作為中心點位(Intra-spots,可以spot,也可以是某種細胞類型,某個cluster),將其臨近的其他類型細胞作為Inter-spots, 較遠距離的細胞作為Distal-spots。然后,統計每種細胞類型在不同分層中的占比,并采用wilcoxon統計方法對不同分層占比進行顯著性檢驗,同時對每個分層各種細胞類型的占比進行計數,以了解特定組織區域的細胞組成情況。
6、空間通訊
細胞通訊(cell communication)是指細胞接收、處理和傳遞環境/自身信號的能力,它是每個生物體(如細菌、植物和動物)中所有細胞的基本屬性。由配體-受體復合物介導的細胞-細胞通訊對于協調各種生物過程至關重要,如發育、分化和炎癥。可從空間測序數據中定量推斷和分析細胞間通訊網絡,并通過整合基因表達與信號配體、受體及其輔助因子之間的相互作用的先驗知識來建立細胞-細胞交流的概率,進而對細胞間通訊做出預測。該分析可以應用于揭示發育中細胞的相互作用,探索腫瘤免疫微環境與挖掘疾病治療靶點等。6.1空間cluster邊緣的互作作用對兩個相鄰cluster的接壤區域進行細胞通訊分析。如下圖所示,在腫瘤交接區兩邊各取一定的spot寬度,利用CellPhoneDB軟件(使用CellPhoneDB數據庫)進行細胞通訊分析(根據受體-配體方向,正反2次),研究相鄰cluster間互作的強度。
6.2空間受-配體分析選擇空間切片上的相鄰區域,使用stlearn軟件(利用connectomeDB2020數據庫,由2293個人工篩選的配體受體對組成),可篩選出各互作spot中達到顯著水平的互作對。同時計算出互作對的score值,值越大表示互作越強烈,并在空間切面上展示其相應p值、矯正后的p值和-log10(p_adjs)。
6.3受-配體空間定位
空間轉錄組以更直觀的視角,展示了組織中不同細胞的基因空間表達信息,非常適合于評估scRNA-seq數據中預測到的配體-受體相互作用的可靠性。
我們再來幾篇文獻
1、空間推動對腫瘤亞結構的認知
人類腫瘤圖譜網絡(HTAN)計劃有一個遠大的目標:“構建人類癌癥的三維圖譜,反映從癌前病變發展到晚期疾病的動態的細胞、形態和分子特征?!笔ヂ芬姿谷A盛頓大學Daniel Zhou博士和Reyka Jayasinghe博士領導的一組科學家最近將他們對胰腺導管腺癌的研究成果添加到不斷增長的HTAN數據庫中,這是一種眾所周知的致命癌癥,且治療選擇有限。
研究團隊使用10x Genomics的單細胞和單細胞核RNA測序(sc/snRNA-seq)對83個癌癥樣本進行分析,這些樣本來自未接受過治療的患者以及經過多個療程治療的其他患者,包括新輔助靶向治療和放化療。對于部分腫瘤(共有15張Visium玻片),他們還生成了相匹配的10x Genomics空間轉錄組學數據****。這種多維方法揭示出有著不同組織學特征的細胞亞群,它們代表了癌癥進展的過渡階段。值得一提的是,研究團隊觀察到腺泡-導管化生細胞和胰腺上皮內瘤變細胞的存在,前者僅在動物模型中觀察到,之前未在人類樣本中鑒定出,而后者被證實構成了前期病變。
整合的單細胞和空間數據還指出了免疫檢查點阻斷的潛在靶點:TIGIT–NECTIN軸。編碼表面配體的NECTIN4在腫瘤細胞中上調,并與樣本中的腫瘤區域顯示出空間上的共定位。同樣,編碼免疫受體的TIGIT在腫瘤切片中的浸潤淋巴細胞區域附近表達。TIGIT與NECTIN的相互作用讓T細胞和自然殺傷細胞的效應功能失活。因此,阻斷NECTIN可支持抗腫瘤T細胞的活性。
2、心肌梗死后心臟如何重塑
盡管心臟病發作時的恐懼往往源于事件本身,但之后心臟發生的狀況會推動住院率和發病率繼續上升。20%的患者可能會在心肌梗死(MI)后12個月內因心力衰竭而住院,這主要是由于左心室重塑,也就是存活心肌丟失和炎癥反應增強等原因引起的心臟結構和功能變化。哪些機制推動了這一重塑事件,目前還知之甚少。在重塑的心臟組織的空間背景下深入了解細胞和分子參與者,有望解鎖治療方法以減輕晚期死亡率。這一想法激勵德國亞琛工業大學和海德堡大學的研究人員使用10x Genomics的snRNA-seq、snATAC-seq(染色質轉座酶可接近性分析)和空間轉錄組學對心肌梗死后的人類心臟重塑進行綜合研究,該團隊由Christoph Kuppe、Ricardo Ramirez Flores和Zhijian Li博士領導。這些方法可幫助他們區分損傷、修復和重塑的組織結構,包括以ANKRD1和NPPB基因表達梯度(兩者均與心臟病有關)為特征的清晰邊界區域,介于受損和未受損的細胞類型之間。此外,他們還觀察到,成纖維細胞向肌成纖維細胞的分化是心臟組織重塑的驅動因素。
這份疾病特異性的心臟細胞狀態的空間圖譜,以及相關的基因表達和基因調控程序,為弄清心臟重塑的潛在生物學機制提供了豐富的資源,有助于未來的治療干預。
3、T細胞與膠質母細胞瘤的免疫機制
癌癥中存在不少漏洞,包括讓我們的免疫系統來對抗自身。盡管腫瘤的免疫浸潤程度與免疫治療的積極應答有關,但有時腫瘤微環境中的T細胞可能是弊大于利。作用是“好”還是“壞”最終取決于T細胞群的組成,而這種組成又受到與腫瘤微環境中的細胞鄰居交互作用的高度影響。
德國弗萊堡大學醫學中心的研究人員試圖通過膠質母細胞瘤的研究來更好地了解這一現象,膠質母細胞瘤是一種惡性腦癌,高度耐受免疫療法。首先,在對12個人類腫瘤樣本中的免疫細胞開展單細胞基因表達分析后,研究團隊發現了CD8+ T細胞的一個子集,它們表現出與IL-10應答相關的經典耗竭特征,表明在T細胞功能障礙中起作用。腫瘤切片的空間轉錄組分析顯示,激活的效應CD8+ T細胞、耗竭的CD8+ T細胞以及CD4+ Th17樣T細胞與富含間充質細胞樣和星形膠質細胞樣轉錄特征的腫瘤區域定位相同。通過算法模型來篩選最有可能彼此相互作用并在T細胞中引發IL-10應答的細胞類型,他們發現髓系細胞(巨噬細胞和小膠質細胞)可能是與間充質細胞樣腫瘤區域中的浸潤T細胞發生細胞交互作用的罪魁禍首。了解這些細胞關系代表人們邁出了重要一步,有望在膠質母細胞瘤的治療中提高抗腫瘤免疫力。 4、空間分析發現了光合作用整合機制的第一個證據 所有的生物都是高度關聯的。這種說法在植物與人類的關系中最為明顯。植物是食物來源,也是氧氣(生命的基本成分)來源,它們通過光合作用讓世界保持運轉。光合作用是一系列化學反應,在陽光和水的幫助下將二氧化碳轉化為碳水化合物。目前有幾種不同類型的光合作用—C3(最常見)、C4和CAM,它們往往發生在不同的植物中,主要取決于環境條件(如溫度和水量)。每個過程的主要區別在于二氧化碳的固定機制,但CAM光合作用在時間上更獨特:盡管C3和C4植物有著開放的氣孔(葉片上的呼吸中心),但CAM植物為了適應炎熱而干旱的氣候,在白天保持氣孔關閉以保留水分。在涼爽的夜晚,它們會打開氣孔進行二氧化碳固定。已知一些C4植物會采用CAM光合反應,但有人提出CAM活性必須發生在不同的細胞群中,如專門的儲水細胞。然而,耶魯大學的一組研究人員最近對馬齒莧(一種肉質草本植物)開展空間基因表達分析后發現,C4和CAM相關基因在相同的光合葉肉細胞群中起作用,該團隊由Jose J. Moreno-Villena博士和通訊作者Haoran Zhou博士領導。了解這種以往未被表征的生化途徑有望生成光合作用效率更高且更耐旱的植物。
5、器官發育 如果要選擇一篇在2022年最喜愛的Visium空間論文,這是個很難的決定,但這些蘭花器官發育的可視化數據很有說服力。
復旦大學和江西農業大學的研究團隊利用10x Genomics的Visium空間基因表達分析構建了蘭花多個發育階段的花器官發生的綜合時空圖譜。這項研究解決了數以千計的基因在這些不同發育階段的優先表達問題,覆蓋了從初始化、身份確定到晚期形態發生的連續轉錄事件,并為確定細胞類型特異性的基因表達變化提供了參考圖譜。這項研究不僅展示了植物器官發育的全轉錄組空間讀數的用途,還展示了人類及其他動物組織的可能性。
寫在后面
一切的一切,都是研究的開始,生活很好,有你更好