論文解讀 | 用公共數據庫做單細胞RNA數據挖掘:單一表型下不同組織的標準化分析

單細胞測序揭示了骨關節炎發展的潛在發病機制

一、文章基本信息

(1)題目:單細胞測序揭示了骨關節炎發展的潛在發病機制(2020)
(2)期刊名:Gene
(3)2019年影響因子:2.984
(4)作者單位:溫州醫科大學附屬醫院風濕免疫科
(5)摘要:骨關節炎(OA)是一種慢性退行性改變,發病率很高,導致生活質量下降和社會經濟負擔增加。 這項研究旨在探討與OA相關的潛在關鍵基因和通路,這些基因和途徑可用作早期治療的潛在生物標記。 從公共數據庫(GSE104782和GSE109449)下載了OA中1464個軟骨細胞和192個成纖維細胞的單細胞基因表達譜,用于后續分析。 使用Seurat和SingleR軟件對OA軟骨細胞和OA成纖維細胞中的細胞亞群進行了鑒定,共發現8種軟骨細胞亞群和3種成纖維細胞亞群。此外,鑒定了44個成纖維樣軟骨細胞和成纖維細胞之間的共同標記基因,并且通過功能富集分析進一步將粘著斑通路確定為OA的重要潛在機制。 此外,組織和細胞水平的逆轉錄實時定量PCR(RT-qPCR)實驗證實,兩個關鍵標記基因(COL6A3和ACTG1)可能參與了OA的發展。 綜上所述,我們推斷OA中的軟骨細胞可能通過上皮黏附途徑上調COL6A3和ACTG1的表達以完成成纖維細胞轉化。這些發現有望進一步了解OA纖維化過程的發展,并為早期OA的治療提供有希望的目標。
(6)研究目的:探索OA軟骨細胞纖維化的過程、關鍵基因和通路。
(7)主要發現

  1. 鑒定了OA中8種軟骨細胞亞群和3種成纖維細胞亞群
  2. 鑒定了44個成纖維樣軟骨細胞和成纖維細胞之間的共同標記基因
  3. Marker基因的功能富集分析指出了粘著斑通路是OA的重要潛在機制
  4. 逆轉錄實時定量PCR(RT-qPCR)驗證了關鍵標記基因(COL6A3和ACTG1)可能參與了OA的發展
  5. 總結,OA中的軟骨細胞可能上調COL6A3和ACTG1的表達,通過粘著斑途徑完成成纖維細胞的轉化

二、單細胞數據庫來源:GEO(GSE104782和GSE109449)

(1)GSE104782

  1. 源數據發表的文章:單細胞RNA-seq分析揭示了人類骨關節炎(OA)的進展
  2. 源數據發表期刊:Ann Rheum Dis 2018 (IF2019: 16.192)
  3. 源數據情況:10例行膝關節置換術的OA患者的1464個軟骨細胞
  4. 源文章的主要發現:
    1)在OA軟骨中鑒定出7個軟骨細胞亞群,包括三個功能不同的新表型。
    2)發現在增殖性軟骨細胞、增生前軟骨細胞和肥大軟骨細胞(HTCs)之間存在一種潛在的轉換,并在HTCs中定義了一個新的亞群。
    3)我們揭示了軟骨祖細胞(CPCs)的新標記物,并通過計算分析證明了CPCs和纖維軟骨細胞之間的關系。
    4)得出了與臨床結果相關的預測指標,闡明了不同細胞類型在OA早期診斷和治療中的作用。

(2)GSE109449

  1. 源數據發表的文章:類風濕關節炎(RA)中功能不同的疾病相關成纖維細胞亞群
  2. 源數據發表期刊:Nat Commun 2018 (IF2019: 12.121)
  3. 源數據情況:上樣細胞使用蛋白質表面標記物對滑膜成纖維細胞進行門控,數據包括來自2名骨關節炎患者和2名類風濕關節炎患者的384個細胞。Li et al.的研究采用了其中2名OA患者的192個滑膜成纖維細胞細胞。
  4. 源文章主要發現:
    1)使用靶向亞群的bulk轉錄組學和單細胞轉錄組學,揭示人類滑膜組織成纖維細胞亞群之間的功能和轉錄差異。
    2)確定七個具有不同表面蛋白表型的成纖維細胞亞群,通過整合轉錄組數據將其歸納為三個亞群。
    3)相對于OA患者,RA患者的成纖維細胞亞群的特征是蛋白質Podoplanin,THY1膜糖蛋白和cadherin-11的高表達,但缺乏CD34。相對于OA,RA患者滑膜的成纖維細胞亞群數目也成倍增長。
    4)單細胞轉錄組和免疫組化共同顯示,成纖維細胞位于發炎的滑膜中的血管周圍區域,分泌促炎細胞因子,具有增生作用,并具有浸潤細胞的體外表型特征。

三、分析思路和結果

1 研究基礎

1)軟骨細胞是健康軟骨的主要成分,產生并維持軟骨基質,主要由膠原蛋白和蛋白聚糖組成。 成纖維細胞是結締組織最常見的細胞,可合成膠原蛋白和細胞外基質。 在OA開始時,軟骨細胞的合成代謝能力大大減弱,從而損害軟骨修復。 在晚期階段,軟骨細胞分化成軟骨細胞和成纖維細胞之間的纖維軟骨細胞,產生異常成分,例如纖連蛋白碎片。 此外,根據體外研究的最新發現(Deroyer等人,2019),軟骨細胞被報告為調節過程增殖和轉分化為“軟骨肌成纖維細胞”。 隨著OA的發展,處于同一病態組織中的處于不同病理階段的細胞將會出現,在疾病的發展中起著獨特的作用。 因此,通過scRNA-seq分析鑒定不同病理階段細胞簇的研究工作將有助于更好地了解OA的病因和進展。

圖1 設計的分析和實驗流程

2 方法與結果

(1)數據獲取和質控

  1. 方法步驟
    1)對OA軟骨細胞和成纖維細胞分別進行質控,分別取每百萬轉錄本(TPM)值和log2(TPM值+ 1)值用于后續分析;
    2)去除表達基因在200—7500之外的細胞,表達量在10以下的細胞和線粒體基因表達超過5%的也被去除。
    3分別對兩個數據集進行PCA降維。
  2. 結果
    OA軟骨細胞剩余1464個細胞,192個成纖維細胞.

(2) 分群和鑒定各軟骨細胞亞群的標記基因

圖2 分群和鑒定各軟骨細胞亞群的標記基因

  1. 方法步驟
    1)使用聚類和T-SNE分析鑒定出細胞亞群;
    2)鑒定了每個亞群的標記基因,用每個亞群的前10個Marker基因繪制了差異基因表達熱圖;
    3)對每個亞群進行了top2 Marker基因的t-SNE結果映射可視化;
    4)進行了擬時序分析;
  2. 結果
    1)通過t-SNE分析,在1,464個細胞中發現了8個不同的簇,通過Marker基因標記發現其中7種為軟骨細胞,1種為纖維樣軟骨細胞(圖2A);
    2)熱圖顯示8種亞群可以被Marker基因很好的區分開(圖2B);
    3)每個亞群的top2 Marker基因和亞群的分布基本一致(APOD, SDHA, AKR1C2, PRG4, CCL2, S100A2, FOS, HES1, COL10A1, IBSP, KRT17, KRT16, COL1A1, IFI27, SLC5A12, and S100A9)(圖2C);
    4)擬時序分析表明軟骨細胞功能分化出現了4個分支,成纖維樣軟骨細胞僅分布在分支3后面的軌跡末端,這暗示了從軟骨細胞向成纖維細胞去分化的潛在過程。 (圖2D)

(3)纖維細胞樣軟骨細胞亞群中標記基因的功能富集分析和蛋白質相互作用分析

圖3 基于GO的差異基因富集分析氣泡圖

  1. 方法步驟(GO)
    1)(基因本體GO分析)為了進一步說明與成纖維樣軟骨細胞亞群的標記基因相關的生物學過程(BP),使用 g:Profiler在線工具進行功能富集分析并可視化不同簇之間的相互作用。
  2. 結果
    1)標記基因在生物學過程(BP)中顯著富集,包括細胞外基質組織(GO:0010033),細胞外結構組織(GO:0001501),對有機物的響應(GO:0071310),骨骼系統發育 (GO:0070887),細胞對有機物的反應(GO:0009888)等,它們在細胞外基質中起著至關重要的作用。 ECM是由膠原蛋白,酶和糖蛋白組成的細胞外大分子,ECM的合成代謝/分解代謝平衡破壞被認為是OA發病機理的主要事件。
    2)對于細胞成分(CC),發現這些標記基因主要富含細胞外基質(GO:0031012),含膠原的細胞外基質(GO:0062023),細胞外區域部分(GO:0044421),細胞外空間(GO:0005615)和細胞外區域(GO:0005576)。此外,標記基因顯著豐富了細胞外基質結構成分(GO:0005201),結構分子活性(GO:0005198),賦予抗張強度的細胞外基質結構成分(GO:0030020),生長因子結合( GO:0019838)和在分子功能組中賦予抗壓性的細胞外基質結構成分(GO:0030021) 。細胞外結構組織和細胞外基質組織也與軟骨細胞的生長以及膠原蛋白的重塑密切相關(Bella and Hulmes,2017)。
    3)對于分子功能(MF),Marker基因顯著豐富了細胞外基質結構成分(GO:0005201),結構分子活性(GO:0005198),賦予抗張強度的細胞外基質結構成分(GO:0030020),生長因子結合(GO:0019838)和具有抗壓性的細胞外基質結構成分(GO:0030021)。GO分析表明細胞成分主要位于細胞外空間,細胞外區域部分和細胞外區域,與ECM的位置一致。
圖4 KEGG
  1. 方法步驟(KEGG)
    1)(KEGG分析)
  2. 結果
    1)KEGG通路分析表明,在OA的成纖維樣軟骨細胞亞群中,7種通路表現出明顯的富集,包括局灶黏附,ECM受體相互作用,蛋白質消化和吸收,TGF-β信號通路, 癌癥中的核糖體和蛋白多糖通路(圖4)。功能富集分析(包括BP和KEGG通路分析)表明,標記基因與粘著斑通路,ECM-受體相互作用和TGF-β信號通路密切相關,表明這些標記基因可能參與了 OA中軟骨細胞轉化為成纖維細胞和膠原纖維化的必要性。
    2)據報道,粘著斑復合物是細胞ECM粘附的先決條件,通過細胞粘附和遷移,粘著斑激酶(FAK)的活化可能與OA有關,而關于粘著斑途徑與粘連的關系尚缺乏具體的研究。 OA(Shahrara等,2007; Prasadam等,2013)。


    圖5 PPI網絡

    圖6 八種軟骨細胞亞群中7個候選基因的表達情況

1.方法步驟(PPI)
1)纖維樣軟骨細胞亞群中,粘著斑途徑的text-mining(STRING)和PPI網絡分析(圖5)
差異基因在不同細胞亞群中的表達情況(圖6)

  1. 結果
    1)通過text-mining(STRING),確定了粘著斑途徑是重要的途徑。
    2)粘著斑途徑的PPI網絡表明在成纖維樣軟骨細胞簇中使用相關的標記基因緊密相互作用,其中COL1A1,COL1A2,COMP,CHAD,COL6A1和COL6A3表現出高度相關的核心位置。
    3)如圖6,值得注意的是,在成纖維樣軟骨細胞簇中,一些未被報道的標記基因(RHOA、FN1、COL6A1、CHAD、CAV1、ACTG1和COL6A3)被鑒定為候選基因,并且它們也富集在粘著斑途徑中高表達,特別是RHOA、COL6A1和COL6A3。此外,FN1、CHAD和CAV1在每個簇之間的表達水平基本上是無差別的,表明簇特異性較低。然而,其他4個基因的表達水平存在顯著差異,COL6A3在成纖維細胞樣軟骨細胞群中高表達。

(4)候選基因的基因集富集分析(GSEA)

圖7 Marker基因GSEA和RT-qPCR結果. (A)雙峰分組候選基因得分閾值的雙正態分布模型。紅線代表低分組候選基因得分分布,綠線代表高分組候選基因得分分布。(B)GSEA顯示了與炎癥相關的基因集,這些基因集富含具有標記基因的樣品,這些標記基因包括IgA產生的免疫網絡,自然殺傷細胞介導的細胞毒性,細胞粘附分子(CAM),細胞因子-細胞因子受體相互作用,T細胞受體信號傳導途徑和造血細胞譜系;

  1. 方法步驟
    1)GSEA基因集富集分析:為了進一步研究候選基因在OA機制中的潛在作用,根據候選基因水平將軟骨細胞分為高亞組和低亞組。 我們將候選基因的表達轉化為候選基因分數,并將2.6e-04作為根據雙正態分布模型分組的閾值(圖7a)。
  2. 結果
    1)GSEA結果表明,候選基因的低表達并沒有在任何途徑有效富集(p>0.05)。而高表達的候選基因與炎癥途徑有關,例如產生IgA的腸道免疫網絡(標準化富集分數(NES)=2.091,FDR=9.96E?04)、自然殺傷細胞介導的細胞毒性(NES=2.056,FDR=1.36E?03)、細胞粘附分子(CAMs)(NES=2.115,FDR=2.05E?03),細胞因子-細胞因子受體相互作用(NES=2.002,FDR=2.85E?03)、T細胞受體的信號轉導(NES = 1.974, FDR = 4.06E?03)和造血細胞譜系(NES=2.133,FDR=4.10E?03)。(圖7b)

(5)OA中每種成纖維細胞亞群的標記基因(第二個數據集)

圖8a-d 共同Marker基因鑒定

圖8e KEGG分析

  1. 方法步驟
    1)t-SNE分析
    2)擬時序分析
    3)維恩圖展示1、2、3號成纖維細胞亞群分別與纖維樣軟骨細胞亞群共同Marker基因鑒定
    4)共同Marker基因的KEGG通路分析
    鑒定纖維樣軟骨細胞亞群中未被報道的候選基因與共同Marker基因的共同關鍵基因
  2. 結果
    1)192個成纖維細胞分為3個不同亞群
    2)擬時序分析表明2號成纖維細胞亞群與其他兩種亞群在發育上存在較大差別。
    3)共同Marker基因鑒定表明,2號成纖維細胞亞群和纖維樣軟骨細胞亞群之間成功鑒定出44種常見標記基因,而在其他亞群中幾乎沒有共同的標記基因。
    4)KEGG通路分析了2號成纖維細胞亞群和纖維樣軟骨細胞亞群共同的44種常見標記基因,明顯富集到了膠原沉積相關的途徑,尤其是在粘著斑粘附和ECM受體相互作用途徑。
    5)44個常見標記基因與7個候選基因之間重合的結果確認了四個未被報道的關鍵基因(COL6A1,COL6A3,ACTG1和RHOA)。

(6)通過RT-qPCR驗證OA中的關鍵基因

圖9 與OA組和對照組相比,COL6A3(a)(e)和ACTG1(c)(f)的相對表達差異顯著,而滑膜組織和軟骨細胞中COL6A1(b)和RHOA(d)則無顯著差異

  1. 方法步驟
    1)使用RT-qPCR對比OA患者和對照組滑膜組織中的COL6A1,COL6A3,ACTG1和RHOA表達,選出顯著差別的基因A等
    使用RT-qPCR對比OA患者和對照組軟骨組織中A等基因的表達,選出顯著差別的基因B等。
  2. 結果
    1)OA滑膜組織中ACTG1和COL6A3的表達水平均顯著高于對照組滑膜組織,但RHOA、COL6A1表達差異不顯著。
    OA軟骨組織中ACTG1和COL6A3的表達水平均顯著高于對照組軟骨組織,表明ACTG1和COL6A3參與了軟骨組織的纖維化過程。

寫在最后的

此文章是一篇典型的單一表型下不同組織/細胞大類間的單細胞測序分析論文,其分析思路(故事思路)基本如下:
(1)首先,在公開數據庫中檢索關鍵詞尋找擬研究細胞大類(本文是OA軟骨細胞和OA成纖維細胞)的單一表型下同一組織/細胞大類的單細胞表達譜類文章。從而獲得兩種同一表型下兩種或多種組織/細胞大類的基因-barcodes表達矩陣。
(2)其次,兩種數據集分別進行質控、降維、聚類、二維嵌入可視化、注釋和差異基因分析、擬時序分析的基礎分析,目的是根據先驗知識標注細胞亞群,找到兩種組織/細胞大類中有明顯分化聯系的細胞亞群,即有很多共同DEGs的,且分別在兩個擬時序分析圖像上獨立(這說明要么處于分化末要么位于分化初,可能有分化聯系)的兩個亞群(話說能否根據Marker基因把不同數據集的幾個亞群投射到一個擬時序分析圖譜上,應該可以)。
(3)接下來,對發育起點的細胞亞群(本文中是成纖維樣軟骨細胞亞群)進行差異表達基因的功能富集分析(GO和KEGG),找到富集的生物學過程、細胞成分和分子功能(GO),以及富集的通路(KEGG),并根據先驗知識進行解釋,解釋的目的是增強研究目的與找到的擬研究Marker基因之間關聯的說服力,若之前已有人研究過該課題,那么可以嘗試尋找沒有人解釋過的通路。在本文中,作者們重點研究了黏著斑通路。
(4)在確定了黏著斑通路之后,就可以獲得該通路相關的DEGs,利用蛋白質—蛋白質相互作用網絡(PPI)尋找DEGs相互作用情況和核心基因。粘著斑途徑的PPI網絡表明,與該通路相關的成纖維樣軟骨細胞簇Marker基因呈現緊密相互作用,其中COL1A1,COL1A2,COMP,CHAD,COL6A1和COL6A3表現出高度相關的核心位置。(這步其實對講故事關系不大,就是做個圖,關鍵在下面)
(5)在確定了黏著斑通路之后,就可以獲得該通路相關的DEGs,尋找其中未被報道過與軟骨組織纖維化有關的基因作為下一步分析的候選基因,在本文中RHOA、FN1、COL6A1、CHAD、CAV1、ACTG1和COL6A3被鑒定為候選基因。
(6)分析候選基因在軟骨組織各個細胞亞群中的表達情況,將表達差異明顯的幾個基因作為重點分析對象(表達上調或下調都是重點,重點去查他們的文獻,因為用他們講故事會比較漂亮),當然其他幾個基因也得查。
(7)接下來做GSEA,分別研究高低表達的候選基因在各個通路上的富集情況,這步也是增強結果的可解釋性。
(8)接下來聯合分析兩個數據集/組織,(3)—(7)研究了分化起點的亞群的Marker基因,確定了候選基因。下一步進行另一個數據集中承接成纖維樣細胞亞群的關聯細胞亞群。在本文中,是根據擬時序分析和差異表達基因相似性確定的,即2號成纖維細胞亞群。
(9)找到44個共同的Marker基因后,在做一遍KEGG,又重新確認了這些基因富集到的通路和功能的確和纖維化有關。
(10)(3)—(7)中我們找到了7個候選基因,在這里研究者又找了44個共同基因和7個候選基因之間的重合基因,一共4個,作為最后的候選基因做RT-qPCR驗證。(不過我認為就算不重合也能解釋的通,因為成纖維細胞的差異基因不是與軟骨細胞亞群比較得來的,3個不重合的基因只是在2號成纖維細胞與其他兩種成纖維細胞比較時不顯著差異,不代表2號成纖維細胞中這3個基因與其他軟骨組織細胞亞群沒有差異)
(11)采集OA和健康人的臨床樣本,用RT-qPCR驗證4個候選基因是否在OA和健康人中差異表達。結論是只有2個基因差異表達,那么這兩個基因就參與了軟骨細胞的成纖維化。
(不過,這里還有個問題,4個候選基因是12例OA患者的測序數據經過了各種統計學分析得出的科學結論,這個結論的偏差似乎可以用機器學習中的訓練集和真實世界測試集的分布偏差來解釋。然而,RT-qPCR中也只有40例(其中20例OA),這里得到的2個基因無效,是否需要進行進一步的證據合并來得出最終結論呢?比如meta-analysis?

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發布,文章內容僅代表作者本人觀點,簡書系信息發布平臺,僅提供信息存儲服務。
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,837評論 6 531
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 98,196評論 3 414
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,688評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,654評論 1 309
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,456評論 6 406
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,955評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,044評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,195評論 0 287
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,725評論 1 333
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,608評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,802評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,318評論 5 358
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 44,048評論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,422評論 0 26
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,673評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,424評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,762評論 2 372