LncRNA的概念及功能
LncRNA的概念
長鏈非編碼RNA(long non-coding RNA, LncRNA)是一類長度大于200nt但不編碼蛋白質的非編碼RNA,廣泛分布于動植物中。最初,LncRNA被視為基因組轉錄的“噪音”,是RNA聚合酶II(Pol II)轉錄的附屬產物。盡管大多數LncRNA由Pol II轉錄,但也存在其他RNA聚合酶的轉錄。LncRNA可源自基因間區域(lincRNA)或與其他基因重疊的有義或反義轉錄本。許多LncRNA具有5'端m7G帽和3'端poly(A)尾,類似于mRNA的轉錄和加工過程。其表達呈現明顯的組織特異性和時空特異性。
LncRNA的功能
最初,研究者們認為LncRNA不具備生物學功能。然而,隨著后續大量研究的進行,已經發現許多LncRNA參與生物體內多種基因調控。目前已知的LncRNA功能可總結如下:
1)轉錄干擾:在編碼蛋白的基因上游啟動子區進行轉錄,干擾下游基因的表達;
2)誘導染色質重構和核小體修飾:抑制RNA聚合酶II或者介導染色質重構以及組蛋白修飾,影響下游基因的表達;
3)調控可變剪接模式:與編碼蛋白基因的轉錄本形成互補雙鏈,干擾mRNA的剪切,形成不同的剪切形式;
4)產生內源siRNAs:與編碼蛋白基因的轉錄本形成互補雙鏈,在Dicer酶的作用下產生內源性siRNA;
5)調控蛋白質的活性:與特定蛋白質結合,LncRNA轉錄本可調節相應蛋白的活性;
6)結構或組織功能:作為結構組分與蛋白質形成核酸蛋白質復合體;
7)改變蛋白質的定位:結合到特定蛋白質上,改變該蛋白質的細胞定位;
8)小RNA的前體:作為小分子RNA(如miRNA、piRNA)的前體分子。
LncRNA的研究歷程
傳統轉錄組測序研究LncRNA的局限性
近年來隨著單細胞轉錄組測序(scRNA-seq)的快速發展,科研工作者可以在單個細胞水平進行更細致的基因表達解析,從而更準確地解析組織中的基因調控變化。然而,目前大多數的scRNA-seq方法以使用polyT探針引物捕獲mRNA為基礎,所以只能檢測樣本中的大部分mRNA,以及部分帶ployA尾的LncRNA,而超過半數的LncRNA沒有ployA結構。因此,目前對LncRNA的研究還普遍只能使用傳統的Bulk LncRNA測序(即對整個組織進行RNA提取然后開展測序)。
此外,基于Bulk的傳統組學檢測在非編碼RNA的分析方面帶來一系列誤差,以ceRNA分析為例。ceRNA效應描述了兩條RNA(或者更多RNA)有相同的miRNA結合位點時,它們就會競爭性地結合相同的miRNA,從而呈現表達量正相關的現象。具體來講,LncRNA X和mRNA Y都可以競爭性地結合miRNA Z。當LncRNA X的表達量升高時,它可以競爭性地結合并消耗更多的miRNA Z,使得更多的mRNA Y從miRNA Z的抑制中解放出來,進而導致mRNA Y的豐度增加。反之亦然,如果LncRNA X的表達量降低,miRNA Z對mRNA Y的抑制效果將增強,導致mRNA Y的豐度減少。通過ceRNA效應,非編碼RNA(包括LncRNA和circRNA)可以間接調控mRNA的豐度,這是非編碼RNA的一種常見功能調控機制。
基于以上的邏輯,ceRNA關系分析建立在兩點基礎上:(1)非編碼RNA與mRNA都可以與相同的miRNA結合;(2)非編碼RNA與mRNA表達量正相關。
以上兩點邏輯看起來很嚴謹,但基于以上生物信息分析得到的結論在后續的分子實驗中常常無法被成功驗證,即生物信息的結果是假陽性。
這是因為Bulk RNA-seq是樣本均一化后的表達量檢測,所以我們無法判斷具有相關性的LncRNA與mRNA是否在同一類細胞中表達,那么兩個RNA分子組織水平的平均表達相關性無法作為它們之間存在調控關系的嚴格證據。
單細胞轉錄組研究LncRNA的必要性
綜上所述,針對非編碼RNA的分析,我們迫切需要在單細胞層面進行深入解析。當前,已經出現了一些解決方案,可以克服對非ployA RNA的檢測限制。其中包括基于三代測序的全長單細胞轉錄組測序技術,以及單細胞全序列轉錄組測序技術。后者通過半隨機引物對各種類型的RNA進行捕獲和測序,不依賴ployA結構,從而實現對單細胞水平的非編碼RNA的全面檢測。該單細胞全轉錄組技術利用隨機引物捕獲全長序列轉錄本,使我們能夠獲取同一細胞內RNA分子的表達情況。基于上述內容,這項技術對于單細胞級別的全轉錄組研究的重要性不言而喻。
單細胞水平下的LncRNA研究進展
單細胞全序列轉錄組簡介
單細胞全序列轉錄組測序實現了單細胞級別的全長覆蓋檢測,采用了12N7K半隨機引物捕獲RNA的方案,取代了常規單細胞轉錄組依賴于3' polyA的捕獲方案,從而突破了僅能檢測靠近mRNA 3'或5'序列的傳統限制。同時,通過使用blocker對mt-rRNA和rRNA進行block,有效減少了數據的浪費。
這項單細胞全序列轉錄組研究仍然屬于轉錄組學范疇,具有出色的基因表達檢測能力。此外,該技術檢測到的數據表現出強大的穩定性,對不同批次制備的相同組織樣本進行檢測,顯示出數據相關性高、批次效應小、分群結果高度相似的特點。
相較于3’轉錄組,全序列轉錄組能夠捕獲更多的非編碼RNA,有助于深入研究非編碼RNA調控網絡的機制。
單細胞全序列轉錄組研究LncRNA的優勢
2023年3月,一篇題為《High throughput detection of variation in single-cell whole transcriptome through streamlined scFAST-seq》的預印本文章在bioRxiv平臺上發布。該研究提出了一種新的單細胞全轉錄組測序方法,即scFAST-seq,具有以下特點:
1)scFAST-seq將半隨機引物與高效的逆轉錄、模板切換以及rRNA去除方法相結合,能夠在短時間內構建多達12,000個細胞的全長RNA文庫。
2)與常規的3'單細胞RNA測序相比,scFAST-seq在mRNA檢測靈敏度、測序成本和實驗工作流程等方面表現出類似的優勢。
3)scFAST-seq在檢測不帶有poly-A尾的轉錄本、覆蓋更長的轉錄本長度以及識別更多splice junctions等方面具有明顯的技術優勢。
4)該方法能夠更準確地預測細胞的分化方向。
5)結合靶向區域富集技術,scFAST-seq可以同時鑒定單個腫瘤細胞的體細胞突變和細胞狀態。
單細胞轉錄組測序下LncRNA的研究現狀
2023年,Circulation雜志在線發表了一篇題為《Assessment of the Cardiac Noncoding Transcriptome by Single-Cell RNA Sequencing Identifies FIXER, a Conserved Profibrogenic Long Noncoding RNA》的研究論文。該研究通過單細胞RNA測序對心臟非編碼轉錄組進行全面評估,成功鑒定出一個保守的促纖維化長鏈非編碼RNA,命名為FIXER。該發現可能代表了一種新的治療靶點,為研究心臟纖維化提供了新的突破。
2023年,Nature Communications期刊發表了一篇題為《Single-cell profiling of lncRNA expression during Ebola virus infection in rhesus macaques》的研究文章。該研究通過在單細胞水平上進行lncRNA表達分析,深入研究了在恒河猴感染埃博拉病毒(EBOV)期間,lncRNA的表達模式變化。研究發現,這些lncRNAs呈現出與蛋白質編碼基因相似的表達模式,通常與已知的免疫調節因子共表達。有一些lncRNAs在EBOV進入細胞時表現出特異性的表達變化,為深入理解埃博拉病毒感染的免疫調控機制提供了新的視角。
2021年,Genomics, Proteomics & Bioinformatics期刊上發表了一篇題為《Single-cell Long Non-coding RNA Landscape of T Cells in Human Cancer Immunity》的研究文章。研究團隊利用來自3種癌癥類型不同組織的20,000多個T細胞單細胞全長轉錄組數據,創建了一個完整的T細胞lncRNA數據集,并分析了與不同T細胞狀態相關的功能,為探索lncRNA在腫瘤T細胞中的調控機制提供了豐富的數據資源。
小結
迄今為止,大多數LncRNA的研究主要依賴于Bulk RNA測序數據。然而,這種方法所得到的信息僅能計算各種不同細胞類型的平均信號。這一限制既阻礙了對細胞特異性LncRNA功能的深入挖掘,也可能忽略一些重要的LncRNA。scRNA-seq為克服這一問題提供了潛在的解決方案。尤其是單細胞全序列轉錄組測序在對比三代全長測序通量低且價格昂貴時具有顯著的優勢。當然,全轉錄組測序并非沒有缺點,其對于低豐度轉錄本的捕獲效率和穩定性仍存在一定挑戰。
總體而言,單細胞全轉錄組測序為研究LncRNA提供了一種高分辨率和全景的途徑,有助于揭示LncRNA在細胞類型、生物發育和疾病進展階段等過程中的表達與功能調控。然而,未來仍需克服一些技術和數據處理上的挑戰,這需要該領域的技術人員投入相應的資金和時間。
[參考文獻]
[1] Santus L, Sopena-Rios M, García-Pérez R, et al. Single-cell profiling of lncRNA expression during Ebola virus infection in rhesus macaques. Nat Commun. 2023;14(1):3866. Published 2023 Jun 30. doi:10.1038/s41467-023-39627-7IF: 16.6 Q1
[2] Luo H, Bu D, Shao L, et al. Single-cell Long Non-coding RNA Landscape of T Cells in Human Cancer Immunity. Genomics Proteomics Bioinformatics. 2021;19(3):377-393. doi:10.1016/j.gpb.2021.02.006IF: 9.5 Q1
[3] Aghagolzadeh P, Plaisance I, Bernasconi R, et al. Assessment of the Cardiac Noncoding Transcriptome by Single-Cell RNA Sequencing Identifies FIXER, a Conserved Profibrogenic Long Noncoding RNA. Circulation. 2023;148(9):778-797. doi:10.1161/CIRCULATIONAHA.122.062601IF: 37.8 Q1
[4] High throughput detection of variation in single-cell whole transcriptome through streamlined scFAST-seq