R小鹽準備介紹那些小眾又好用的生信數據庫
你想要的R語言學習資料都在這里,快來收藏關注【科研私家菜】
今天R小鹽介紹的數據庫是opencell數據庫 https://opencell.czbiohub.org/
01 opencell數據庫
opencell數據庫提供了蛋白質組尺度測量人類蛋白質定位和相互作用,通過亞細胞定位來探索所有標記的蛋白質。
Proteome-scale measurements of human protein localization and interactions,Explore all tagged proteins by subcellular localization.
opencell數據庫提供了1310個標記蛋白質或目標的顯微鏡圖像和蛋白質相互作用的交互式可視化。每個被標記的蛋白質都有一個專門的頁面,稱為“目標頁面”,它顯示所有的元數據、顯微鏡圖像以及與被標記的蛋白質相關的蛋白質-蛋白質相互作用。對于人類蛋白質組中的每一種蛋白質,都有一個單獨的專用頁面,顯示我們為OpenCell項目收集的數據(如果有的話)。
This website provides interactive visualizations of the microscopy images and protein interactions for all 1,310 tagged proteins, or targets, in the OpenCell library. Each of the tagged proteins has a dedicated page, called the "target page," that displays all of the metadata, microscopy images, and protein-protein interactions associated with the tagged protein. There is also a separate dedicated page for each protein in the human proteome that displays the data, if any, that we have collected for that protein as part of the OpenCell project.
OpenCell 是人類細胞中蛋白質定位和相互作用測量的蛋白質組規模集合。 它建立在包含 1,310 個內源性標記的 HEK293T 細胞系的庫之上,使我們能夠在相同的細胞環境中觀察蛋白質定位(使用活細胞熒光顯微鏡)和蛋白質-蛋白質相互作用(使用 IP-MS)。
該項目是 Chan Zuckerberg Biohub 的 Leonetti 實驗室和 Max Plank 生物化學研究所的 Mann 實驗室以及許多其他合作者之間的合作。
OpenCell 中熒光標記的 HEK293T 細胞系是通過使用基于 mNeonGreen2 的分裂熒光蛋白系統標記人類基因構建的(Feng 等人,2017 年)。 FP 插入位點(N 或 C 末端)是根據來自文獻或結構分析的信息選擇的。 對于每個標記的目標,我們分離了一個 CRISPR 編輯的細胞的多克隆池,然后通過活細胞三維 (3D) 共聚焦顯微鏡、IP-MS 和通過下一代測序對標記的等位基因進行基因分型對其進行表征。
OpenCell 總共標記了 1,757 個基因,其中 1,310 個 (75%) 可以通過熒光顯微鏡檢測并構成本網站上顯示的數據的基礎。 1,310 種蛋白質集合是人類蛋白質組的平衡表示,但線粒體、細胞器腔或細胞外基質特有的蛋白質除外,這些蛋白質無法使用我們當前的分離 FP 系統訪問。
為了最大限度地提高通量,我們使用多克隆策略通過 FACS 選擇基因組編輯的細胞。 這種方法產生了包含具有不同基因型的細胞的多克隆池。 包含 1,310 個標記細胞系的文庫中位數為 61% 的 mNeonGreen 整合等位基因、5% 的野生型和 26% 的非功能性等位基因。 由于非功能性等位基因不支持熒光,因此它們不太可能對其他測量產生影響,尤其是在多克隆群體的背景下。
對于必需基因,熒光標記很容易成功,這表明 FP 融合具有良好的耐受性。 為了驗證我們的方法不會干擾內源性表達水平,我們使用對 12 條標記線中靶向的蛋白質特異的抗體和 63 條標記線中的單次質譜法通過蛋白質印跡來量化蛋白質表達。 這兩種方法都揭示了工程線中標記目標的中值豐度,約為未標記 HEK293T 對照的 80%。 在所有標記的行中,整體蛋白質組組成沒有變化。
02 opencell數據庫使用
opencell數據庫闡明人類細胞的接線圖是后基因組時代的中心目標。 我們結合了基因組工程、共聚焦活細胞成像、質譜和數據科學,系統地繪制了人類蛋白質的定位和相互作用。 我們的方法提供了對組織蛋白質組的分子和空間網絡的數據驅動描述。 這些網絡的無監督聚類描繪了促進生物學發現的功能群落,并揭示了 RNA 結合蛋白形成了由獨特的相互作用和定位特性定義的特定亞組。 此外,我們發現可以從蛋白質定位模式中獲得非常精確的功能信息,這些定位模式通常包含足夠的信息來識別分子相互作用。 與完全互動的網站 opencell.czbiohub.org 配合使用,我們為人類細胞組織的定量制圖提供了資源。
可以查詢蛋白、染色質以及復合物
高清蛋白定位圖片,可以下載tif格式
OpenCell結合了三種策略來增強對人類細胞結構的描述。 首先,OpenCell提出了一個用于高通量細胞生物學的綜合實驗流程,由基因組工程、活細胞顯微鏡和 IP-MS 的可擴展方法推動。 其次,OpenCell提供了精心策劃的本地化和交互組測量的開源資源,可通過 opencell.czbiohub.org 上的交互式 Web 界面輕松訪問。 第三,OpenCell開發了一個分析框架,用于表示和比較交互或本地化簽名(包括用于圖像編碼的自我監督機器學習方法)。 最后,我們展示了我們的數據集如何用于細粒度的機械探索(探索以前未表征的多種蛋白質的功能),以及研究蛋白質組的核心組織原則。
數據庫引用:
OpenCell: proteome-scale endogenous tagging enables the cartography of human cellular organization
關注R小鹽,關注科研私家菜(VX_GZH: SciPrivate),有問題請聯系R小鹽。讓我們一起來學習 生物信息在線數據庫