????在轉錄調控相關的文獻中,我們經常能夠看到這樣的蛋白質相互作用網絡(protein protein interaction network,PPI network)。具體而言,這些相關的文獻中首先通過RNA-seq、表達譜芯片或者蛋白質組分析等,找到了在不同分組樣本間一系列的差異表達基因或蛋白。隨后,通過STRING數據庫(https://string-db.org/)檢索了編碼蛋白間可能的潛在相互作用,并構建了蛋白質相互作用網絡表示出來,目的是描述這些基因或蛋白之間存在怎樣的相互關系,例如物理接觸、靶向調節等,最終闡述生物體中有意義的分子調節網絡。
????目前,STRING數據庫收錄了超過5000個物種、2千多萬種蛋白、30多億個相互作用的信息。這些蛋白質相互作用既包括直接的物理作用,也包括共表達相關性。通過STRING數據庫,我們可以很方便地搜索已知蛋白間的關系,以更好地理解生物體中復雜的調控網絡。
????本節就讓小編帶大家認識STRING數據庫的蛋白質相互作用(PPI)網絡分析,以下簡稱PPI網絡。類似地,以給定的一串基因名稱列表為例進行搜索。
1、準備輸入數據
????假設我們同樣基于表達譜數據獲得了一些差異表達的基因列表,現在有待于識別這些基因間的關系。考慮到編碼基因發揮作用的最終形式是以蛋白功能實現的,因此就通過STRING數據庫搜索這些差異基因間可能的相互作用。
??
2、輸入基因名稱列表并指定物種
????首先打開STRING數據庫(https://string-db.org),點擊主頁的“SEARCH”。新界面中,選擇“Multiple proteins”執行多蛋白間的相互作用分析。輸入或上傳給定的基因或蛋白名稱列表,并在“Organism”中指定物種,然后點擊“SEARCH”進入下一步。
??
3、基因-蛋白關系確認
在新界面中,STRING數據庫返回了給定基因對應的蛋白名稱,有待進一步確認。默認情況下,直接點擊“CONTINUE”繼續即可。
??
4、蛋白互作(PPI)網絡獲得
????然后會在數據庫中匹配給定蛋白的相互作用關系,很快即可得到PPI網絡了。
????網絡圖中,節點代表各蛋白,節點標簽為這些蛋白的名稱。節點中的圖案代表了該蛋白質的三維結構,如果為空則結構目前未知。若兩個蛋白質之間存在相互作用,則以連線連接,連線的顏色反映了互作類型,包括試驗驗證的或預測得到的,也包含直接物理作用、共表達、基因融合等關系。有關節點和連線的顏色等所代表類型的詳細信息,可點擊下方“Legend”查看。
????在網絡圖中點擊感興趣的某特定蛋白,將以彈窗展示其名稱、結構、功能、物種來源等詳細信息。對于表征蛋白互作的連線的描述同樣如此,點擊感興趣的連線,將彈窗展示互作兩節點的描述,證據來源,互作類型,以及得分值等信息。
??
5、網絡編輯
????對于網絡圖中孤立的不存在任何互作的蛋白,如不期望展示,可在“Setting”的下方選擇“hide disconnected nodes in the network”隱藏。
????類似地,根據蛋白間的互作類型或互作強度、可信度等,也可在“Setting”中進行一些篩選。例如可選是否展示直接物理互作、共表達、基因融合等類型,或者根據互作得分過濾去除低可信的、強度較弱的互作等。
????對于網絡整體布局,可以在網絡中拖動節點的位置,進行調整。
??
6、蛋白功能分析
????此外,STRING同時還能對網絡中的蛋白進行基因本體(GO)富集分析等,提供這些蛋白所參與功能的見解。
??
7、網絡圖及蛋白互作關系表的輸出
????最后對網絡圖輸出保存,或者將識別的蛋白質相互作用關系導出,可點擊“Exports”,選擇需要的信息下載。
????例如這是調整布局后,去除孤立節點并過濾低可信度相互作用的最終網絡。