人類轉(zhuǎn)錄因子-轉(zhuǎn)載

轉(zhuǎn)自iProteome,作者:項(xiàng)杭,> 原文鏈接iProteome
翻譯自2018年 CELL文章The Human Transcription Factors
英文原文 The Human Transcription Factors

轉(zhuǎn)錄因子(Transcription Factors, TFs)是指能夠以序列特異性方式結(jié)合DNA并且調(diào)節(jié)轉(zhuǎn)錄的蛋白質(zhì)。轉(zhuǎn)錄因子通過識(shí)別特定的DNA序列來控制染色質(zhì)和轉(zhuǎn)錄,以形成指導(dǎo)基因組表達(dá)的復(fù)雜系統(tǒng)。盡管眾多科學(xué)家對(duì)理解轉(zhuǎn)錄因子如何控制基因表達(dá)有著濃厚的興趣,精準(zhǔn)定位轉(zhuǎn)錄因子在基因組上的特異性結(jié)合位點(diǎn),以及轉(zhuǎn)錄因子結(jié)合后最終如何參與轉(zhuǎn)錄調(diào)節(jié)仍然具有挑戰(zhàn)性。

本綜述主要涵蓋了1600多種可能的人類轉(zhuǎn)錄因子和與其中三分之二轉(zhuǎn)錄因子結(jié)合的motif,來鑒定轉(zhuǎn)錄因子并對(duì)其功能進(jìn)行注釋。本文根據(jù)目前對(duì)轉(zhuǎn)錄因子及其功能的理解,為思考轉(zhuǎn)錄因子如何單獨(dú)又如何作為整體工作提供了思路。

01 什么是轉(zhuǎn)錄因子

轉(zhuǎn)錄因子是對(duì)基因組的直接闡釋,是執(zhí)行DNA解碼序列的第一步。許多轉(zhuǎn)錄因子充當(dāng)著主調(diào)節(jié)因子和選擇基因的角色,控制著細(xì)胞類型的決定、發(fā)育模式和特定途徑控制(如免疫反應(yīng))的過程。在實(shí)驗(yàn)中,轉(zhuǎn)錄因子可以促進(jìn)細(xì)胞分化、去分化和轉(zhuǎn)分化。轉(zhuǎn)錄因子和轉(zhuǎn)錄因子結(jié)合位點(diǎn)突變是人類致病的主要因素。在后生動(dòng)物中,他們蛋白質(zhì)序列調(diào)控區(qū)的生理作用通常非常保守,這表明基因組調(diào)控"網(wǎng)絡(luò)"可能同樣是保守的。但是,個(gè)別監(jiān)管序列的轉(zhuǎn)換率很高,當(dāng)時(shí)間尺度更長(zhǎng)時(shí),轉(zhuǎn)錄因子可能會(huì)發(fā)生多拷貝和突變。相同的轉(zhuǎn)錄因子可以調(diào)節(jié)不同細(xì)胞類型中的不同基因(例如,乳腺和子宮內(nèi)膜細(xì)胞系中的ESR1),這表明即使在同一生物體內(nèi)轉(zhuǎn)錄因子的調(diào)節(jié)也是動(dòng)態(tài)的。確定轉(zhuǎn)錄因子如何以不同方式組裝以識(shí)別綁定位點(diǎn)和調(diào)控"網(wǎng)絡(luò)"轉(zhuǎn)錄是一項(xiàng)龐大而令人望而生畏的工作,但是,對(duì)于理解它們的生理作用、解碼基因組的特定功能,以及在復(fù)雜生物中繪制高度特異性表達(dá)程序的編排是至關(guān)重要的。

相對(duì)于其他序列,轉(zhuǎn)錄因子對(duì)特異性結(jié)合序列具有1,000倍甚至更高的偏好,因?yàn)檗D(zhuǎn)錄因子可以通過阻斷其他蛋白質(zhì)的DNA結(jié)合位點(diǎn)進(jìn)而發(fā)揮作用(例如,經(jīng)典的lambda,lac和trp 阻遏物),單獨(dú)結(jié)合特定DNA序列的能力通常被視為調(diào)節(jié)轉(zhuǎn)錄能力的指標(biāo)。如果沒有轉(zhuǎn)錄因子結(jié)合的DNA序列的詳細(xì)信息,就不能在功能上理解這些蛋白質(zhì)。轉(zhuǎn)錄因子與特異性DNA結(jié)合通常概括為“基序”(motif) ,是指給定TF優(yōu)先的相關(guān)短序列組的模型,其可用于掃描較長(zhǎng)序列(例如,啟動(dòng)子)以鑒定潛在的結(jié)合位點(diǎn)。確定DNA結(jié)合的motif通常是詳細(xì)闡釋轉(zhuǎn)錄因子功能的第一步,鑒定潛在的結(jié)合位點(diǎn)為進(jìn)一步分析提供了途徑。在過去的十年中,我們開發(fā)motif和基因組結(jié)合位點(diǎn)的能力得到了顯著提高,從而產(chǎn)生了關(guān)于TF-DNA相互作用的前所未有的大量數(shù)據(jù)。為了開發(fā)目前的TF目錄,本文主要參考了TRANSFAC,JASPAR,HT-SELEX,UniPROBE和CisBP,以及先前的人類轉(zhuǎn)錄因子目錄。

02 如何識(shí)別轉(zhuǎn)錄因子

最早在20世紀(jì)80年代,就描述了真核生物中的主要TF家族,如C2H2-鋅指(ZF),同源域,堿性螺旋 - 環(huán) - 螺旋(bHLH),堿性亮氨酸拉鏈(bZIP)和核激素受體(NHR)。通常通過諸如DNA酶足跡法或遷移率變換的方法鑒定結(jié)合位點(diǎn),再使用N-末端肽測(cè)序,噬菌體文庫(kù)或單雜交篩選鑒定特定結(jié)合蛋白。繼續(xù)通過實(shí)驗(yàn)方法鑒定(例如,單雜交測(cè)定,DNA親和純化-質(zhì)譜,和蛋白質(zhì)微陣列可以篩選新的DNA結(jié)合蛋白),但是今天,大多數(shù)已知和推定的TF已經(jīng)通過先前表征的DNA結(jié)合結(jié)構(gòu)域(DBD)的序列同源性來鑒定,這也用于對(duì)TF進(jìn)行分類。目前在蛋白質(zhì)數(shù)據(jù)庫(kù)(PDB)中可獲得大約100種已知的真核生物DBD類型。迄今為止,除了少數(shù)充分表征的哺乳動(dòng)物轉(zhuǎn)錄因子之外的所有轉(zhuǎn)錄因子都含有已知的DBD。在僅基于與DBD的同源性匹配來推斷功能時(shí)必須小心,因?yàn)椴⒎撬薪Y(jié)構(gòu)域都一定會(huì)結(jié)合特定DNA序列。

03 如何確定TF-DNA結(jié)合的motif

首先根據(jù)結(jié)合位點(diǎn)中每個(gè)堿基的轉(zhuǎn)錄因子的相對(duì)偏好產(chǎn)生一張基礎(chǔ)表或“位置權(quán)重矩陣”(PWM)。在每個(gè)堿基位置,四個(gè)堿基中的每一個(gè)都具有得分,并且將序列的每個(gè)堿基的這些得分相乘來預(yù)測(cè)得到轉(zhuǎn)錄因子對(duì)該序列的相對(duì)親和力。在許多情況下,這反映了對(duì)一個(gè)或少數(shù)相關(guān)序列的強(qiáng)烈偏好。此外,PWM還存在一些缺點(diǎn):基線位置之間可能存在依賴關(guān)系由于DNA形狀或可變形性; 轉(zhuǎn)錄因子可以具有多種結(jié)合模式(例如,蛋白質(zhì)的不同物理構(gòu)型導(dǎo)致分離的,不同的基序)等。為了解釋這些復(fù)雜性,科學(xué)家們開發(fā)了更復(fù)雜的模型,例如結(jié)合了對(duì)二核苷酸和高級(jí)k-mers的偏好,使得轉(zhuǎn)錄因子及其家族的準(zhǔn)確性有所提高。然而,在許多情況下,改進(jìn)的效果很小甚至檢測(cè)不到。PWM仍然是分析轉(zhuǎn)錄因子結(jié)合最常用的模型,并術(shù)語“motif”來表示PWM。

接下來通常通過實(shí)驗(yàn)確定的結(jié)合位點(diǎn)和與motif匹配的序列之間僅存在部分重疊,甚至實(shí)驗(yàn)確定的結(jié)合位點(diǎn)是相對(duì)較差的預(yù)測(cè)因子。同時(shí),motif匹配通常是ChIP-seq(染色質(zhì)免疫沉淀測(cè)序)數(shù)據(jù)集中最富集的序列之一,表明內(nèi)在DNA結(jié)合的特異性對(duì)于體內(nèi)轉(zhuǎn)錄因子的結(jié)合是重要的。出現(xiàn)這樣的現(xiàn)象不是空穴來風(fēng),大多數(shù)轉(zhuǎn)錄因子結(jié)合位點(diǎn)很小(通常是6-12個(gè)堿基),并且是靈活的,因此典型的人類基因(> 20 kb)將包含大多數(shù)轉(zhuǎn)錄因子的多個(gè)潛在結(jié)合位點(diǎn)。因此我們需要通過其它途徑來解決問題,例如轉(zhuǎn)錄因子之間的協(xié)同性和協(xié)同作用,為這種特異性缺陷提供了一個(gè)現(xiàn)成的解決方案。大多數(shù)人類的轉(zhuǎn)錄因子必須共同努力才能完成任何事情,但是他們之間的相互作用和關(guān)系的細(xì)節(jié)大多數(shù)是未知的。結(jié)合DNA后轉(zhuǎn)錄因子的生物化學(xué)作用也在很大程度上未被反映出來。因此,解碼基因調(diào)控如何與TF結(jié)合基序和基因序列相關(guān)仍然是一個(gè)主要的現(xiàn)實(shí)層面的挑戰(zhàn)。

04 轉(zhuǎn)錄因子的協(xié)同性和與核小體的相互作用

理論論證和實(shí)踐觀察表明,后生動(dòng)物的轉(zhuǎn)錄因子一般必須共同作用才能與DNA結(jié)合,在效應(yīng)功能中達(dá)到所需的特異性。轉(zhuǎn)錄因子有多種合作方式,例如幫助相互結(jié)合DNA(協(xié)同結(jié)合)或通過不同機(jī)制影響染色質(zhì)狀態(tài)或轉(zhuǎn)錄(協(xié)同調(diào)節(jié))。TF還可以作為同二聚體(例如,bZIP和bHLH),三聚體(例如,熱休克因子)或更高級(jí)結(jié)構(gòu)協(xié)同結(jié)合。

協(xié)同結(jié)合可以通過幾種方式發(fā)生。當(dāng)它由蛋白質(zhì)-蛋白質(zhì)相互作用介導(dǎo)時(shí)最容易理解,當(dāng)兩個(gè)(或更多個(gè))相互作用蛋白質(zhì)以相容的間隔和方向結(jié)合DNA時(shí),便賦予其額外的穩(wěn)定性。高通量體外研究表明,協(xié)同結(jié)合常常影響復(fù)合物中轉(zhuǎn)錄因子的序列偏好,并且還可能對(duì)兩個(gè)結(jié)合位點(diǎn)之間的間隔序列產(chǎn)生限制。單分子成像的結(jié)果研究證實(shí),當(dāng)多個(gè)轉(zhuǎn)錄因子結(jié)合在一起時(shí)會(huì)占據(jù)更長(zhǎng)時(shí)間。

最近的研究表明DNA介導(dǎo)的協(xié)同結(jié)合也在轉(zhuǎn)錄因子功能中起重要作用。分子建模和結(jié)構(gòu)分析表明,在某些情況下,協(xié)同性是由于DNA促進(jìn)了蛋白質(zhì)之間的接觸。在其他情況下,蛋白質(zhì)結(jié)合在DNA的對(duì)立面或彼此相對(duì)較遠(yuǎn)的一邊,表明DNA直接介導(dǎo)了協(xié)同性。也就是說,一個(gè)轉(zhuǎn)錄因子的結(jié)合以促進(jìn)另一個(gè)轉(zhuǎn)錄因子結(jié)合的方式影響DNA的形狀。

為了與核小體DNA結(jié)合,TF必須與核小體競(jìng)爭(zhēng)或以某種方式與核小體或核小體DNA相互作用以進(jìn)入其位點(diǎn)。TF也可內(nèi)在地與核小體競(jìng)爭(zhēng)結(jié)合TF,此外,一些TF可以啟動(dòng)核小體的置換或至少改變它們的構(gòu)象。這些TF的活性也可能取決于它們結(jié)合核小體DNA的能力,這可能受核小體上結(jié)合位點(diǎn)的旋轉(zhuǎn)定位的影響(例如,Yamanaka因子 POU5F1,SOX2,KLF4和MYC)。另一個(gè)有趣的現(xiàn)象是,不同的染色質(zhì)重塑器具有特定DNA序列和/或核小體構(gòu)象的偏好,表明核小體和核小體的定位機(jī)制賦予了TF功能上額外的DNA序列特異性。

05 轉(zhuǎn)錄因子效應(yīng)器的功能

轉(zhuǎn)錄因子在與DNA結(jié)合時(shí)影響轉(zhuǎn)錄的方式變化很大。一些轉(zhuǎn)錄因子(例如,TBP)可以直接RNA招募聚合酶,還有一些可以招募促進(jìn)特定轉(zhuǎn)錄階段的輔助因子。大多數(shù)真核生物的轉(zhuǎn)錄因子被認(rèn)為通過招募輔助因子起作用。這種“共激活因子”和“輔阻遏物”最初被鑒定為轉(zhuǎn)錄因子效應(yīng)子活性的介質(zhì),通常是大的多亞基蛋白質(zhì)復(fù)合物,或通過幾種機(jī)制調(diào)節(jié)轉(zhuǎn)錄的多結(jié)構(gòu)域蛋白質(zhì)。它們通常涉及染色質(zhì)結(jié)合,核小體重塑和組蛋白或其他蛋白質(zhì)結(jié)構(gòu)域的共價(jià)修飾。IFNβ增強(qiáng)體是共激活因子招募的一個(gè)經(jīng)典例子,其中多個(gè)轉(zhuǎn)錄因子的結(jié)合導(dǎo)致GCN5 / KAT2A和 CBP / p300 組蛋白乙酰轉(zhuǎn)移酶的募集。由此產(chǎn)生的局部染色質(zhì)環(huán)境變化會(huì)引起核小體重塑,如 SWI / SNF復(fù)合物為RNA聚合酶創(chuàng)造空間以結(jié)合并啟動(dòng)轉(zhuǎn)錄。一些共激活因子和輔阻遏物似乎更廣泛。p300經(jīng)常被用作增強(qiáng)子的標(biāo)記物,與數(shù)十種TF相關(guān)聯(lián)。連接TF和RNA聚合酶II的Mediator復(fù)合物類似地與數(shù)千個(gè)基因座相關(guān)聯(lián)。

特異性的效應(yīng)結(jié)構(gòu)域通常可以介導(dǎo)TF特異性輔助因子的招募。同樣,核激素受體的配體結(jié)合結(jié)構(gòu)域以配體和背景依賴的方式促進(jìn)與共激活因子、輔阻遏物和其他TF的相互作用。經(jīng)大量研究后,發(fā)現(xiàn)蛋白質(zhì)中存在的經(jīng)典轉(zhuǎn)錄激活因子序列(例如,TP53, E2F和SP1中發(fā)現(xiàn)的酸性序列),它們通常是非結(jié)構(gòu)化的低復(fù)雜性序列,具有稱為短線性基序的小功能區(qū)域。

TF傳統(tǒng)上被歸類為“激活物”和 “阻遏物”; 然而許多TF根據(jù)所在序列的位置和輔助因子的作用可以招募具有相反作用的多種輔助因子,例如,MAX作為與MNT或MXD1 作為異二聚體與DNA結(jié)合時(shí)起抑制劑作用,當(dāng)作為異二聚體與MYC結(jié)合時(shí)起激活作用。目前還沒有全面的輔助因子目錄。此外,基因激活或增強(qiáng)子和啟動(dòng)子之間的通信所需的生化功能在很大程度上仍然是未知的。人體中多達(dá)443種不同的染色質(zhì)修飾蛋白已經(jīng)做好了歸類,并且已經(jīng)了解了輔助因子和染色質(zhì)蛋白之間的許多相互作用。但是,相同的研究檢測(cè)到很少的TF,這表明TF-輔助因子的相互作用是弱的/瞬時(shí)。

06 人類TF的合集

目前并沒有一個(gè)通用的解決方案可以自動(dòng)生成我們所需要的列表,因此當(dāng)下結(jié)構(gòu)域無法精確地推測(cè)出轉(zhuǎn)錄因子,文庫(kù)又是高度不統(tǒng)一的,電子信息的注解有沒有一個(gè)統(tǒng)一的標(biāo)準(zhǔn)。最新的人類轉(zhuǎn)錄因子庫(kù)發(fā)表于2009年,總共涵蓋了535個(gè)人的轉(zhuǎn)錄因子,并描述了所推測(cè)的DBD。近年來,該文庫(kù)迅速擴(kuò)展。本綜述對(duì)人類轉(zhuǎn)錄因子集進(jìn)行了一定程度的修訂。

本綜述手工查詢了2,765種蛋白質(zhì),為每種蛋白質(zhì)創(chuàng)建了一個(gè)網(wǎng)頁,其中包含所有相關(guān)信息和外部數(shù)據(jù)庫(kù)的鏈接。本綜述考慮了全局序列比對(duì)和DNA已知的結(jié)合的殘基,以便在僅有亞基結(jié)合DNA的家族(例如,ARID,HMG和Myb / SANT)中對(duì)表征不佳的蛋白質(zhì)做一個(gè)評(píng)估。考慮到可行性的因素,我們沒有搜索或記錄蛋白質(zhì)修飾或結(jié)合配偶體等復(fù)雜性。 “HumanTFs”網(wǎng)站(http://humantfs.ccbr.utoronto.ca/)顯示結(jié)果,每個(gè)TF都有一個(gè)單獨(dú)的頁面,以及每種DBD類型的所有已知motif和信息以及序列比對(duì)。此網(wǎng)站還有一個(gè)用戶可以選擇提交其他信息的選項(xiàng)。

image

Table1. 判斷和識(shí)別TF特異性結(jié)合的實(shí)驗(yàn)方法

最終記錄的1,639個(gè)已知或潛在的人類轉(zhuǎn)錄因子,其中大多數(shù)至少包含了兩種DBD類型中的一種(C2H2-ZFs和Homeodomains)。剩下近一半(46%)是另外六個(gè)bHLH 、bZIP 、Forkhead 、核激素受體、HMG / Sox 和ETS(圖1B)。在考慮了缺乏DNA序列特異性的已知亞類后,含有Myb / SANT和HMG結(jié)構(gòu)域的TF比先前估計(jì)的少得多。1,639個(gè)TF中的絕大多數(shù)(93%)或作為單體與DNA結(jié)合或作為同源多聚體與DNA結(jié)合。且許多都包含相同DBD類型的多拷貝(圖1C),但其中大多數(shù)是C2H2-ZF,它們與DNA按列結(jié)合(圖 1A)。每種蛋白質(zhì)的C2H2-ZF數(shù)量變化很大,一定程度上取決于效應(yīng)結(jié)構(gòu)域(圖1B )。含有KRAB的亞型中的大量C2H2-ZF可能是由于靶向單個(gè)轉(zhuǎn)座子所需的特異性。只有一小部分TF(47或?3%)含有多種類型的DBD,而POU是最常見的同源域是最常見的(圖1C )。大多數(shù)人類TF也含有其他蛋白質(zhì)結(jié)構(gòu)域(圖1D):其中有391種不同類型的非DNA結(jié)合結(jié)構(gòu)域,與TF效應(yīng)子功能的多樣化和廣泛網(wǎng)絡(luò)的概念一致。

當(dāng)前的TF列表可能仍然不完整,完整的DBD系列可能仍然未被完全發(fā)掘。實(shí)際上,由于缺乏規(guī)范的DBD,此列表中的69個(gè)TF被歸類為“unknown family”。大多數(shù)這些蛋白質(zhì)缺乏motif(見下文),晶體結(jié)構(gòu)基本上是無法獲得的,并且與DNA結(jié)合的證據(jù)僅包括在單個(gè)文庫(kù)中鑒定的少數(shù)序列。因此,在獲得更多實(shí)驗(yàn)數(shù)據(jù)結(jié)果前,應(yīng)謹(jǐn)慎對(duì)待此類別的TF。

此外,一些已知的DBD系列可能比目前所理解的更大。例如,根據(jù)Interpro和SMART數(shù)據(jù)庫(kù),預(yù)測(cè)的簡(jiǎn)單的AT鉤結(jié)構(gòu)域(由13個(gè)氨基酸[aa]共有序列表示)分別存在于3和21號(hào)人類基因中。然而,一個(gè)更寬泛的定義,只需要在22個(gè)堿基窗口上存在側(cè)翼為多個(gè)堿性殘基的GRP 三肽(Aravind和Landsman,1998),它存在于數(shù)百種人類蛋白質(zhì)中,每種蛋白質(zhì)都可以代表真正的TF。C2H2-ZF家族也值得評(píng)估,因?yàn)槌霈F(xiàn)了更好的模型來識(shí)別這些短的(?23 aa)結(jié)構(gòu)域,并將參與DNA結(jié)合的那些區(qū)域與促進(jìn)與RNA或其他蛋白質(zhì)相互作用的區(qū)域區(qū)分開來(Brayer和Segal,2008)。

image

Figure1. 人類轉(zhuǎn)錄因子合集

07 人類轉(zhuǎn)錄因子的序列特異性

目前大約四分之三(1,211)的人類轉(zhuǎn)錄因子具有與其結(jié)合的motif。已知motif中的913個(gè)是通過體外高通量法(例如HT-SELEX或PBM)測(cè)定出來的。圖1B說明大多數(shù)類別的TF具有高或完全的motif覆蓋,而少數(shù)具有主要差異。例如,幾乎所有的同源結(jié)構(gòu)域(188/196)都有一個(gè)已知或推斷的motif,可能是由于它們相對(duì)容易在體外研究,它們的深層次的特點(diǎn)能夠通過同源性推斷。相比之下,C2H2-ZF類轉(zhuǎn)錄因子目前缺少數(shù)百個(gè)motif(267/747)(圖1B),可能是因?yàn)樗鼈冸y以在體外研究(許多是大蛋白),而且保守的相對(duì)較少。

許多TF識(shí)別相似的motif,通常對(duì)應(yīng)到TF家族或亞家族,這個(gè)現(xiàn)象與許多先前的研究一致(圖 2A)。值得注意的是,C2H2-ZF蛋白為motif中最為多樣性的(圖2B),這與先前所研究得結(jié)構(gòu)和DNA接觸殘基的多樣性一致。圖2C顯示的是NHR家族的motif,說明轉(zhuǎn)錄因子多樣性涉及單體DNA序列偏好和蛋白質(zhì)復(fù)合物形成的變化。圖 2C中的許多motif被二聚體識(shí)別。在人體中總共有超過500個(gè)特異性的motif,表明廣泛的DNA序列可以作為轉(zhuǎn)錄因子結(jié)合位點(diǎn)。

image

Figure2. 特異性結(jié)合人類轉(zhuǎn)錄因子的DNA

08 人類轉(zhuǎn)錄因子的保護(hù)和進(jìn)化

轉(zhuǎn)錄因子的演變通常比它們的調(diào)控位點(diǎn)的演變慢得多。人和果蠅之間的轉(zhuǎn)錄因子直系同源物通常顯示出幾乎相同的序列特異性。盡管如此,轉(zhuǎn)錄因子確實(shí)在不斷進(jìn)化,它們的motif、結(jié)合物和表達(dá)模式都在不停地改變著。人類轉(zhuǎn)錄因子中不變與改變中的一個(gè)突出例子便是大多數(shù)哺乳動(dòng)物基因組編碼了數(shù)百種含有KRAB的C2H2-ZF蛋白,其中許多都顯示出了多樣化選擇的標(biāo)志,在人和小鼠之間也具有復(fù)雜的直系同源模式。在人類中,KRAB C2H2-ZF蛋白通常都與轉(zhuǎn)座子(TEs)(主要是LINE和內(nèi)源性逆轉(zhuǎn)錄病毒)結(jié)合,在初期可能是通過抑制KRAB結(jié)構(gòu)域的功能使它們沉默。轉(zhuǎn)座子和轉(zhuǎn)錄因子之間的“軍事競(jìng)賽”為其迅速而又多樣化的變化做出了很好的解釋。

基于它們?cè)谡婧嘶蚪M中的分布(圖3A ),當(dāng)前的1,639個(gè)轉(zhuǎn)錄因子根據(jù)親緣關(guān)系得知其涵蓋了包括脊椎動(dòng)物,四足動(dòng)物,胎盤哺乳動(dòng)物或靈長(zhǎng)類動(dòng)物在內(nèi)的后生動(dòng)物主要群體。有趣的是,幾乎所有脊椎動(dòng)物都具有同源域蛋白的可識(shí)別對(duì)應(yīng)物,而幾乎所有哺乳動(dòng)物特異性蛋白都含有C2H2-ZF結(jié)構(gòu)域。實(shí)際上,Ensembl定義的人類TF-TF旁系同源物之間的分化都有兩種趨向:兩側(cè)對(duì)稱動(dòng)物中多種TFs家族出現(xiàn)了第一波重復(fù),由KRAB C2H2-ZF主導(dǎo)的第二波重復(fù)則出現(xiàn)在Amniota(圖3B,左)。早期時(shí)整個(gè)多樣性的TF家族的復(fù)制與脊椎動(dòng)物中整個(gè)基因組發(fā)生兩輪復(fù)制的假說一致。該事件與細(xì)胞類型的多元化發(fā)展是大致符合的,并且復(fù)制的TF可能有助于調(diào)控新細(xì)胞類型。KRAB的輻射性增加可能在一定程度上解釋了為什么胎盤能夠很大可能的傳遞逆轉(zhuǎn)錄病毒。值得注意的是,在過去的3億年里,KRAB的輻射區(qū)域中TF-TF的復(fù)制主導(dǎo)了其在所有人類同源物的分布(圖3B,右)。

image

Figure3. 人類轉(zhuǎn)錄因子的直系同源基因和旁系同源基因

09 人類轉(zhuǎn)錄因子在組織和細(xì)胞類型中的表達(dá)

基因(包括轉(zhuǎn)錄因子)的組織和細(xì)胞類型包括TFs的特異性表達(dá)通常對(duì)應(yīng)著相應(yīng)的特定功能。我們使用來自人類組織圖譜中的RNA-seq數(shù)據(jù)檢查了在37個(gè)成人組織中的1,554個(gè)轉(zhuǎn)錄因子的表達(dá)模式(圖4A),采用其組織特異性表達(dá)的定量定義。這種基因表達(dá)模式的全局視圖捕獲了許多特征明確的TF的已知作用。例如,SOX2,OLIG1 和POU3F2(OCT7)幾乎只在大腦皮層中表達(dá),而GATA4和TBX20僅在心肌中高度表達(dá)。該數(shù)據(jù)集中大約三分之一(543)的人類TF表現(xiàn)出組織特異性表達(dá)的特點(diǎn),其中包括許多具有不良特征的生理作用。

在其他的TF家族中,一半(49%)是具有組織特異性的,并提供了關(guān)于其特定生理功能的線索。更高分辨率的數(shù)據(jù),例如來自單細(xì)胞RNA-seq,可以解析同一組織的不同類型細(xì)胞對(duì)轉(zhuǎn)錄因子間的聯(lián)系,使得對(duì)于細(xì)胞鑒定和受轉(zhuǎn)錄因子調(diào)控的基因有更深刻的理解。

10 遺傳學(xué)和疾病中的人類轉(zhuǎn)錄因子

轉(zhuǎn)錄因子占所有人類基因的約8%,并且與多種疾病和表型相關(guān)。轉(zhuǎn)錄因子突變通常是高度有害的,這也解釋了為什么基因組TF編碼位點(diǎn)富含超保守的位點(diǎn)。轉(zhuǎn)錄因子遺傳分析可能因基因調(diào)控網(wǎng)絡(luò)固有的功能冗余而變得復(fù)雜,因?yàn)楸硇涂赡茈y以僅在特定條件下檢測(cè)得到或表現(xiàn)出來,或者因?yàn)樵谌后w水平上具有高度有害作用的變體不存在。盡管如此,關(guān)于臨床表型中人類TF的全球視角確實(shí)揭示了一個(gè)共同的主題。圖 4B展示出了編碼TF的基因內(nèi)或附近的大量突變相關(guān)的人類疾病表型。對(duì)于與先天性生長(zhǎng)激素缺乏有關(guān)的垂體前葉發(fā)育不全觀察到了觀察到大量基因的富集。已知的15種基因參與該表型,其中有12種是編碼TF(p <10 -11 ),包括多個(gè)同源域和Sox家族的轉(zhuǎn)錄因子。總的來說,人313個(gè)(19.1%)的轉(zhuǎn)錄因子至少與一種表型相關(guān),顯著高于所觀察到的部分(16.2%)。相比之下,基于最近的CRISPR篩選的數(shù)據(jù)(3%對(duì)10%),轉(zhuǎn)錄因子從人類癌細(xì)胞系中的核心必需基因組中排除,可能是因?yàn)槿祟惖霓D(zhuǎn)錄因子庫(kù)已主要用于發(fā)育或組織功能特定化。

一些多基因疾病的全基因組關(guān)聯(lián)研究(GWAS)信號(hào)也富集了基因座編碼的轉(zhuǎn)錄因子(圖4C)。這些疾病中的很多都具有強(qiáng)烈的免疫依賴性,表明許多免疫反應(yīng)相關(guān)的轉(zhuǎn)錄因子所具有的突出作用。此外,許多獨(dú)立的轉(zhuǎn)錄因子基因座具有針對(duì)多種疾病的強(qiáng)GWAS信號(hào)。例如,編碼Ikaros基因家族C2H2-ZFS的基因座中,突變體IKZF1 和IKFZ3,在適應(yīng)性免疫應(yīng)答中起到了至關(guān)重要的作用。

轉(zhuǎn)錄因子的模塊化結(jié)構(gòu)有助于突變影響的機(jī)制的識(shí)別。DBD突變會(huì)改變序列特異性,位于DBD之外的突變也可能對(duì)基因表達(dá)產(chǎn)生很大的影響。在癌癥中,染色體異常可以產(chǎn)生具有新功能的癌融合蛋白,例如Ets因子ERG和 FLI1 與RNA結(jié)合蛋白EWSR1融合。同樣的,對(duì)于任何基因,在控制TF表達(dá)的調(diào)節(jié)區(qū)內(nèi)的突變,最終導(dǎo)致TF功能改變。例如,在驅(qū)動(dòng)MYC 表達(dá)的增強(qiáng)子中弱化TCF7L2(TCF-4)結(jié)合位點(diǎn)可降低結(jié)腸中腫瘤發(fā)生的風(fēng)險(xiǎn)。

轉(zhuǎn)錄因子作為一類獨(dú)特的基因,它們的結(jié)合位點(diǎn)會(huì)受所調(diào)節(jié)的DNA的變異或突變影響。目前發(fā)現(xiàn)了許多這樣的例子,其中涵蓋了大量的的轉(zhuǎn)錄因子家族疾病。更深入地了解轉(zhuǎn)錄因子對(duì)于如何找到對(duì)應(yīng)目標(biāo)并控制基因表達(dá)模式對(duì)于我們了解85%-93%的常見疾病相關(guān)的遺傳變異有極大的幫助。

基因組中的大多數(shù)的功能性DNA都是具有調(diào)節(jié)性的,轉(zhuǎn)錄因子在其的識(shí)別和功能發(fā)揮中起著核心作用。在許多人類疾病中TFs有著明顯的作用,使得理解轉(zhuǎn)錄因子所介導(dǎo)的基因調(diào)控機(jī)制的重要性更加突出。目前所面臨的挑戰(zhàn)依然存在,包括解決調(diào)節(jié)相同基因的多種元件之間的協(xié)同作用和冗余,預(yù)測(cè)增強(qiáng)子-啟動(dòng)子的聯(lián)系,沿染色體及其三維結(jié)構(gòu)上大規(guī)模調(diào)控的特點(diǎn),以及各種類型的表觀遺傳記憶。解決這些挑戰(zhàn)的計(jì)算機(jī)方法是正在進(jìn)行中,開發(fā)探索轉(zhuǎn)錄因子在成核和調(diào)停的實(shí)驗(yàn)技術(shù)同樣也在進(jìn)行著。這些進(jìn)展將有助于我們達(dá)到下一個(gè)人類遺傳學(xué)前沿:以TF的方式解碼基因組。

Origin: Lambert SA, Jolma A, Campitelli LF, Das PK, Yin Y, Albu M, Chen X, Taipale J, Hughes TR, Weirauch MT, The Human Transcription Factors.Cell 2018 Feb 08;172(4)
IF: 31.398 Cell 2018 Feb 08;172(4)DOI:10.1016/j.cell.2018.01.029

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個(gè)濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,702評(píng)論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,143評(píng)論 3 415
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,553評(píng)論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長(zhǎng)。 經(jīng)常有香客問我,道長(zhǎng),這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,620評(píng)論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點(diǎn)故事閱讀 71,416評(píng)論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,940評(píng)論 1 321
  • 那天,我揣著相機(jī)與錄音,去河邊找鬼。 笑死,一個(gè)胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 43,024評(píng)論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長(zhǎng)吁一口氣:“原來是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,170評(píng)論 0 287
  • 序言:老撾萬榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個(gè)月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,709評(píng)論 1 333
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 40,597評(píng)論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點(diǎn)故事閱讀 42,784評(píng)論 1 369
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,291評(píng)論 5 357
  • 正文 年R本政府宣布,位于F島的核電站,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 44,029評(píng)論 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,407評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,663評(píng)論 1 280
  • 我被黑心中介騙來泰國(guó)打工, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個(gè)月前我還...
    沈念sama閱讀 51,403評(píng)論 3 390
  • 正文 我出身青樓,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親。 傳聞我的和親對(duì)象是個(gè)殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 47,746評(píng)論 2 370

推薦閱讀更多精彩內(nèi)容