遺傳群體所用的技術
簡化基因組
簡化基因組(Reduced-Representation Genome Sequencing,RRGS)是指利用限制性內切酶打斷基因組DNA,對特定片段進行高通量測序獲得海量遺傳多態性標簽序列來充分代表目標物種全基因組信息的測序策略。此方法實驗步驟簡單,成本低,而且可以不依賴參考基因組,就能獲得全基因組范圍內的遺傳多態性標簽,因而廣泛應用于生態學,進化學和基因組學等領域。
? ? ? ? ? ? ? ? ? ? ? ? ?實現高通量測序技術在基因定位研究中的最佳使用方法,全面降低測序成本
? ? ? ? ? ? ? ? ? ? ? ? 適用于所有物種
簡化基因組測序技術的本質=-------------用部分片段代表全基因組
主要的簡化基因組技術比較:使用得比較多的技術主要有四種:即經典的 RAD、經典的 GBS、2bRAD、 ddGBS(也就是ddRAD)。
RAD
基于酶切的簡化基因組測序(RAD-Seq,Restriction-site Associated DNA Sequence)是對與限制性核酸內切酶識別位點相關的DNA進行高通量測序,可大幅降低基因組的復雜度,降低建庫和測序成本,操作簡便,同時不受參考基因組的限制,可快速鑒定出高密度的SNP位點,實現遺傳進化分析及重要性狀候選基因的預測。RAD-Seq尤其適合于大樣本量的研究,可以為利用全基因組重測序技術做深度信息挖掘奠定堅實的基礎。與傳統芯片分型技術相比,RAD-Seq可以檢測基因組上未知變異點中新的SNP,發掘新的和稀有的變異。RAD-Seq技術可廣泛應用于變異檢測、遺傳圖譜構建、功能基因挖掘、群體進化等研究,具有重大的科研和產業價值。
基于RAD-Seq的變異檢測,利用RAD-Seq對某一物種個體或群體的基因組進行測序及差異分析,可獲得SNP、InDel等大量的遺傳多態性信息,建立遺傳多態性數據庫,為后續揭示進化關系、功能基因挖掘等提供理論基礎。
基于RAD-Seq的遺傳圖譜的構建,對酶切獲得的RAD tag進行高通量測序,可以獲得RAD tag上的SNP。可廣泛應用于遺傳圖譜的構建,從而為后續的QTL定位奠定基礎。
基于RAD-Seq的群體進化分析,對物種的各亞種進行RAD測序獲得基因組信息,通過與RAD tag組裝出的參考序列或參考基因組序列進行比對,獲得大量高準確性的SNP變異信息,以進化群體遺傳學分析。
RAD-seq技術流程分為如下幾步:
基因組DNA用限制性內切酶裂解, 然后連接到P1接頭。P1接頭里含有正向擴增和Illumina測序引物位點,以及4~5 bp 的核酸barcode. barcode至少大于3 bp。
之后接頭連接的片段(adapter-ligated fragments)混池,隨機打斷
DNA隨后連接到P2接頭,反向擴增擴展引物無法連接P2. P2是一種Y型接頭,包含P2反向擴增引物位點的反向互補序列,使得不含P1接頭的片段無法擴增。(Y型接頭的工作原理)
最后僅有同時含P1和P2接頭的片段能夠上機測序。
一般情況下,群體進化研究涉及較大的樣本量,RAD-seq可大幅降低基因組的復雜度,降低建庫和測序成本,操作簡便。另外,它不受參考基因組的限制,研究物種范圍更廣泛。RAD-Seq尤其適合于大樣本量的研究,可以為利用全基因組重測序技術做深度信息挖掘奠定堅實的基礎
RADseq中的錯誤與偏差
1)等位基因丟失和無效等位基因:當多態性位點正好位于內切酶的酶切位點時,就會造成等位基因丟失;當等位基因位于的片段缺乏完整的酶切位點將不會被測序,成為無效等位基因,會造成基因分型錯誤。
2)PCR重復和分型錯誤:隨機的PCR擴增過程會造成某一個等位基因比例的不均勻性,這種情況下:雜合子很可能會誤以為是純合子。
3)位點覆蓋深度的差異:一般避免出現覆蓋度差異的方法是增加單個樣本的測序量,這樣會導致測序成本的增加。
ddRAD-seq
ddRAD-seq和GBS相似,兩者都不需要在加接頭后進行隨機打碎,GBS通過PCR擴增的方式過濾了大片段,而ddRAD-seq通過雙酶切的方式,然后篩選固定長度來選擇合適大小的片段
GBS
GBS適用于那些擁有家系群體或自然群體的物種,有無參考基因組均可;尤其適合重復序列較多的物種,如玉米、高粱等。
GBS文庫構建比原始的RAD-seq步驟更加簡單
將不同樣本和含不同barcode接頭成對放在平板里
使用ApeKI限制酶進行酶解
使用T4連接酶,將接頭連接到片段兩端因酶切產生的粘末端(stcky end)
將含不同barcode的樣本混池,隨后過片段長度篩選柱,過濾尚未反應的接頭
加入PCR引物,進行PCR擴增
這里沒有直接對片段進行篩選,但是PCR擴增時優先擴增小片段
GBS和RAD都是基于酶切處理的簡化基因組技術,主要區別如下:
ddRAD-seq
ddRAD-seq和GBS相似,兩者都不需要在加接頭后進行隨機打碎,GBS通過PCR擴增的方式過濾了大片段,而ddRAD-seq通過雙酶切的方式,然后篩選固定長度來選擇合適大小的片段
其實這些RAD-seq文庫制備方法可以簡單的分為兩類:
1)對單酶切位點鄰近片段測序,如最初的RAD-seq
2)對酶切位點兩翼片段測序,如Genoytping-by-Sequencing
參考文獻:
RAD-seq: Rapid SNP discovery and genetic mapping using sequenced RAD markers
GBS: A Robust, Simple Genotyping-by-Sequencing (GBS) Approach for High Diversity Species
ddRAD-seq: Double Digest RADseq: An Inexpensive Method for De Novo SNP Discovery and Genotyping in Model and Non-Model Species
2011 NATURE REVIEWS | GENETICS:Genome-wide genetic marker discovery and genotyping using next-generation
2016 NATURE REVIEWS | GENETICS:Harnessing the power of RADseq for ecological and evolutionary genomics
下面是常見的物RAD-seq方法比較
重測序
重測序是指在已知物種基因組的情況下,對物種內的不同個體或某個個體的不同組織進行基因組重測序,可以在全基因組水平上發現不同個體或組織細胞之間的差異。通過這種方法,可以尋找出大量的單核苷酸多態性位點(SNP),插入缺失位點(InDel,Insertion Deletion),結構變異位點(SV,Structure Variation),拷貝數變異(Copy Number Variation,CNV)等變異信息,從而獲得生物群體的遺傳特征。
與重測序對應的是基因從頭測序也叫做基因de novo測序,是指不依賴于任何已知基因組序列信息對某個物種的基因組進行測序,然后應用生物信息學手段對測序序列進行拼接和組裝,最終獲得該物種基因組序列圖譜。
流程:利用物理方法將基因組DNA進行隨機打斷后,根據建庫所需片段大小進行回收,利用標準的Illumina建庫流程構建小片段測序文庫,采用100PE的模式進行測序,總體的測序深度在30X,但根據不同的實驗測序要求測序深度可以進行調整。
重測序技術相對于其他技術相比具有以下優勢:
(一)除了可以獲得基因表達區的信息,還能獲得內含子、基因間區域的信息;
(二)能夠分析樣品基因組中大片段的結構變異
基因組重測序是針對已知基因組序列的物種而言,重新測序的對象是該物種具有不同性狀的其他個體。通過基因組重測序并進行差異信息分析,人們能夠快速的進行很多有意義的研究,具有重大的科研價值和產業價值。具體來說主要有以下幾點 :
(1)在群體水平研究物種的進化歷史和對環境的適應性。對種內具有不同表型的個體進行基因組重測序,可以在全基因組水平上找到群體內個體間的DNA 差異,包括大量的 SNPs 和結構變異(structurevariations,SVs)等變異信息,而這些差異可能與這些個體的表型差異存在關聯性,從而明確基因組是如何進化以使物種適應不同環境等問題。。(2)基因組重測序可以在全基因組水平掃描出與動植物重要性狀相關的變異位點,是育種研究中迅速有效的新方法。(3)遺傳突變、適應進化和表型篩選是創造出帶有優良性狀突變體的有力工具,基因組重測序技術有利于突變位點的定位和鑒定。
參考文獻:Chen H, He H,?et al., Development and application of a set of breeder-friendly SNP markers for genetic analyses and molecular breeding of rice (Oryza sativaL.).Theor Appl Genet. 123(6):869-879(2011)
Lam HM, Xu X, Liu X, et al. Resequencing of 31 wild andcultivated soybean genomes identifies patterns of genetic diversity? and selection[J]. Nature Genetics, 2010, 42(12):1053-1059
基因芯片
基因芯片也稱DNA微陣列,是生物芯片的一種。基因芯片原理最初是由核酸的分子雜交衍生而來的,即應用已知序列的核酸探針對未知序列的核酸序列進行雜交檢測DNA芯片技術,實際上就是一種大規模集成的固相雜交。是指在固相支持物上原位合成( situ synthesis)寡核苷酸或者直接將大量預先制備的DNA探針以顯微打印的方式有序地固化于支持物表面,然后與標記的樣品雜交。通過計算機對雜交信號的檢測分析,得出樣品的遺傳信息(基因序列及表達的信息)。由于常計算機硅芯片作為固相支持物,所以稱為DNA芯片。
基因芯片采用大量特定的寡核苷酸片段或基因片段作為探針,有規律地固定于與光電測量裝置相結合的硅片、玻璃片、塑料片或尼龍基底等固體支持物上,形成二維陣列,與待測的標記樣品的基因按堿基對配對原理進行雜交,從而檢測特定基因。
1、DNA探針的大量收集和純化,基因芯片探針制備方法可以是根據基因設計特異性的PCR引物,對基因進行特異性地擴張,也可以是建立均一化的cDNA文庫,通過克隆鑒定、篩選、擴增產生;
2、將純化后的探針固定在片基上,首先要將基片(主要用的是玻璃片)進行特殊的化學處理,使玻璃片醛基化或氨基化,然后將純化的探針通過顯微打印或噴打在基片上,再將打印好的玻璃片進行后處理,如水合化、加熱或紫外交聯等;
3、樣品的標記,標記的方法一般是采用逆轉錄法或隨機引物延伸法等;
4、雜交后芯片的掃描、圖像處理的采集和數據分析。
基因芯片的特點
1、高通量、多參數同步分析。目前基因芯片制作工藝可達到在1cm2的載體平面上固定數萬至數十萬的探針,可對樣品中數量巨大的相關基因,甚至整個基因組及信息進行同步檢測和分析。
2、快速全自動分析。在一定的條件下使樣品中的靶基因片段同時與芯片的多個探針進行雜交,并采用掃描儀器測量雜交信號和分析處理數據。從而,從根本上提高了測量工作的速度和效率,也極大降低了測量工作的強度和難度。
3、高精確度分析。由于芯片上的每一點,即每個探針都可以精確定位和選址,加上每個探針都可以精確設計及制備,因此可以精確檢測出不同的靶基因、同一靶基因不同的狀態以及在一個堿基上的差別。
4、高精密度分析。商品化芯片制作上的精密及檢測試劑和方法上的統一在一定程度上保證了芯片檢測的高精密度和重現性,使不同批次乃至不同實驗室之間的檢測結果,可以進行有效比對及分析。
5、高靈敏度分析。基因芯片選用了不易產生擴散作用的載體,探針及樣品靶基因的的雜交點非常集中,加上雜交前樣品靶基因的擴增和雜交后檢測信號的擴張,極大地提高了檢測的靈敏度,可以檢測出1個細胞中低至1個拷貝的靶基因,從而使檢測所需的樣品量大幅度減少,一般只需要10~20μL樣品。
基因芯片的分類
基因芯片類型較為繁多,可以依據不同的分類方法進行分類,一般可分為以下幾種:
1、按照載體上所添加DNA種類的不同,基因芯片可分為寡核苷酸芯片和cDNA芯片兩種:寡核苷酸芯片一般以原位合成的方法固定到載體上,具有密集程度高、可合成任意系列的寡核苷酸等優點,適用于DNA序列測定、突變檢測、SNP分析等;其缺點是合成寡核苷酸的長度有限,因而特異性較差,而且隨著長度的增加,合成錯誤率增加。寡核苷酸芯片也可通過預合成點樣制備,但固定率不如cDNA芯片高,寡核苷酸芯片主要用于點突變檢測和測序,也可用作表達譜研究。cDNA芯片是將微量的cDNA片段在玻璃等載體上按矩陣密集排列并固化,其基因點樣密度雖不及原位合成寡核苷酸芯片高,但比用傳統載體的點樣密度要高得多,cDNA芯片最大的優點是靶基因檢測特異性非常好,主要用于表達譜研究。
2、按照載體材料分類:載體材料可分為無機材料和有機材料兩種,無機材料有玻璃、硅片、陶瓷等,有機材料由有機膜、凝膠等。膜芯片的介質主要采用的是尼龍膜,其陣列密度比較低,用到的探針量較大,檢測的方法主要是用放射性同位素的方法,檢測的結果是一種單色的結果。而以玻璃為介質的芯片,陣列密度高,所用的探針量少,檢測方法具有多樣性,所得結果是一種彩色的結果,與膜芯片相比,結果分辨率更高一些,分析的靈活性更強。
3、按照點樣方式的不同可以分為原位合成芯片、微矩陣芯片、電定位芯片三種。