群體遺傳學(xué)習(xí)筆記-測序技術(shù)學(xué)習(xí)

重測序技術(shù)簡介

全基因組重測序(Resequencing)是對已知參考基因組序列的物種進(jìn)行不同個體間的基因組測序，并在此基礎(chǔ)上對個體或群體進(jìn)行差異性分析。通過全基因組重測序，將不同梯度插入片段（Insert-Size）的測序文庫結(jié)合短序列（Short-Reads）、雙末端（Paired-End），可以找到大量的單核苷酸多態(tài)性位點(SNP)、拷貝數(shù)變異(Copy Number Variation，CNV)、插入缺失(InDel，Insertion/Deletion)、結(jié)構(gòu)變異(Structure Variation，SV) 等變異信息，應(yīng)用范圍涉及臨床醫(yī)藥研究、群體遺傳學(xué)研究、關(guān)聯(lián)分析、進(jìn)化分析等眾多領(lǐng)域。

原理

將特定組織或者細(xì)胞中的DNA進(jìn)行隨機(jī)打碎，構(gòu)建片段為350bp或者500bp的文庫，通過Illumina Hiseq對文庫進(jìn)行高通量測序，從而獲得某一個個體所有DNA序列的信息。

全基因組數(shù)據(jù)分析的必要條件

所測物種的序列是有參考基因組的
所測序個體與參考基因組之間遺傳差異性不大 (read 比對不上，很難找到SNP 等突變信息）

評價測序量的指標(biāo)

測序深度是評價測序量的最重要指標(biāo)。測序深度（Sequencing Depth）：測序得到的堿基總量（bp）與基因組大小（Genome）的比值。
測序覆蓋比例（Sequencing Coverage），指的是基因組上至少被檢測到1次的區(qū)域，占整個基因組的比例。

例如，在某1個樣本測序的項目中，基因組平均測序深度為60X。基因組大部分區(qū)域的測序深度在60X左右，但同時依然有一小部分區(qū)域的測序深度低于3X（極低覆蓋或沒有覆蓋）。
當(dāng)然，這是理想條件下。在實際情況下的覆蓋度，會低于理想值。主要是由于GC含量偏好，基因組完整性，個體差異，重復(fù)序列影響等。

此處輸入圖片的描述

如下圖，在某1個樣本測序的項目中，基因組平均測序深度為60X。基因組大部分區(qū)域的測序深度在60X左右，但同時依然有一小部分區(qū)域的測序深度低于3X（極低覆蓋或沒有覆蓋）。
當(dāng)然，這是理想條件下。在實際情況下的覆蓋度，會低于理想值。主要是由于GC含量偏好，基因組完整性，個體差異，重復(fù)序列影響等。

測序深度與基因組覆蓋度之間是一個正相關(guān)的關(guān)系，測序帶來的錯誤率或假陽性結(jié)果會隨著測序深度的提升而下降。重測序的個體，如果采用的是Paired-End，當(dāng)測序深度達(dá)到10x時基因組的覆蓋度已接近飽和，基因組覆蓋度和測序錯誤率控制均得以保證。

此處輸入圖片的描述

但SNP的檢測率卻沒有達(dá)到飽和。這是由于當(dāng)深度達(dá)到10X的時候，雖然基因組大部分區(qū)域已被覆蓋，但在覆蓋到的區(qū)域中，依然有相當(dāng)多的區(qū)域深度小于3_{4X。SNP檢測的最低深度標(biāo)準(zhǔn)通常為3}4X。如果沒有達(dá)到這個水準(zhǔn)，則判斷其不可靠，而在分析結(jié)果中不予接受。為了進(jìn)一步減少低測序深度區(qū)域的比例，則需要進(jìn)一步提高測序深度。只有測序深度達(dá)到30X的時候，SNP檢測才會達(dá)到飽和

此處輸入圖片的描述

因此，可以根據(jù)我們的研究目的來選擇相應(yīng)的測序深度。

此處輸入圖片的描述

重測序應(yīng)用

目前重測序技術(shù)已廣泛應(yīng)用于農(nóng)學(xué)、醫(yī)學(xué)等各個研究領(lǐng)域，包括性狀相關(guān)候選基因篩選、動植物育種、單基因病篩查、癌癥篩查等，快速準(zhǔn)確，對育種和臨床診斷有很好的指導(dǎo)作用。下面舉例一些重測序常用的應(yīng)用范圍和主要思路。

此處輸入圖片的描述

個體重測序，突變體檢查（對每個個體的位點進(jìn)行掃描）
混池重測序，群體進(jìn)化分析（通過SNP進(jìn)行后續(xù)分析)
BSA，遺傳圖譜構(gòu)建
Hic-主要是做人類比較有用，這里不多說了。

動植物重測序文章思路

GWAS與群體進(jìn)化相結(jié)合

隨著GWAS統(tǒng)計方法的不斷完善，GWAS能夠適用于大部分物種，將GWAS與群體進(jìn)化結(jié)合分析為性狀關(guān)鍵基因定位提供了一個新的思路。

此處輸入圖片的描述

GWAS與QTL定位相結(jié)合

連鎖分析和關(guān)聯(lián)分析在數(shù)量性狀研究上都具有重要作用，它們在QTL定位的精度和廣度、提供的信息量、統(tǒng)計分析方法等方面具有明顯的互補(bǔ)性。

此處輸入圖片的描述

簡化基因組測序

簡單來說是對與限制性核酸內(nèi)切酶識別位點相關(guān)的DNA進(jìn)行高通量測序。

其實那么多種簡化基因組方法的區(qū)別就在于單酶切還是雙酶切、是否有隨機(jī)打斷、使用不同的內(nèi)切酶、是否加barcode、接頭設(shè)計等這些細(xì)節(jié)，本質(zhì)還是一樣的，就是對基因組進(jìn)行酶切并對酶切片段進(jìn)行測序。在這些方法中，RAD和GBS是使用最廣泛的兩種方法，2b-RAD，dd-RAD，SLAF等都是在這些方法的基礎(chǔ)上在不同細(xì)節(jié)處改良。

RAD（Restriction site Associated DNA）：是與限制性核酸內(nèi)切酶識別位點相關(guān)的DNA。RAD方法對基因組DNA進(jìn)行單酶切，然后對酶切片段超聲波隨機(jī)打斷，因此測序得到的read1是位置對齊的，而read2是參差不齊的，因此可用于denovo聚類拼接，獲得較長的contig，有利于開發(fā)SSR等分子標(biāo)記。

GBS（Genotyping-By-Sequencing）：是指通過測序進(jìn)行基因分型。2011年由Elshire, R. J.提出2。GBS方法對基因組DNA進(jìn)行單酶切，不需要超聲波隨機(jī)打斷，而是利用PCR進(jìn)行片段大小選擇；并且對不同的樣品加上不同的barcode，可對多達(dá)96個樣品進(jìn)行pooling建庫，簡化了建庫步驟，因此比RAD成本更低。現(xiàn)在的GBS經(jīng)過改良，普遍使用雙酶切了，雙酶切能夠得到在基因組上分布更均一的酶切片段。雙酶切的GBS，有時候又被稱為dd-RAD。

dd-RAD（double-digest RAD，也可以稱為dd-GBS）：是雙酶切的RAD，并且通過切膠來進(jìn)行片段選擇，2012年由Brant K.提出3。其實dd-RAD已經(jīng)放棄了經(jīng)典RAD的超聲波片段化的策略，dd-RAD的建庫流程和經(jīng)典的GBS更為相似，所以下文我們也將之稱為dd-GBS。 dd-RAD最大的優(yōu)勢在于，由于使用了兩種內(nèi)切酶處理，最終獲得片段在基因組上的分布更加均一，從而提高了數(shù)據(jù)的有效性。由于目前的GBS方法普遍使用雙酶切，并且用電泳切膠來取代PCR擴(kuò)增來選擇片段大小，因此dd-RAD幾乎等同于目前的GBS方法了

不同方法之間的比較：

簡化基因組的應(yīng)用

簡化基因組技術(shù)由于降低了基因組的復(fù)雜度、比全基因組重測序成本低，因此廣泛應(yīng)用于遺傳圖譜構(gòu)建與QTL定位、群體進(jìn)化分析、群體遺傳分析、全基因組關(guān)聯(lián)分析等研究領(lǐng)域。那么，這么多種方法，應(yīng)該如何選擇呢？概括來說可以從以下幾方面考慮：

1. 所需標(biāo)記數(shù)

不同的研究目的，所需的標(biāo)記數(shù)量并不完全一樣。通常，需要在全基因組范圍內(nèi)進(jìn)行功能區(qū)間掃描和功能基因挖掘的研究，如全基因組關(guān)聯(lián)分析和選擇壓力分析，就需要上萬個高密度的分子標(biāo)記，而系統(tǒng)發(fā)育關(guān)系、地理群體結(jié)構(gòu)、基因流、系譜檢測、連鎖分析等研究的分子標(biāo)記密度則不需要那么高，一般只需要幾百到幾千個分子標(biāo)記足以完成分析。

對于基因定位的研究，不同的研究材料、作圖群體，也會影響到需要的標(biāo)記數(shù)目。例如利用自然群體進(jìn)行全基因組關(guān)聯(lián)分析，所需的標(biāo)記數(shù)與物種的LD衰減距離相關(guān)，物種LD衰減得越快，所需的標(biāo)記數(shù)就越多。又例如利用作圖群體進(jìn)行連鎖作圖QTL定位，所需的標(biāo)記數(shù)與作圖群體類型和群體大小有關(guān)。群體經(jīng)歷的世代越多（如RIL群體），群體越大，則重組事件越多，理論上提高標(biāo)記密度可以有效提高遺傳圖譜的質(zhì)量，所以所需的標(biāo)記數(shù)越多。

因此，可先評估研究所需的標(biāo)記數(shù)，再選擇適合的簡化基因組技術(shù)。RAD技術(shù)因為對所有酶切位點都檢測，因此標(biāo)記數(shù)要比GBS多，適合于需要標(biāo)記密度高的研究，如選擇壓力分析。dd-GBS類的技術(shù)雖然收集的片段偏少，但標(biāo)記分布更加均一，所以數(shù)據(jù)有效性更高；并且建庫成本比RAD低，更適合大樣品量的研究。

2.有無參考基因組

如果所研究物種沒有參考基因組，那么RAD技術(shù)更合適，因為RAD技術(shù)可以利用不對齊的read2進(jìn)行denovo拼接，再與read1拼接，可以得到長達(dá)400~500bp的片段，有利于SSR分子標(biāo)記開發(fā)以及后續(xù)的引物設(shè)計。而2b-RAD由于片段過短，容易受重復(fù)序列干擾，且后期不利于設(shè)計引物驗證測序得到的SNP。因此，2b-RAD不建議用在沒有參考基因組的物種，和大的復(fù)雜的基因組上。

3.研究經(jīng)費

簡化基因組測序與全基因組重測序相比，由于只對酶切片段進(jìn)行測序，因此在測序費用上大大下降。而由于目前的各種簡化基因組技術(shù)都會使用barcode對多個樣品進(jìn)行混合建庫，因此各方法間的建庫成本差異已經(jīng)不大。但RAD文庫構(gòu)建過程中有超聲波打斷步驟、dd-RAD需要使用Pippin Prep等儀器，因此成本還是要比GBS等高。在實際情況中，可根據(jù)具體樣品數(shù)和研究經(jīng)費選擇合適的技術(shù)方法。

總的來說，RAD和GBS技術(shù)是使用最廣泛的兩種簡化基因組技術(shù)，其他的技術(shù)方法都是在這兩者的基礎(chǔ)上的改進(jìn)或細(xì)化。

基因分型芯片

基因分型芯片：利用已知的SNP位點側(cè)翼的序列設(shè)計探針。探針固定在芯片上后，待測定樣本的DNA與芯片雜交并掃描雜交熒光信號，從而鑒定這些探針位點（SNP位點）的基因型。最有代表性的品牌是illumina和affymetrix。

與簡化組測序技術(shù)相比較

從以上比較，我們可以認(rèn)為兩種技術(shù)都是高性價比的大規(guī)模基因分型的方法。但最大的不同的是：

芯片基因分型本質(zhì)上是對已知SNP多態(tài)位點的掃描，來確定樣本在這個位點的基因型。（其實很多做人類醫(yī)療測序的都用的是芯片，人類的SNPs多態(tài)性信息已經(jīng)比較完善了）那么，我們需要預(yù)先知道這個物種的基因組SNPs多態(tài)性信息（一般來源大規(guī)模重測序），然后篩選SNP設(shè)計芯片，才能進(jìn)行后續(xù)的基因分型。打個比方：就是已經(jīng)知道這個位置有個“坑”了，只是看看坑里到底是沙子還是水。所以芯片只能“分型”，不能“發(fā)現(xiàn)”。
簡化基因組測序本質(zhì)上還是測序，所以哪怕這個物種沒有任何已知的SNPs信息，也能使用簡化基因組測序進(jìn)行檢測。測序兼顧了“發(fā)現(xiàn)”和“分型”的功能。

兩個技術(shù)的適用范圍

1. 沒有標(biāo)準(zhǔn)化芯片的非模式物種

遇到非主流的無標(biāo)準(zhǔn)化芯片的物種，測序無疑是最佳選擇。兼顧了SNP的發(fā)現(xiàn)和基因型分型兩個功能。

2. 有標(biāo)準(zhǔn)化芯片的模式物種

如果你研究的物種是人、豬、牛等這些物種，那么芯片公司的提供的芯片還是不錯的選擇的。畢竟這些芯片位點都是優(yōu)化過的，基本是比較均勻地覆蓋了相應(yīng)物種的整個基因組。芯片的數(shù)據(jù)相對簡單，后期數(shù)據(jù)的基本處理更簡單。而測序數(shù)據(jù)，由于數(shù)據(jù)量大，后期數(shù)據(jù)的預(yù)處理復(fù)雜且需要較多計算資源。

那么，模式生物中是否抱定標(biāo)準(zhǔn)化芯片呢？也未必。主要還是兩點：

1）芯片密度是否滿足你的需求？

一些成熟的模式種，例如人，芯片密度都已經(jīng)達(dá)到了兆級別。但對于某些農(nóng)業(yè)種，芯片密度則還停留在較低的水平。例如：illumina玉米和綿羊的芯片，都停留在50k的密度水平，很久沒有優(yōu)化了。不過也可以理解他們的邏輯，反正芯片和測序儀都是他們家生產(chǎn)的。芯片密度不夠？測序啊。哪怕是使用只對基因組一部分進(jìn)行測序的簡化基因組測序，也可以輕松獲得幾百k數(shù)量級的SNP標(biāo)記。所以，對于芯片密度不夠的情況下，測序是芯片很好的替代品。

2）對一些稀有位點的檢測

由于設(shè)計芯片只使用群體中具有普遍性的多態(tài)位點，即這些位點都是在群體中高頻出現(xiàn)的多態(tài)性位點。所以，對一般人群/種群進(jìn)行普遍性的篩查的時候，沒有太大的問題。但如果，我們研究的群體十分特殊（如，研究材料是比較偏的亞種），或研究目標(biāo)就是低頻甚至罕見位點的時候（癌癥、家族遺傳病），芯片就無能為力了——因為芯片上就沒有這些位點的探針啊。

例如，你研究的是藏豬，那么豬的porcine 60k芯片效果就不會太好。因為芯片上的60k位點都是從常見的品種中篩查得到的，這些位點在藏豬這樣的特殊亞種中可能多態(tài)性較差。而藏豬群體中普遍的多態(tài)性位點，標(biāo)準(zhǔn)化芯片上卻沒有。那么，這個時候簡化基因組測序的效果會優(yōu)于芯片。測序嘛，我測的是序列，管你SNPs稀有不稀有通通一網(wǎng)打盡。

總之，基因分型芯片和簡化基因組測序，各有優(yōu)缺點。在具體項目中，應(yīng)該根據(jù)具體情況做選擇。隨著測序價格不斷降低，測序的確會不斷侵蝕芯片的市場空間。但芯片依然有其穩(wěn)定、易標(biāo)準(zhǔn)化、效率高、成本容易控制等優(yōu)點，在某些需要標(biāo)準(zhǔn)化的領(lǐng)域（例如：醫(yī)療診斷領(lǐng)域）有巨大的應(yīng)用空間。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
平臺聲明：文章內(nèi)容（如有圖片或視頻亦包括在內(nèi)）由作者上傳并發(fā)布，文章內(nèi)容僅代表作者本人觀點，簡書系信息發(fā)布平臺，僅提供信息存儲服務(wù)。

人面猴
序言：七十年代末，一起剝皮案震驚了整個濱河市，隨后出現(xiàn)的幾起案子，更是在濱河造成了極大的恐慌，老刑警劉巖，帶你破解...
沈念sama閱讀 229,460評論 6贊 538
死咒
序言：濱河連續(xù)發(fā)生了三起死亡事件，死亡現(xiàn)場離奇詭異，居然都是意外死亡，警方通過查閱死者的電腦和手機(jī)，發(fā)現(xiàn)死者居然都...
沈念sama閱讀 99,067評論 3贊 423
救了他兩次的神仙讓他今天三更去死
文/潘曉璐我一進(jìn)店門，熙熙樓的掌柜王于貴愁眉苦臉地迎上來，“玉大人，你說我怎么就攤上這事。” “怎么了？”我有些...
開封第一講書人閱讀 177,467評論 0贊 382
道士緝兇錄：失蹤的賣姜人
文/不壞的土叔我叫張陵，是天一觀的道長。經(jīng)常有香客問我，道長，這世上最難降的妖魔是什么？我笑而不...
開封第一講書人閱讀 63,468評論 1贊 316
?港島之戀（遺憾婚禮）
正文為了忘掉前任，我火速辦了婚禮，結(jié)果婚禮上，老公的妹妹穿的比我還像新娘。我一直安慰自己，他們只是感情好，可當(dāng)我...
茶點故事閱讀 72,184評論 6贊 410
惡毒庶女頂嫁案：這布局不是一般人想出來的
文/花漫我一把揭開白布。她就那樣靜靜地躺著，像睡著了一般。火紅的嫁衣襯著肌膚如雪。梳的紋絲不亂的頭發(fā)上，一...
開封第一講書人閱讀 55,582評論 1贊 325
城市分裂傳說
那天，我揣著相機(jī)與錄音，去河邊找鬼。笑死，一個胖子當(dāng)著我的面吹牛，可吹牛的內(nèi)容都是我干的。我是一名探鬼主播，決...
沈念sama閱讀 43,616評論 3贊 444
雙鴛鴦連環(huán)套：你想象不到人心有多黑
文/蒼蘭香墨我猛地睜開眼，長吁一口氣：“原來是場噩夢啊……” “哼！你這毒婦竟也來了？” 一聲冷哼從身側(cè)響起，我...
開封第一講書人閱讀 42,794評論 0贊 289
萬榮殺人案實錄
序言：老撾萬榮一對情侶失蹤，失蹤者是張志新（化名）和其女友劉穎，沒想到半個月后，有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體，經(jīng)...
沈念sama閱讀 49,343評論 1贊 335
?護(hù)林員之死
正文獨居荒郊野嶺守林人離奇死亡，尸身上長有42處帶血的膿包…… 初始之章·張勛以下內(nèi)容為張勛視角年9月15日...
茶點故事閱讀 41,096評論 3贊 356
?白月光啟示錄
正文我和宋清朗相戀三年，在試婚紗的時候發(fā)現(xiàn)自己被綠了。大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
茶點故事閱讀 43,291評論 1贊 371
活死人
序言：一個原本活蹦亂跳的男人離奇死亡，死狀恐怖，靈堂內(nèi)的尸體忽然破棺而出，到底是詐尸還是另有隱情，我是刑警寧澤，帶...
沈念sama閱讀 38,863評論 5贊 362
?日本核電站爆炸內(nèi)幕
正文年R本政府宣布，位于F島的核電站，受9級特大地震影響，放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜，卻給世界環(huán)境...
茶點故事閱讀 44,513評論 3贊 348
男人毒藥：我在死后第九天來索命
文/蒙蒙一、第九天我趴在偏房一處隱蔽的房頂上張望。院中可真熱鬧，春花似錦、人聲如沸。這莊子的主人今日做“春日...
開封第一講書人閱讀 34,941評論 0贊 28
一樁弒父案，背后竟有這般陰謀
文/蒼蘭香墨我抬頭看了看天上的太陽。三九已至，卻和暖如春，著一層夾襖步出監(jiān)牢的瞬間，已是汗流浹背。一陣腳步聲響...
開封第一講書人閱讀 36,190評論 1贊 291
情欲美人皮
我被黑心中介騙來泰國打工，沒想到剛下飛機(jī)就差點兒被人妖公主榨干…… 1. 我叫王不留，地道東北人。一個月前我還...
沈念sama閱讀 52,026評論 3贊 396
代替公主和親
正文我出身青樓，卻偏偏與公主長得像，于是被迫代替她去往敵國和親。傳聞我的和親對象是個殘疾皇子，可洞房花燭夜當(dāng)晚...
茶點故事閱讀 48,253評論 2贊 375

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频

群體遺傳學(xué)習(xí)筆記-測序技術(shù)學(xué)習(xí)

群體遺傳學(xué)習(xí)筆記-測序技術(shù)學(xué)習(xí)

重測序技術(shù)簡介

原理

全基因組數(shù)據(jù)分析的必要條件

評價測序量的指標(biāo)

重測序應(yīng)用

動植物重測序文章思路

簡化基因組測序

簡化基因組的應(yīng)用

基因分型芯片

與簡化組測序技術(shù)相比較

兩個技術(shù)的適用范圍

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美 国产 综合 欧美 视频

群體遺傳學(xué)習(xí)筆記-測序技術(shù)學(xué)習(xí)

重測序技術(shù)簡介

原理

全基因組數(shù)據(jù)分析的必要條件

評價測序量的指標(biāo)

重測序應(yīng)用

動植物重測序文章思路

簡化基因組測序

簡化基因組的應(yīng)用

基因分型芯片

與簡化組測序技術(shù)相比較

兩個技術(shù)的適用范圍

推薦閱讀更多精彩內(nèi)容

三个男躁一个女,国精产品一区一手机的秘密,麦子交换系列最经典十句话,欧美国产综合欧美视频