全基因組關聯(lián)分析(genome wide association study, GWAS) 是利用全基因組范圍內篩選出高密度的分子標記對所研究的群體進行掃描, 分析掃描得出的分子標記數(shù)據(jù)與表型性狀之間關聯(lián)關系的方法。GWAS的出現(xiàn)為全面系統(tǒng)地研究基因組學掀開了新的一頁, 目前主要應用于人類疾病復雜性狀的分析, 已鑒定出大量與人類復雜疾病或數(shù)量性狀相關的遺傳變異, 成為研究人類基因組學的關鍵手段。在植物基因組中的研究應用也取得了良好的效果, 應用GWAS發(fā)掘植物復雜數(shù)量性狀基因、為植物分子育種提供依據(jù)已成為國際植物基yans因組學研究的熱點。
在動植物研究中,GWAS相對于傳統(tǒng)的傳統(tǒng)的利用遺傳圖譜做QTL定位有很多優(yōu)勢:
節(jié)約時間 無需構建遺傳群體,GWAS自然群體或者種質資源直接可以用于關聯(lián)分析;
定位精確,人工群體由于群體大小限制,重組不充分定位區(qū)間往往很大,而GWAS使用自然群體都經(jīng)過長時間多世代的繁衍基因組重組充分,關聯(lián)定位準確;
GWAS中表型性狀變異豐富,只要群體足夠大,可以涵蓋幾乎所有的表型性狀,因此GWAS可以關聯(lián)任何性狀,而人工群體由于群體遺傳背景單一,如果父母本中某些表型不存在就無法定位該性狀。
GWAS關聯(lián)分析常常登陸頂級期刊:
案例1:GB -苦蕎-2021群體+gwas文章
基礎數(shù)據(jù):510份苦蕎種質,包括32份野生種質、478份地方種質和7份蕎麥屬種質。本研究對全球14個國家的510份苦蕎種質資源進行了測序分析,共生成原始數(shù)據(jù)3.98 Tb,平均測序深度為12.65X,基因組覆蓋率為91.72%。最終鑒定了1,095,748個SNP和116,516個InDel。
案例2:NC –梨-2021群體gwas文章
基礎數(shù)據(jù):312個沙梨(Pyrus pyrifolia)品系進行了測序,其中231個品系是本地品種(landrace),81個品系是改進的栽培種(improved cultivar)。總測序量產(chǎn)出為2.15Tb數(shù)據(jù),經(jīng)過比對參考基因組、變異檢測以及變異過濾之后得到340萬個SNP(單核苷酸突變)用于下游研究。(值得注意的是,本研究中使用的參考基因組是白梨Pyrus bretschneideri,數(shù)據(jù)與參考基因組的平均比對率是73.5%,這在涉及不同品系和品種的重測序研究當中,是一個可以接受的數(shù)字。)在系統(tǒng)發(fā)育與群體結構的分析當中,顯示出選擇的梨品系大致區(qū)分成兩類(中國品系Group I和日韓品系Group II)。
案例3:NC –毛竹-2021群體gwas文章
基礎數(shù)據(jù):毛竹(Phyllostachys edulis)是世界上最重要的竹種,在我國主要分布于華南地區(qū)。本研究中,作者對來自15個代表性地理區(qū)域的427份毛竹進行全基因組重測序,構建了毛竹基因組變異圖譜,進行了種群進化分析,并對9個重要性狀進行全基因組關聯(lián)分析以確定候選基因,揭示了這一無性繁殖物種的群體多樣性,為了解毛竹進化和農(nóng)業(yè)重要性狀的遺傳機制提供了基礎與資源。427份來自于15個代表性區(qū)域的毛竹種質與近緣種Phyllostachys kwangsiensis,Illumina測序(平均20X)獲得16.60TB數(shù)據(jù)。
GWAS關聯(lián)分析課程推出:
為方便大家快速掌握GWAS分析,我們組學大講堂推出GWAS分析課程,課程主要內容和課程特色:
GWAS分析原理解讀
GWAS分析多軟件多模型關聯(lián)分析(tassel,GAPIT,EMMAX,GEMMA)
眾多模型支持(GLM MLM CMLM ECMLM SUPER FarmCPU Blink FaST EMMA EMMAx GEMMA等)
課程采用docker鏡像,軟件安裝一鍵搞定,數(shù)據(jù)分析無障礙
繪圖命令腳本打包,快速出圖,并可根據(jù)參數(shù)個性化設置,如下面兩個配色的Manhattan圖
圖片精心調制,發(fā)表級圖片輸出: