群體結(jié)構(gòu)分析Admixture 使用遇到報錯及解決

1. 軟件下載及安裝admixture:

使用conda進(jìn)行軟件安裝

conda install?admixture


2. VCF文件格式轉(zhuǎn)換為bed格式文件(似乎admixture 可以直接識別ped/map文件格式的輸入文件)

vcf文件轉(zhuǎn)為ped文件:

方法1:

使用vcftools支持將vcf文件轉(zhuǎn)換成plink對應(yīng)的ped/map格式,如下

vcftools? --vcf input.vcf --plink --out output

方法2:

plink支持直接讀取vcf文件格式,基本用法如下:

plink --vcf input.vcf --recode --out output?


map文件? ? ? 染色體編號為數(shù)字, 未知為0SNP名稱為字符或數(shù)字, 如果不重要, 可以從1編號, 注意要和bed文件SNP列一一對應(yīng)染色體的摩爾未知(可選項, 可以用0)SNP物理坐標(biāo)

重要!?因為轉(zhuǎn)換成的ped和map文件無法匹配,需要手動更改上一步轉(zhuǎn)換好的map文件

map數(shù)據(jù)格式為四列


bed文件? ? 第一列: Family ID # 如果沒有, 可以用個體ID代替第二列: Individual ID # 個體ID編號第三列: Paternal ID # 父本編號第四列: Maternal ID # 母本編號第五列: Sex (1=male; 2=female; other=unknown) # 性別, 如果未知, 用0表示第六列: Phenotype # 表型數(shù)據(jù), 如果未知, 用0表示第七列以后: 為SNP分型數(shù)據(jù), 可以是AT CG或11 12, 或者A T C G或1 1 2 2————————————————版權(quán)聲明:本文為CSDN博主「育種數(shù)據(jù)分析之放飛自我」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。原文鏈接:https://blog.csdn.net/yijiaobani/article/details/83017730

使用plink將ped/map轉(zhuǎn)換為二進(jìn)制的bed文件,命令行如下:

plink --file inputfile --make-bed --out filename

第一個FILENAME的后綴為.ped和.map,生成的第二個FILENAME的后綴為.bed、.bim、.fam

3.1.vcftools去除或保留vcf文件中的樣品

例1:只保留1和10號兩個樣品,執(zhí)行以下代碼:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout ?--indv ?1--indv ?10 ?> out.vcf

例2:刪除1號樣品,執(zhí)行以下代碼:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout ?--remove-indv ?1?> out.vcf

例3:如果樣品較多,也可將樣品保存到文件 id.txt 中,每行為一個樣品ID,格式如下:

sample1

2

..

然后使用下面兩個選項對vcf文件保留或者刪除樣品。

--keep<filename>保留樣品

--remove

<filename> ??刪除樣品

代碼如下:

vcftools --vcf in.vcf --recode --recode-INFO-all --stdout ?--keep id.txt ? > out.vcf

作者:花事Le

鏈接:http://www.lxweimin.com/p/542d9b63dcd1

來源:簡書

著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。


3.2 plink提取指定樣本和指定SNP的數(shù)據(jù)(keep,extract函數(shù)

plink --bfile inputfile --noweb --keep sampleID.txt --recode --make-bed --out fileout

inputfile為不加.bed后綴的bed文件

其中,sampleID.txt第一列為提取的樣本Family ID,第二列為Within-family ID(IID)

plink提取SNP位點:

plink --bfile file --extract snp.txt --make-bed --out snp

其中,snp.txt的文件格式如下,一個SNP位點一行:

rs1

rs2

rs3

4. 如何選擇合適的K值

可以同時運行多個程序, 每個程序不同的k值, 比如, 想要k值選擇1,2,3,4,5, 可以寫為:

?for?K?in?1?2?3?4?5;?do?admixture?--cv?hapmap3.bed?$K?|?tee?log${K}.out;?done

例子:

for K in 1 2 3 4 5 6 7 8 9 10 11 12; do admixture --cv 10729bed2.bed $K | tee log${K}.out; done

多線程: admixture??hapmap3.bed?3?-j?4

使用grep命令去查看*out文件的cv error(交叉驗證的誤差)值:

grep?-h?CV??*.out

結(jié)果如下:(這個K值顯示是否有誤?應(yīng)該從第一開始分別是K=1,2,3依次往下)

對這個K值出現(xiàn)這樣的情況?為何K10開始,個人覺得這個K值顯示有誤,應(yīng)該從第一開始分別是K=1,2,3依次往下

5. 繪制Q值的百分比柱狀圖

使用R語言

ta1?=?read.table("D:/files.3.Q")

head(ta1)

barplot(t(as.matrix(ta1)),col?=?rainbow(3),

????????xlab?=?"Individual",

????????ylab?=?"Ancestry",

????????border?=?NA)


————————————————————————————————————————————

本文部分分析步驟參考了CSDN博主「育種數(shù)據(jù)分析之放飛自我」的原創(chuàng)文章,遵循CC 4.0 BY-SA版權(quán)協(xié)議,轉(zhuǎn)載請附上原文出處鏈接及本聲明。?

原文鏈接:https://blog.csdn.net/yijiaobani/article/details/83017730

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,401評論 6 531
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 98,011評論 3 413
  • 文/潘曉璐 我一進(jìn)店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事?!?“怎么了?”我有些...
    開封第一講書人閱讀 175,263評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經(jīng)常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,543評論 1 307
  • 正文 為了忘掉前任,我火速辦了婚禮,結(jié)果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當(dāng)我...
    茶點故事閱讀 71,323評論 6 404
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發(fā)上,一...
    開封第一講書人閱讀 54,874評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當(dāng)著我的面吹牛,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,968評論 3 439
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側(cè)響起,我...
    開封第一講書人閱讀 42,095評論 0 286
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 48,605評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點故事閱讀 40,551評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發(fā)現(xiàn)自己被綠了。 大學(xué)時的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,720評論 1 369
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,242評論 5 355
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質(zhì)發(fā)生泄漏。R本人自食惡果不足惜,卻給世界環(huán)境...
    茶點故事閱讀 43,961評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,358評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,612評論 1 280
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,330評論 3 390
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當(dāng)晚...
    茶點故事閱讀 47,690評論 2 370

推薦閱讀更多精彩內(nèi)容