用vcf2maf
批量把vcf轉(zhuǎn)化成maf文件,使用的是本人寫的pipeline
,會自動記錄哪些步驟已run
,中斷后重新開始不需要再run
。
通過多進程方法,能同時運行多個pipeline
,還能提示一個步驟運行了多少時間。
因為掛新硬盤的原因,關(guān)機掛載硬盤,轉(zhuǎn)移數(shù)據(jù),重新運行腳本,按理說在關(guān)機前被中斷的5個vcf2maf
過程會重新開始,然而發(fā)現(xiàn)這5個vcf2maf
的時間顯著低于前面樣本同步驟,且生成的maf大小明顯偏低。
關(guān)機,掛硬盤折騰了一番,仍然如此,頭大。
后來想著干脆全部樣本重新跑試試 ,作備份時,把待轉(zhuǎn)的vcf文件目錄下,在vcf2maf
過程中由vep
生成的vep.vcf文件全部轉(zhuǎn)移掉,再懷著試一試的想法重新運行vcf2maf
,發(fā)現(xiàn)時間應(yīng)該正常了!!
猜想:可能是vcf2maf
調(diào)用 vep
前,如果檢測到同目錄下有vcf
文件對應(yīng)的vep.vcf
文件,就認為已經(jīng)完成vep
注釋過程,vcf2maf
會直接從vep.vcf
文件轉(zhuǎn)成maf
文件。起初被中斷的5個樣本,并沒有完成相應(yīng)的vep
注釋就直接進入生成maf
過程,從而出現(xiàn)一開始描述的問題。
解決方法:及時把生成的vep.vcf文件轉(zhuǎn)移或刪除