之前使用gblocks裁剪比對序列,感覺裁剪的不是很智能,大量可能有用的序列被裁剪掉,所以嘗試使用trimal。
1.下載安裝
在自己目錄下輸入
git clone https://github.com/scapella/trimal.git # 安裝trimal
導入trimal安裝包(如果服務器連不上網也可以在這個網站下載安裝包導入服務器)
然后unzip解壓安裝包之后編譯軟件
cd trimal/source
make
使用
trimal常用命令如下:
trimal -in example1 -out output1 -automated1
-in <inputfile>多種格式的輸入文件(clustal,fasta,NBRF / PIR,nexus,phylip3.2,phylip)。
-compareset <inputfile>包含要比較的路線的文件的路徑輸入列表。
-matrix <inpufile>用戶定義的相似性矩陣的輸入文件(默認為Blosum62)。
-out <outputfile>以相同輸入格式輸出對齊(默認標準輸出)。(默認輸入格式)
-htmlout <outputfile>獲取trimal在HTML文件中工作的摘要。
-CUSTAL格式的-clustal輸出文件
-fasta FASTA格式的輸出文件
-nbrf NBRF / PIR格式的輸出文件
-nexus NEXUS格式的輸出文件
-mega MEGA格式的輸出文件
-phylip3.2 PHYLIP3.2格式的輸出文件
-phylip PHYLIP / PHYLIP4格式的輸出文件
互補獲得互補對齊。
-colnumbering獲取舊對齊和新對齊中列之間的關系。
-select {n,l,mk}選擇要從對齊中刪除的列。(請參閱用戶指南)。
-gt -gapthreshold <n> 1 - (允許間隙的序列的分數)。
-st -simthreshold <n>允許的最小平均相似度。
-ct -conthreshold <n>允許的最小一致性值。
-cons <n>保留原始路線中位置的最小百分比。
-nogaps刪除對齊中有間隙的所有位置。
-noallgaps刪除僅由間隙組成的列。
-gappyout在“gappyout”模式下使用自動選擇。該方法僅使用基于間隙分布的信息。(請參閱用戶指南)。
-strict在“嚴格”模式下使用自動選擇。(請參閱用戶指南)。
-strictplus在“strictplus”模式下使用自動選擇。(請參閱用戶指南)。
-automated1使用基于相似性統計的自動方法的啟發式選擇。(請參閱用戶指南)。
-resoverlap位置與列中其他位置的最小重疊被視為“好位置”。(請參閱用戶指南)。
-seqoverlap序列必須具有的“良好位置”的最小百分比才能被保存。(請參閱用戶指南)。
-w <n>(一半)窗口大小,位置i的得分是窗口(i-n)到(i + n)的平均值。
-gw <n>(half)窗口大小僅適用于基于Gaps的統計/方法。
-sw <n>(half)窗口大小僅適用于基于相似性的統計/方法。
-cw <n>(half)窗口大小僅適用于基于Consistency的統計信息/方法。
-sgc打印輸入對齊中列的間隙百分比計數。
-sgt打印累積的間隙百分比計數。
-scc輸入對齊中列的保留值。
-sct打印累計保護值計數。
-sfc從比較文件方法打印所選對齊中列的比較值。
-sft從比較文件方法打印所選對齊的累計比較值計數