近期在NCBI SRA中下載的FastQ數(shù)據(jù)不再提供質量值信息(圖1和圖2),據(jù)說是為了后期便于斂財收費提供質量值,鄙人對這種萬惡的資本主義行徑大為不齒,NCBI這是自絕于世界人民之舉,F(xiàn)astQ中沒有質量值將嚴重影響reads組裝等分析,從而嚴重影響科研進程,拖慢了醫(yī)療、工業(yè)等領域的發(fā)展。
圖1 NCBI下載的FastQ數(shù)據(jù)質量信息全部變成”?"
圖2 NCBI下載的FastQ數(shù)據(jù)質量信息全部變成30
好在,經研究測試,可使用替代方案從EBI數(shù)據(jù)庫下載有質量值的FastQ數(shù)據(jù)。替代方案的具體操作步驟如下:
- 進入EBI數(shù)據(jù)庫,搜索目標SRA數(shù)據(jù)。
- 獲取數(shù)據(jù)下載鏈接,例如,vol1/fastq/SRR203/072/SRR20318972/SRR20318972_1.fastq.gz和vol1/fastq/SRR203/072/SRR20318972/SRR20318972_2.fastq.gz
- 采用ascp下載:
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_1.fastq.gz .
ascp -QT -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 300M -P 33001 -k 1 -T era-fasp@fasp.sra.ebi.ac.uk:vol1/fastq/SRR203/067/SRR20318967/SRR20318967_2.fastq.gz .
下載完畢后即可獲得有質量值的SRA FastQ文件。
其中ascp相關軟件的配置方法詳見應用Aspera高速下載NCBI和EBI數(shù)據(jù) - 簡書 (jianshu.com)。
布萊特楊
2023年1月16日編輯
2023年5月31日 15:02發(fā)布