关于利用脚本批量下载、转换、质控
我们进行获取数据并进行分析时,一个个的操作未免太过麻烦,因此可以利用shell脚本进行批量处理。在此利用之前老师上课讲过的生物软件来利用脚本做一个流程化处理。
首先我们明确一下操作流程
1、利用Aspera批量下载文件
2、利用FastQC语需要.fastq.gz文件,所以我们需要利用SRA-toolkits做格式转换
3、利用FastQC做质控
我的需要批量下载的序列放在sra_list.txt文件中
文章图片
sra_list.txt 下面是一些结果和脚本代码
文章图片
第一步结果
文章图片
第一步结果 第二步结果
文章图片
第二步结果
第三步结果
文章图片
第三步结果 脚本运行结果
文章图片
脚本运行结果 因为是在sra_list.txt中放了三个文件位置,却只下载了两条,有一条错误,我在下面也试了很多次,代码应该没有什么问题,估计可能是服务器不稳定,如果有其他什么发现,欢迎同学们告知
关于后面的序列组装SPAdes和velvet以及序列拼接评价QUAST的脚本,大家有兴趣的可以在后面添加,与此如出一辙。
【关于利用脚本批量下载、转换、质控】今天看了俊辉的脚本发现可以对PE还是SE进行区别,大家也可以看看
推荐阅读
- 关于QueryWrapper|关于QueryWrapper,实现MybatisPlus多表关联查询方式
- 四首关于旅行记忆的外文歌曲
- 醒不来的梦
- 关于自我为中心的一点感想
- 「按键精灵安卓版」关于全分辨率脚本的一些理解(非游戏app)
- 关于Ruby的杂想
- 关于读书的思考
- 关于this的一些问题(1)
- 《声之形》
- 关于如何沟通的1/2/3