下机数据经过过滤去除接头含量过高或低质量的reads , 得到clean reads用于后续分析 。常见的trim软件有Trimmomatic、Skewer、fastp等 。fastp是一款比较新的软件 , 使用时可以用--adapter_sequence/--adapter_sequence_r2参数传入接头序列,也可以不填这两个参数,软件会自动识别接头并进行剪切 。如go语言解析mat文件:
fastp \
--in1 A1_1.fq.gz \ # read1原始fq文件
--out1 A1_clean_1.fq.gz \ # read1过滤后输出的fq文件
--in2 A1_2.fq.gz\ # read2原始fq文件
--out2 A1_clean_2.fq.gz \ # read2过滤后输出的fq文件
--cut_tail\ #从3’端向5’端滑窗,如果窗口内碱基的平均质量值小于设定阈值 , 则剪切
--cut_tail_window_size=1 \ #窗口大小
--cut_tail_mean_quality=30 \ #cut_tail参数对应的平均质量阈值
--average_qual=30 \ #如果一条read的碱基平均质量值小于该值即会被舍弃
--length_required=20\ #经过剪切后的reads长度如果小于该值会被舍弃
fastp软件的详细使用方法可参考: 。fastp软件对于trim结果会生成网页版的报告,可参考示例和,也可以用FastQC软件对trim前后的数据质量进行评估 , FastQC软件会对单端的数据给出结果,如果是PE测序需要分别运行两次来评估read1和read2的数据质量 。
如:
fastqc A1_1.fq.gz
fastqc A1_2.fq.gz
FastQC会对reads从碱基质量、接头含量、N含量、高重复序列等多个方面对reads质量进行评估 , 生成详细的网页版报告,可参考示例:
经过trim得到的reads可以使用BWA、bowtie2等软件进行比对 。首先需要确定参考基因组fa文件,对fa文件建立索引 。不同的软件有各自建立索引的命令,BWA软件可以参考如下方式建立索引:
bwa index genome.fa
建立好索引后即可开始比对,ATAC-seq推荐使用mem算法,输出文件经samtools排序输出bam:
bwa mem genome.faA1_clean_1.fq.gz A1_clean_2.fq.gz
| samtools sort -O bam -T A1A1.bam
值得注意的是,在实验过程中质体并不能完全去除,因此会有部分reads比对到质体序列上,需要去除比对到质体上的序列 , 去除质体序列可以通过samtools提取,具体方法如下:首先将不含质体的染色体名称写到一个chrlist文件中,一条染色体的名称写成一行,然后执行如下命令即可得到去除质体的bam
samtools view -b A1.bam $chrlistA1.del_MT_PT.bam
用于后续分析的reads需要时唯一比对且去重复的 , bwa比对结果可以通过MAPQ值来提取唯一比对reads,可以用picard、sambamba等软件去除dup,最终得到唯一比对且去重复的bam文件 。
比对后得到的bam文件可以转化为bigWig(bw)格式 , 通过可视化软件进行展示 。deeptools软件可以实现bw格式转化和可视化展示 。首先需要在linux环境中安装deeptools软件,可以用以下命令实现bam向bw格式的转换:
bamCoverage -b A1.bam -o A1.bw
此外 , 可以使用deeptools软件展示reads在特定区域的分布,如:
computeMatrix reference-point\ # reference-pioint表示计算一个参照点附近的reads分布 , 与之相对的是scale-regions,计算一个区域附近的reads分布
--referencePoint TSS\#以输入的bed文件的起始位置作为参照点
-SA1.bw \ #可以是一个或多个bw文件
-Rgene.bed \ #基因组位置文件
-b 3000\ #计算边界为参考点上游3000bp
-a 3000\ #计算边界为参考点下游3000bp,与-b合起来就是绘制参考点上下游3000bp以内的reads分布
-oA1.matrix.mat.gz \ #输出作图数据名称
#图形绘制
plotHeatmap \
-mnew_A1.matrix.mat.gz \ #上一步生成的作图数据
推荐阅读
- 地瓜服务器,地瓜网络技术下载
- 迅捷视频转文字小程序软件,迅捷视频转文字小程序软件免费
- 看一下如何做好线上营销,怎么能做好线上销售
- jquery找到attr的元素,jquery找到所有元素的同辈元素
- mysql怎么安装界面 mysqlyog安装教程
- python脚本运行命令行,python怎么用命令行运行代码
- eve竞技游戏,eve 竞技场
- 如何利用标题引流推文,标题党引流
- 恶意代码java 恶意代码攻击技术不包括