fastqc结果分析详解

R语言中的fastqcr包:在R语言中运行fastqc并集成多个fastqc时,为什么要使用这个R包?有一个函数:fastqc可以指定fastq文件所在的文件夹,输出文件夹,输出文件夹 。可以自动选择输入文件夹中的所有fastq文件,然后运行fastqc , 也可以积分单个fastqc的结果,multiqc也有这个功能 。

1、全基因组测序数据 分析--导了解遗传变异 , 如单核苷酸多态性(SNP)、小插入缺失(InDels)、多核苷酸多态性(MNP)、拷贝数变异(CNV),有助于揭示基因型与表型的关系 。目前,高通量全基因组测序(WGS)和全外显子测序(WES)被广泛用于研究DNA序列变异对人类多样性的影响 , 识别与人类复杂性或孟德尔病相关的遗传变异,揭示不同人群的变异 。

WES的成本可能低于WGS,因为它只覆盖蛋白质编码区,产生的原始数据较少,但WGS提供了更全面的基因组景观,同时考虑了非编码和编码基因组区 。它还允许识别韦斯可能已经错过的SV和CNV 。此外,WGS允许更统一和可靠的覆盖 。总之,WGS是一个比韦斯更普遍的方法 。本教程将指导您完成Genestack上基因突变发现的工作流程 。

2、转录组 分析(3现在以illumina为首的NGS测序,基本上使用的是边合成边测序的技术 。碱基的合成依赖于化学反应,化学反应使碱基链从5’端向3’端不断合成并延伸 。但是随着这个合成过程中合成链的增加,DNA聚合酶的效率会不断下降,特异性开始变差,带来一个问题就是后期碱基合成的错误率会更高;有时候测序仪开始合成反应时,反应不够稳定,也会带来质量值的波动 。

3、ATAC-seq专题---生信 分析流程ATACseq information分析该过程主要分为以下几个部分:数据质量控制、序列比较、峰检测、motif 分析、峰注释、富集分析,下面将对各部分的内容进行说明 。对板外数据进行过滤以移除过多或低质量的读取,并为后续分析获取干净读取 。常见的trim软件有Trimmomatic、Skewer、fastp等 。Fastp是一个相对较新的软件 。使用时,可以使用adapter _ sequence/adapter _ sequence _ R2参数传入接头序列,也可以将这两个参数留空,软件会自动识别接头并切割 。
【fastqc结果分析详解】
4、FastQC的基本介绍

    推荐阅读