pacbio数据分析

Fastp完美支持gzip的输入输出,以及SE和PE数据,不仅支持类似Illumina平台的shortread数据,还在一定程度上支持PacBio/Nanopore的longreads数据 。使用fastp进行数据质量控制fastp是一个相对较新的数据质量控制软件,之所以接触这个软件,是因为现在市面上的软件都有自己的功能,但都不完整,比如最近接触到一个RNAseq数据,质量很差,需要去掉,而且序列开头的数据很差,需要去掉几个bp,本来打算用trimmomatic去掉连接器 , 启动几个bp cutadapt去掉N多的序列,但是发现有点复杂 。
1、全长转录本的鉴定isoform sequencing(iso seq)基于PacBio单分子实时测序技术(SMRTcell) 。利用长阅读长度的优势,反向全长cDNA可以在数据库构建过程中不中断RNA分子而直接测序,可以获得高质量的5’端至3’PolyA端全长转录序列 。目前其CCS模式可以达到超高的准确率,可用于转录本识别和转录本识别 。
2、基因组文章|灵宝杜鹃《MolecularEcologyResources》2021【pacbio数据分析】转自:近日,洛阳师范学院植物多样性保护研究组和Fraser Gene发表了一篇题为《Hodonderdonhennessubsp的染色体Scalegenomeassembly、Annotation和志愿服务》的研究论文 。国际主流期刊Molecule recology resources(if 7.09,中科院第一区)上的《灵宝ense》 。
3、使用fastp进行数据质控fastp是一个比较新的数据质量控制软件 。之所以接触这个软件,是因为现在市面上的软件都有自己的功能,但都不完整 。举个例子 , 最近接触到一个RNAseq数据,质量很差,序列开头的数据需要去掉,需要去掉几个bp 。本来打算用trimmomatic去掉连接器,启动几个bp cutadapt去掉N多的序列,但是感觉有点复杂 。让我们看看fastp能做什么 。
Fastp完美支持gzip的输入输出,以及SE和PE数据,不仅支持类似Illumina平台的shortread数据,还在一定程度上支持PacBio/Nanopore的longreads数据 。Fastp软件会生成HTML格式的报告,报告中没有静态图片,所有图表都是用JavaScript动态绘制的 , 交互性很强 。

    推荐阅读