go语言解析mat文件 go语言解析html(13)


-out A1.pdf \ # 输出图片名称
绘图结果展示:
MACS2能够检测DNA片断的富集区域,是ATAC-seq数据call peak的主流软件 。峰检出的原理如下:首先将所有的reads都向3'方向延伸插入片段长度,然后将基因组进行滑窗,计算该窗口的dynamic λ,λ的计算公式为:λlocal = λBG(λBG是指背景区域上的reads数目),然后利用泊松分布模型的公式计算该窗口的显著性P值 , 最后对每一个窗口的显著性P值进行FDR校正 。默认校正后的P值(即qvalue)小于或者等于0.05的区域为peak区域 。需要现在linux环境中安装macs2软件 , 然后执行以下命令:
macs2 callpeak \
-t A1.uni.dedup.bam \ #bam文件
-n A1 \ # 输出文件前缀名
--shift -100 \ #extsize的一半乘以-1
--extsize 200 \ #一般是核小体大小
--call-summits #检测峰顶信息
注:以上参数参考文献(Jie Wang,et.al.2018.“ATAC-Seq analysis reveals a widespread decrease of chromatin accessibility in age-related macular degeneration.”Nature Communications)
ATAC分析得到的peak是染色质上的开放区域,这些染色质开放区域常常预示着转录因子的结合 , 因此对peak区域进行motif分析很有意义 。常见的motif分析软件有homer和MEME 。以homer软件为例 , 首先在linux环境中安装homer,然后用以下命令进行motif分析:
findMotifsGenome.pl \
A1_peaks.bed \ #用于进行motif分析的bed文件
genome.fa\ #参考基因组fa文件
A1\ #输出文件前缀
-sizegiven \ #使用给定的bed区域位置进行分析 , 如果填-size -100,50则是用给定bed中间位置的上游100bp到下游50bp的区域进行分析
homer分析motif的原理及结果参见:
根据motif与已知转录因子的富集情况可以绘制气泡图,从而可以看到样本与已知转录因子的富集显著性 。
差异peak代表着比较组合染色质开放性有差异的位点,ChIP-seq和ATAC-seq都可以用DiffBind进行差异分析 。DiffBind通过可以通过bam文件和peak的bed文件计算出peak区域标准化的readcount , 可以选择edgeR、DESeq2等模型进行差异分析 。
在科研分析中go语言解析mat文件我们往往需要将peak区域与基因联系起来 , 也就是通过对peak进行注释找到peak相关基因 。常见的peak注释软件有ChIPseeker、homer、PeakAnnotator等 。以ChIPseeker为例,需要在R中安装ChIPseeker包和GenomicFeatures包,然后就可以进行分析go语言解析mat文件了 。
library(ChIPseeker)
library(GenomicFeatures)
txdb- makeTxDbFromGFF(‘gene.gtf’)#生成txdb对象,如果研究物种没有已知的TxDb,可以用GenomicFeatures中的函数生成
peakfile -readPeakFile(‘A1_peaks.narrowPeak’)#导入需要注释的peak文件
peakAnno - annotatePeak(peakfile,tssRegion=c(-2000, 2000), TxDb=txdb)
# 用peak文件和txdb进行peak注释,这里可以通过tssRegion定义TSS区域的区间
对于peak注释的结果,也可以进行可视化展示,如:
p - plotAnnoPie(peakAnno)
通过注释得到的peak相关基因可以使用goseq、topGO等R包进行GO富集分析,用kobas进行kegg富集分析,也可以使用DAVID在线工具来完成富集分析 。可以通过挑选感兴趣的GO term或pathway进一步筛选候选基因 。
【go语言解析mat文件 go语言解析html】关于go语言解析mat文件和go语言解析html的介绍到此就结束了 , 不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站 。

推荐阅读