使用clusterprofiler包进行基因富集分析遗传富集分析可能是生物信息学中最常用的分析 。下面总结了clusterprofiler包的主要功能,为什么要在引用中使用genesetenrichmentanalysis 。
1、RNA-Seq(9最广为人知的富集分析方法是将上调和下调的基因分离或组合起来做GO和KEGG富集分析 。往往有一些数据集,使用差异基因无法得出结果 。那是因为不丰富任何通路是正常的 。试试GSEA,不是取不同的基因,而是取所有的基因作为输入 。GSEA和GO的区别,KEGG 分析: GO , KEGG 分析更多的是依赖于不同的基因,但实际上对于某些基因是分析(忽略差异不显著的基因),而GSEA是从所有基因的表达矩阵中找出协同差异的 。所以差异不大的基因GO可以考虑,KEGG富集是定性的分析,GSEA考虑了表达或其他测量水平的影响 。
2、医学生视角下的GSEA富集 分析关于GSEA浓缩分析,我其实和它接触了很久,但一直没有更进一步 。白细胞介素的学生花时间来测试 。关于原理的理解,我考虑到自己的情况只是使用,所以不深究数学公式 。我只需要了解一下它的原理,和常用的大卫的分析有什么不同 。常规的富集分析通常是在差异分析之后获取差异基因集合,然后进入富集分析,但值得注意的是 , 差异基因的获取必须设置阈值 。一般来说,如果一个基因的微分倍数是1.2,你觉得是差吗?
【gsea分析protocol】
从生物学的角度来看,1.2倍的差异也可能是差异,因为有时某些基因表达的微小变化也可能引起重要的生物学功能变化 。其实点击软件并不难 。难点是要理解清楚输入的数据格式,需要哪些数据,格式是什么?至于操作,其实网上有很多教程,可以在这里留下链接 , 就不闭门重复了 。输入文件准备教程及结果解读教程2白细胞介素同学当然已经测试完整了 。给你看看结果,就是一个文件夹包含了所有的结果 。
3、GSEA基因富集 分析R语言版官方github地址1 。安装库(devtools)install _ github(gseamsigdb/gsea _ r)2 。查看文档?GSEA::GSEA3 。给出两个主要的输入文件格式:input . dsandinput . clsrnaseq data input . dsg sea(input . ds system . file( ext data ,
Package gsea ,mustworktrue),input.clssystem.file (extdata , Leukemia.cls,package gsea ,mustworktrue),# input file input . chip system . file( ext data ,human _ affy _ Hg _ u95 _ MSI) 。
4、go,kegg, gsea的取舍(一发现三个基因都富集分析 。经过搜索,初步结论是go和kegg是富集度差异显著的基因,gsea是富集度差异的基因 。只要参与就可以参与p值为0.049的浓缩,而go和kegg不能 。只有显著的充实gsea是对go和kegg的补充 , 不太显著的基因也可以充实分析,做到物尽其用 , 把所有不同的基因都用上,所以go和kegg也可以充实gsea,因为是充实 。只有文章展示出来,才会有筛选 。只选择写好的go,kegg和gsea Do go,keggR包:Do go,keggR包,然后用什么数据和数据格式进行图形显示 。go,kegg可以在直接R包的开头尽量使用EntrizeID , 因为(genesymbol)会造成不必要的缺点(至于为什么?
5、GEO数据挖掘小尝试:(三Install clusterProfiler:对于未转换的geneID,cluster profiler还提供了bitr方法来转换ID:可以看到,这里转换后的ID对应的文件来自包org.Hs.eg.db,在开始enrich 分析之前,先看看GO和KEGG enriching分析:import data的方法和参数 , 这是一个集成的数据 。这里需要用到的只有entrezID列和最后一列(logFC):因为cluster profiler enrichment分析推荐的输入文件是EntrezID,所以这里提取EntrezID 。接下来可以进行富集分析:KEGG途径富集函数的用法与GO富集类似分析:我们继续使用上述数据进行KEGG富集分析:这里使用clusterProfiler中的GSEA函数进行GSEA富集分析 。与超几何分布富集(enricher函数)的结果相比,enricher函数和GSEA函数基本相同,这里只给出GSEA的用法和参数 。
6、用clusterprofiler包来做基因富集性 分析Geneontology富集分析可能是生物信息学中最常用的分析 。我曾经用大卫,一个在线工具 。但是,使用DAVID有三个主要问题 , 在clusterprofiler包中已经得到了很好的解决 。下面总结了clusterprofiler包的主要功能 。为什么要在引用中使用genesetenrichmentanalysis?
这样,当使用DEG 分析时 , 这些基因就找不到了,而gsea-2/却能找出区别 。这里有一个需要注意的问题,使用该函数时 , 如果想得到gsea的典型图,必须指定geneSetID 。这就需要先搞清楚现在有多少个geneSet被丰富了,然后一个一个的画出来 。
推荐阅读
- java项目需要分析
- boxplot图怎么分析
- 仓库管理系统的需求分析
- 实证研究数据分析
- 公众号大数据分析,微信公众号数据分析包括哪些方面
- 软件工程师职业分析
- 佳能无线连接手机软件叫什么 佳能无线连接手机软件
- 尼康d3400是全画幅机么 尼康d3400相机是全幅还是半幅
- 佳能怎么设置无镜头拍摄 佳能无镜头拍摄设置