如何用r语言做go能注释 r语言如何写注释 _注释

【R语言】解决GO富集分析绘图，标签重叠问题前面我给大家详细介绍过
?GO简介及GO富集结果解读
?四种GO富集柱形图、气泡图解读
?GO富集分析四种风格展示结果—柱形图，气泡图
?KEGG富集分析—柱形图，气泡图，通路图
?DAVID GO和KEGG富集分析及结果可视化
也用视频给大家介绍过
?GO和KEGG富集分析视频讲解
最近有粉丝反映说，利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候，发现GO条目的名字都重叠在一起了。
气泡图
柱形图
这个图别说美观了，简直不忍直视。经过我的认真研究，发现跟R版本有关。前面我给大家展示的基本都是R 3.6.3做出来的图。很多粉丝可能用的都是最新版本的R 4.1.2 。
我们知道R的版本在不停的更新，相应的R包也在不停的更新。我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下，终于发现的症结所在。
dotplot这个函数，多了个 label_format 参数
我们来看看这个参数究竟是干什么用的，看看参数说明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原来这个参数默认值是30，当标签的长度大于30个字符就会被折叠，用多行来展示。既然问题找到了，我们就来调节一下这个参数，把他设置成100，让我们的标签可以一行展示。
是不是还是原来的配方，还是熟悉的味道
同样的柱形图，我们也能让他恢复原来的容貌。
关于如何使用R做GO和KEGG富集分析，可参考下文
GO和KEGG富集分析视频讲解
R语言：clusterProfiler进行GO富集分析和Gene_ID转换 ID转换用到的是 bitr() 函数，bitr()的使用方法：
org.Hs.eg.db包含有多种gene_name的类型
keytypes() ：keytypes(x)，查看注释包中可以使用的类型
columns() ：类似于keytypes() ，针对org.Hs.eg.db两个函数返回值一致
select() ：select(x, keys, columns, keytype, ...) eg.
函数enrichGO()进行GO富集分析， enrichGO()的使用方法：
举例：
GO、KEGG富集分析（一）有参情况对基因的描述一般从三个层面进行：
这三个层面具体是指：
得到GO注释
做GO分析的思路：
比如，在疾病研究的时候，进行药物治疗之后某些基因的表达量明显的发生了变化，拿这些基因去做GO分析发现在Biological process过程当中集中在RNA修饰上，然后在此基础上继续进行挖掘。这个例子就是想启示大家拿到差异表达基因DEG只是一个开始，接下来就应该去做GO注释，之后需要进行一个分析看这些注释主要集中在哪个地方。假如我们有100个差异表达基因其中有99个都集中在细胞核里，那我们通过GO分析就得到了一个显著的分布。
GO富集分析原理：
有一个term注释了100个差异表达基因参与了哪个过程，注释完之后（模式生物都有现成的注释包，不用我们自己注释），计算相对于背景它是否显著集中在某条通路、某一个细胞学定位、某一种生物学功能。
clusterProfiler是一个功能强大的R包，同时支持GO和KEGG的富集分析，而且可视化功能非常的优秀，本章主要介绍利用这个R包来进行Gene Ontology的富集分析。
进行GO分析时，需要考虑的一个基础因素就是基因的GO注释信息从何处获取。Bioconductor上提供了以下19个物种的Org类型的包，包含了这些物种的GO注释信息
对于以上19个物种，只需要安装对应的org包，clusterProfile就会自动从中获取GO注释信息，我们只需要差异基因的列表就可以了，使用起来非常方便。
1.1准备输入数据
待分析的数据就是一串基因名称了，可以是ensembl id、entrze id或者symbol id等类型都可以。把基因名称以一列的形式排开，放在一个文本文件中（例如命名“gene.txt”）。Excel中查看，就是如下示例这种样式。
1.3GO富集分析
【如何用r语言做go能注释 r语言如何写注释】加载了注释库之后，读取基因列表文件，并使用clusterProfiler的内部函数enrichGO()即可完成GO富集分析。
读取基因列表文件，并使用clusterProfiler的内部函数enrichKEGG()即可完成KEGG富集分析。
此外， clusterProfiler中也额外提供了一系列的可视化方案用于展示本次富集分析结果，具有极大的便利。
参考：
;utm_medium=timeline
GO文件中的注释信息是如何得到的一直很好奇GO注释文件中的信息是如何得到的，终于在《The Gene Ontology Handbook》中找到了答案。
GO的原始文件可以分为两部分：ontology和association files 。
该文件以obo格式储存，每个词条都以树状结构表示着和其他词条的关系，具体内容可以从 GO网站中找到，其中的元素和逻辑关系可以简单参考上几篇文章。主要编辑工具有go-basic、go和go-plus三个。
这部分文件主要是关于GO词条的具体功能信息，以及相关的支撑信息，以GAF或GPAD格式储存。
目前对基因的注释主要有两种手段：人工注释和机器注释。
人工注释由专业人士(biocurators)通过阅读，提取和转化文献中的实验结果来对基因进行注释。人工注释费时费力，但他们的努力非常重要，因为人工注释的准确性是其他注释的基石，目前有20个团队为GO的人工注释贡献力量。
机器注释主要两大类方法：根据序列进行注释和文本挖掘的方法注释。
1、根据序列信息进行注释：
annotation transfers from Homologous proteins
annotation transfers from Orthologous proteins
annotation transfers from Protein families
2、文本挖掘注释
Automatic text categorization
Lexical approaches
k-Nearest neighbors
Properties of Lexical and k-NN categorizers
Inter-annotator agreement
每种方法的具体解释参考《The Gene Ontology Handbook》的相关章节。
如何用r语言做go能注释的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于r语言如何写注释、如何用r语言做go能注释的信息别忘了在本站进行查找喔。

如何用r语言做go能注释 r语言如何写注释

推荐阅读

空调e8是什么意思出现故障,分析下这几点

辟谷:古老的养生方法

儿童电动牙刷什么牌子刷毛软？推荐几款软毛儿童电动牙刷

PPT复制是什么意思

怎么把电脑设成服务器电脑怎么弄个服务器啊

百合怎么烧好吃百合怎么烧

统计分析主要指标

菊花的矮化方法菊花的矮化方法有哪些

注册电气工程师报名时间

光学防抖|初探realme真我GT大师探索版夜景：抬手记录心动瞬间

海边钓鱼什么线

word如何把段落取消，word怎么取消段落格式

补肾的食物都有什么？

醉驾撞人逃逸如何处罚醉驾撞人逃逸如何处罚的

云服务器被黑客攻击后如何恢复正常？黑客攻击云服务器怎么解封

3月4日湖南我是接班人”学雷锋专题大课《坚定的信念》观看入口汇总

送何遁山人归蜀翻译送何遁山人归蜀的翻译

工程决算审计需要报哪些材料

调味罐可以放什么调味罐用什么材质的好

怎么利用健身房瘦小腿，怎么利用健身房瘦小腿和大腿