GO分析用r语言可靠吗 go语言数据分析

【R语言】解决GO富集分析绘图,标签重叠问题 前面我给大家详细介绍过
?GO简介及GO富集结果解读
?四种GO富集柱形图、气泡图解读
?GO富集分析四种风格展示结果—柱形图,气泡图
?KEGG富集分析—柱形图,气泡图 , 通路图
?DAVID GO和KEGG富集分析及结果可视化
也用视频给大家介绍过
?GO和KEGG富集分析视频讲解
最近有粉丝反映说,利用clusterProfiler这个包绘制GO富集分析气泡图和柱形图的时候,发现GO条目的名字都重叠在一起了 。
气泡图
柱形图
这个图别说美观了,简直不忍直视 。经过我的认真研究,发现跟R版本有关 。前面我给大家展示的基本都是R 3.6.3做出来的图 。很多粉丝可能用的都是最新版本的R 4.1.2 。
我们知道R的版本在不停的更新 , 相应的R包也在不停的更新 。我把绘制气泡图和柱形图相关的函数拿出来认真的研究了一下,终于发现的症结所在 。
dotplot这个函数,多了个 label_format 参数
我们来看看这个参数究竟是干什么用的,看看参数说明
label_format :
a numeric value sets wrap length, alternatively a custom function to format axis labels. by default wraps names longer that 30 characters
原来这个参数默认值是30,当标签的长度大于30个字符就会被折叠,用多行来展示 。既然问题找到了,我们就来调节一下这个参数,把他设置成100,让我们的标签可以一行展示 。
是不是还是原来的配方,还是熟悉的味道
同样的柱形图,我们也能让他恢复原来的容貌 。
关于如何使用R做GO和KEGG富集分析,可参考下文
GO和KEGG富集分析视频讲解
r语言和python哪个更有用通常GO分析用r语言可靠吗 , 我们认为Python比R在计算机编程、网络爬虫上更有优势,而 R 在统计分析上是一种更高效的独立数据分析工具 。所以说,同时学会Python和R这两把刷子才是数据科学的王道 。
R语言,一种自由软件编程语言与操作环境 , 主要用于统计分析、绘图、数据挖掘 。R本来是由来自新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发(也因此称为R),现在由“R开发核心团队”负责开发 。
R基于S语言的一个GNU计划项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行 。R的语法是来自Scheme 。
R的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载 , 可在多种平台下运行 , 包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS 。R主要是以命令行操作 , 同时有人开发了几种图形用户界面 。
R的功能能够通过由用户撰写的包增强 。增加的功能有特殊的统计技术、绘图功能 , 以及编程接口和数据输出/输入功能 。这些软件包是由R语言、LaTeX、Java及最常用C语言和Fortran撰写 。
下载的可执行文件版本会连同一批核心功能的软件包,而根据CRAN纪录有过千种不同的软件包 。其中有几款较为常用,例如用于经济计量、财经分析、人文科学研究以及人工智能 。
Python与R语言的共同特点GO分析用r语言可靠吗:
Python和R在数据分析和数据挖掘方面都有比较专业和全面的模块,很多常用的功能,比如矩阵运算、向量运算等都有比较高级的用法 。
Python和R两门语言有多平台适应性 , linux、window都可以使用,并且代码可移植性强 。
Python和R比较贴近MATLAB以及minitab等常用的数学工具 。
Python与R语言的区别:
数据结构方面 , 由于是从科学计算的角度出发,R中的数据结构非常的简单 , 主要包括向量(一维)、多维数组(二维时为矩阵)、列表(非结构化数据)、数据框(结构化数据) 。
而 Python 则包含更丰富的数据结构来实现数据更精准的访问和内存控制,多维数组(可读写、有序)、元组(只读、有序)、集合(唯一、无序)、字典(Key-Value)等等 。
Python与R相比速度要快 。Python可以直接处理上G的数据;R不行,R分析数据时需要先通过数据库把大数据转化为小数据(通过groupby)才能交给R做分析,因此R不可能直接分析行为详单,只能分析统计结果 。
Python是一套比较平衡的语言,各方面都可以,无论是对其GO分析用r语言可靠吗他语言的调用,和数据源的连接、读取 , 对系统的操作,还是正则表达和文字处理,Python都有着明显优势 。而R是在统计方面比较突出 。
Python的pandas借鉴了R的dataframes,R中的rvest则参考了Python的BeautifulSoup,两种语言在一定程度上存在互补性 。
R语言:clusterProfiler进行GO富集分析和Gene_ID转换 ID转换用到的是 bitr() 函数,bitr()的使用方法:
org.Hs.eg.db包含有多种gene_name的类型
keytypes() :keytypes(x),查看注释包中可以使用的类型
columns() :类似于keytypes(),针对org.Hs.eg.db两个函数返回值一致
select() :select(x, keys, columns, keytype, ...) eg.
函数enrichGO()进行GO富集分析,enrichGO()的使用方法:
举例:
R语言可视化之ggplot2——KEGG通路富集分析之前分享了如何用ggplot2可视化GO分析的结果 。既然做了GO,当然少不了KEGG了 。
同样的,我们从 DAVID 获取KEGG pathway的结果 。
对于KEGG,我比较喜欢做气泡图,这样用两种形式的图结合在一起,效果更丰富更好看一点 。
用r语言做数据分析好学吗?非常好学 。输入几行代码GO分析用r语言可靠吗,即可得到结果 。
R不但数据分析好用GO分析用r语言可靠吗,而且作图能力极好,推荐GO分析用r语言可靠吗你用 。
下面是R数据分析GO分析用r语言可靠吗的一些代码,包括数据导入、方差分析、卡方测验、线性模型及其误差分析 。希望可以帮到GO分析用r语言可靠吗你:
1.1导入数据
install.packages('xslx')
library(xlsx)
Sys.setlocale("LC_ALL", "zh_cn.utf-8")
a=read.xlsx2('d:/1.xlsx',1,header=F)
head(a)显示前六行
class(a$y)/str(a)查看列/全集数据类型
a$y=as.numeric(a$y)转换数据类型
1.2方差分析(F test)
with(a,tapply(liqi,tan,shapiro.test))正态性检验
library(car)leveneTest(liqi~tan,a)方差齐性检验
q=aov(liqi~tan*chong,a)方差分析(正态型)
summary(q)
【GO分析用r语言可靠吗 go语言数据分析】TukeyHSD(q)多重比较
1.3卡方测验(Pearson Chisq)
a1=summarySE(a,measurevar='y', groupvars=c('x1','x2'))卡方检验(逻辑型/计数型)
aa=a1$y
aaa=matrix(a2,ncol=2)
aaa= as.table(rbind(c(56,44), c(36,64), c(48,52),c(58,42)))
dimnames(aaa)= list(group=c("不添加抗性","不添加敏感","添加抗性","添加敏感"),effect=c("存活","死亡"))
aaa=xtabs(data=https://www.04ip.com/post/a,~x y)
chisq.test(a)误差分析(卡方测验,Pearson法)
install.packages("rcompanion")
library(rcompanion)
pairwiseNominalIndependence(a)多重比较
1.4线性模型及其误差分析(Wald Chisq)
q=lm(data=https://www.04ip.com/post/a,y~x1*x2)一般线性模型(正态性)
summary(q)
q=glm(data=https://www.04ip.com/post/a,y~x1*x2,family = gaussian(link='identity'))广义线性模型(正态性)
summary(q)
q=glm(data=https://www.04ip.com/post/a,y~x1*x2,family = binomial(link='logit'))广义线性模型(逻辑型,二项分布)
summary(q)
q=glm(data=https://www.04ip.com/post/a,y~x1*x2,family = poisson(link='log'))广义线性模型(计数型,泊松分布)
summary(q)
install.packages('lmerTest')一般线性混合效应模型(正态性)
library(lmerTest)
install packages(‘lme4’)
library(lme4)
q=lmer(data=https://www.04ip.com/post/a,y~x1*(1|x2))
q=lmer(data=https://www.04ip.com/post/a,y~x1*(1|x2),family = gaussian(link='identity'))广义线性混合效应模型(正态性)
q=glmer(data=https://www.04ip.com/post/a,y~x1*(1|x2),family = binomial(link='logit'))广义线性混合效应模型(逻辑型,二项分布)
q=glmer(data=https://www.04ip.com/post/a,y~x1*(1|x2),family = poisson(link='log'))广义线性混合效应模型(计数型,泊松分布)
summary(q)
install.packages('car')
install.packages('openxlsx')
library(car)
install.packages('nlme')
library(nlme)
Anova(q,test='Chisq')线性模型的误差分析(似然比卡方测验,Wald法)
lsmeans(q,pairwise~chuli,adjust = "tukey")线性模型的多重比较(tukey法)
关于GO分析用r语言可靠吗和go语言数据分析的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站 。

    推荐阅读