数据分析之《菜鸟侦探挑战数据分析》-3-R语言-散点图,相关系数,回归线
1、散点图
icecream <- read.csv("icecream.csv")
install.packages("ggplot2")
library(ggplot2)
icecream %>% ggplot(aes(b,a))+geom_point()
文章图片
2、相关系数
icecream %>% select(b,a) %>% cor
结果如下:
b a
b 1.0000000 0.8442111
a 0.8442111 1.0000000
-1~-0.7 强负相关
-0.7 ~ -0.3 弱相关
-0.3 ~ 0.3 不相关
0.3 ~0.7 弱相关
0.7 ~ 1.0 强相关
3、线性回归模型
ice.lm <- lm(a ~ b,data = https://www.it610.com/article/icecream)
summary(ice.lm)
4、时间序列模型
chaofan <- menus %>% filter(品名 == "炒饭")
> chaofan %>% ggplot(aes(日期,销售额)) + geom_line() + scale_x_date() +ggtitle("炒饭的销售额")
文章图片
5、多个图像显示
install.packages("tidyr")
library(tidyr)
noodles2 <- menus %>% filter (品名 %in% c("饭团","味增汤","咖喱","茶泡饭","意大利面","酱汁炒面","乌冬面","什锦炒面","拉面")) %>%select (品名,销售额,日期) %>% spread (品名,销售额)
noodles2[,-1] %>% cor
结果:
茶泡饭饭团酱汁炒面咖喱拉面
茶泡饭1.00000000 -0.009715320.60802100.815056430.6269526
饭团-0.009715321.00000000 -0.5029012 -0.02819566 -0.5100147
酱汁炒面0.60802102 -0.502901221.00000000.620013630.9216830
咖喱0.81505643 -0.028195660.62001361.000000000.6569293
拉面0.62695258 -0.510014680.92168300.656929321.0000000
乌冬面0.62932779 -0.489207820.89537870.618542100.9129860
意大利面0.61656471 -0.486625820.91229440.637030480.9188441
乌冬面意大利面
茶泡饭0.62932780.6165647
饭团-0.4892078 -0.4866258
酱汁炒面0.89537870.9122944
咖喱0.61854210.6370305
拉面0.91298600.9188441
乌冬面1.00000000.8979937
意大利面0.89799371.0000000noodles2[,-1] %>% pairs 忽略最后一行
【数据分析之《菜鸟侦探挑战数据分析》-3-R语言-散点图,相关系数,回归线】
文章图片
6、两个变量之间的散点图
udon <- menus %>% filter(品名 %in% c("饭团","乌冬面")) %>% spread(品名,销售额)
> udon %>% ggplot(aes(乌冬面,饭团)) + geom_point() +ggtitle("乌冬面和饭团的销售额")
>
文章图片
7、加一条拟合的直线
icecream %>% ggplot(aes(b,a)) + geom_point(size = 2) + geom_smooth(method = "lm",se = FALSE)
文章图片
推荐阅读
- 慢慢的美丽
- 《真与假的困惑》???|《真与假的困惑》??? ——致良知是一种伟大的力量
- PMSJ寻平面设计师之现代(Hyundai)
- 太平之莲
- 闲杂“细雨”
- 七年之痒之后
- 《跨界歌手》:亲情永远比爱情更有泪点
- 深入理解Go之generate
- 由浅入深理解AOP
- 诗歌:|诗歌: 《让我们举起世界杯,干了!》