r语言|统计学--基于R(第3版)(基于R应用的统计学丛书)作者(贾俊平 习题答案 第九章)

9.1

#9.1 load("C:/exercise/ch9/exercise9_1.RData") exercise9_1 #(1)绘制散点图,判断人均GDP与居民消费水平之间的关系,并计算相关系数分析其关系强度 library(car) scatterplot(人均GDP~居民消费水平,data=https://www.it610.com/article/exercise9_1,pch=19,xlab="居民消费水平",ylab="人均GDP",cex.lab=0.8)#pch决定点的样式 #由散点图可看出二者大概具有正的线性相关关系 cor(exercise9_1[,2],exercise9_1[,3])#计算相关系数 cor.test(exercise9_1[,2],exercise9_1[,3])#检验相关系数 #正线性相关且线性关系很强 #(2)以居民消费水平为因变量、人均GDP为自变量建立回归模型,并对回归模型进行综合评估 #回归模型的拟合 model<-lm(居民消费水平~人均GDP,data=https://www.it610.com/article/exercise9_1) summary(model) #计算回归系数的置信区间 confint(model,level=0.95) #输出方差分析表 anova(model) #绘制拟合图 attach(exercise9_1) model<-lm(居民消费水平~人均GDP) plot(居民消费水平~人均GDP) text(居民消费水平~人均GDP,labels=地区,cex=0.6,adj=c(-0.6,0.25),col=4) abline(model,col=2,lwd=2) n=nrow(exercise9_1) for(i in 1:n){segments(exercise9_1[i,3],exercise9_1[i,2],exercise9_1[i,3],model$fitted[i])} mtext(expression(hat(y)==7.514e+02+3.194e-01%*%人均GDP),cex=0.7,side=1,line=-6,adj=0.75) arrows(600,4900,550,5350,code=2,angle=15,length=0.08)

【r语言|统计学--基于R(第3版)(基于R应用的统计学丛书)作者(贾俊平 习题答案 第九章)】9.2
#9.2 load("C:/exercise/ch9/exercise9_2.RData") exercise9_2 #(1)绘制产量与生产费用的散点图,判断二者之间的关系形态 library(car) scatterplot(产量~生产费用,data=https://www.it610.com/article/exercise9_2,pch=19,xlab="生产费用",ylab="产量",cex.lab=0.8)#pch决定点的样式 #正的线性相关关系 #(2)计算产量与生产费用之间的线性相关系数,对相关系数的显著性进行检验(α=0.05),并解释二者之间的关系强度 cor(exercise9_2[,2],exercise9_2[,3])#计算相关系数 cor.test(exercise9_2[,2],exercise9_2[,3])#检验相关系数 #cor=0.9202324,正线性相关,线性关系很强

9.3
#9.3 load("C:/exercise/ch9/exercise9_3.RData") exercise9_3 #(1)用航班准点率作自变量,顾客投诉次数作因变量,求出估计的回归方程,并解释回归系数的意义 #回归模型的拟合 model<-lm(投诉次数~航班准点率,data=https://www.it610.com/article/exercise9_3) summary(model) #所以可得,hat(y)==430.1892+ -4.7006%*%航班准点率 #计算回归系数的置信区间 confint(model,level=0.95) #输出方差分析表 anova(model) #绘制拟合图 attach(exercise9_3) model<-lm(投诉次数~航班准点率) plot(投诉次数~航班准点率) text(投诉次数~航班准点率,labels=航空公司编号,cex=0.6,adj=c(-0.6,0.25),col=4) abline(model,col=2,lwd=2) n=nrow(exercise9_3) for(i in 1:n){segments(exercise9_3[i,3],exercise9_3[i,2],exercise9_3[i,3],model$fitted[i])} mtext(expression(hat(y)==430.1892-4.7006%*%航班准点率),cex=0.7,side=1,line=-6,adj=0.75) arrows(600,4900,550,5350,code=2,angle=15,length=0.08) #(2)检验回归系数的显著性(α=0.05) #计算回归系数的置信区间 confint(model,level=0.95) cor.test(exercise9_3[,2],exercise9_3[,3])#检验相关系数 #p-value = 0.001108<0.05,拒绝H0,认为显著 #(3)如果航班准点率为80%,估计顾客的投诉次数 h<-430.1892-4.7006*80.0 h # 54.1412,即约为54次

9.4
#9.4 load("C:/exercise/ch9/exercise9_4.RData") exercise9_4 #用广告费支出作自变量x,销售额作因变量y建立回归模型,并对模型进行诊断和评价 #回归模型的拟合 model<-lm(销售额~广告费支出,data=https://www.it610.com/article/exercise9_4) summary(model) #计算回归系数的置信区间 confint(model,level=0.95) #输出方差分析表 anova(model) #绘制拟合图 attach(exercise9_4) model<-lm(销售额~广告费支出) plot(销售额~广告费支出) text(销售额~广告费支出,labels=超市,cex=0.6,adj=c(-0.6,0.25),col=4) abline(model,col=2,lwd=2) n=nrow(exercise9_4) for(i in 1:n){segments(exercise9_4[i,3],exercise9_4[i,2],exercise9_4[i,3],model$fitted[i])} mtext(expression(hat(y)==29.3991+1.5475%*%广告费支出),cex=0.7,side=1,line=-6,adj=0.75) arrows(600,4900,550,5350,code=2,angle=15,length=0.08) #诊断和评价 #计算残差和标准化残差 model<-lm(销售额~广告费支出,data=exercise9_4) pre<-fitted(model) res<-residuals(model) zre<-model$residuals/(sqrt(deviance(model)/df.residual(model))) data.frame(销售额=exercise9_4$销售额,点预测值=pre,残差=res,标准化残差=zre) #绘制成分残差图 library(car) crPlots(model) #检验正态性 par(mfrow=c(2,2),cex=0.8,cex.main=0.7) plot(model) #Normal Q-Q图可见,在销售额与广告费支出的线性模型中,关于ε正态性的假定基本成立 #Residuals vs Fitted图可见,销售额与广告费支出的线性关系假定成立 #Scale-Location图,检验方差齐性 #方差齐性检验 ncvTest(model) #绘制散布-水平图 spreadLevelPlot(model) #检验独立性 #检验残差独立性 durbinWatsonTest(model)


    推荐阅读