人生处万类,知识最为贤。这篇文章主要讲述google play store的app数据分析相关的知识,希望能为你提供帮助。
1.分析目的:通过google play store的app数据分析进行业务方向指导
2.数据
导入框架
文章图片
导入数据
这次只分析‘App‘ ,‘Category‘ ,‘Rating‘ ,‘Reviews‘ ,‘Size‘ ,‘Installs‘ ,‘Type‘
文章图片
简单浏览下数据
文章图片
文章图片
查看行列数量
文章图片
查看各个列的非空数据量
文章图片
有很多缺失值,需要清洗
3.数据清洗
App处理
查看有没有重复值
文章图片
有重复值,先不着急删除重复值,为了不把其他列的异常值留下,先处理数值异常的列
Category处理
文章图片
有一条异常值
文章图片
删除
文章图片
Rating处理
文章图片
用平均值填充
文章图片
文章图片
有一条值是19的异常记录,和Category的异常是同一条记录
Reviews清洗
文章图片
用value_counts看数据分布挺广,看起来都是数据
文章图片
文章图片
Size清洗
文章图片
转换成浮点型
文章图片
文章图片
将Size为0的填充为平均数
文章图片
Installs清洗
文章图片
分布比较少,直接替换
文章图片
转换
文章图片
Type处理
df.info() 查看到有na值,这里需要dropna参数
文章图片
文章图片
删除这条数据
文章图片
数据清洗完毕,开始分析数据
4.数据处理和分析
分Category的数据
分类的个数
文章图片
每个分类的App数量,排序,可以得出哪些分类的app最受开发者欢迎
文章图片
分类的安装量排序:娱乐社交类最被用户需要
分类的评论数据:社交游戏评论多
文章图片
分类的打分数据,和其他数据不太一致,需要进一步分析
文章图片
分Type数据
文章图片
免费占比大,付费占比小,免费仍然是主流
Category和Type一起分析
文章图片
评论安装比
【google play store的app数据分析】相关性:评论数和安装数强相关,其他的连0.1都不到,可以认为是不相关的(0.5以上可以认为是相关的,0.3以上可以认为是弱相关)
文章图片
推荐阅读
- hibernate.cfg.xml 中如何设置 hbm.xml 和 Annotations 的 mapping
- 安卓逆向之Java学习-03
- Android 多线程3秒执行一次
- Android项目——HttpUrlConnection上传文件(图片)
- spark中map和mapPartitions算子的区别
- 使用防病毒软件有哪些优势()
- 适用于计算机和智能手机的十大个人防火墙
- 如何创建匿名电子邮件以保护在线身份()
- 如何在物联网时代保持安全()