人生处万类,知识最为贤。这篇文章主要讲述google play store的app数据分析相关的知识,希望能为你提供帮助。
1.分析目的:通过google play store的app数据分析进行业务方向指导
2.数据
导入框架
![google play store的app数据分析](http://img.readke.com/220516/160921D29-0.jpg)
文章图片
导入数据
这次只分析‘App‘ ,‘Category‘ ,‘Rating‘ ,‘Reviews‘ ,‘Size‘ ,‘Installs‘ ,‘Type‘
![google play store的app数据分析](http://img.readke.com/220516/160921A53-1.jpg)
文章图片
简单浏览下数据
![google play store的app数据分析](http://img.readke.com/220516/1609212124-2.jpg)
文章图片
![google play store的app数据分析](http://img.readke.com/220516/1609211236-3.jpg)
文章图片
查看行列数量
![google play store的app数据分析](http://img.readke.com/220516/1609214H6-4.jpg)
文章图片
查看各个列的非空数据量
![google play store的app数据分析](http://img.readke.com/220516/160921C59-5.jpg)
文章图片
有很多缺失值,需要清洗
3.数据清洗
App处理
查看有没有重复值
![google play store的app数据分析](http://img.readke.com/220516/1609212433-6.jpg)
文章图片
有重复值,先不着急删除重复值,为了不把其他列的异常值留下,先处理数值异常的列
Category处理
![google play store的app数据分析](http://img.readke.com/220516/1609216042-7.jpg)
文章图片
有一条异常值
![google play store的app数据分析](http://img.readke.com/220516/16092112G-8.jpg)
文章图片
删除
![google play store的app数据分析](http://img.readke.com/220516/1609214637-9.jpg)
文章图片
Rating处理
![google play store的app数据分析](http://img.readke.com/220516/1609214943-10.jpg)
文章图片
用平均值填充
![google play store的app数据分析](http://img.readke.com/220516/160921B60-11.jpg)
文章图片
![google play store的app数据分析](http://img.readke.com/220516/160921I44-12.jpg)
文章图片
有一条值是19的异常记录,和Category的异常是同一条记录
Reviews清洗
![google play store的app数据分析](http://img.readke.com/220516/1609215I2-13.jpg)
文章图片
用value_counts看数据分布挺广,看起来都是数据
![google play store的app数据分析](http://img.readke.com/220516/160921AJ-14.jpg)
文章图片
![google play store的app数据分析](http://img.readke.com/220516/16092130B-15.jpg)
文章图片
Size清洗
![google play store的app数据分析](http://img.readke.com/220516/1609212330-16.jpg)
文章图片
转换成浮点型
![google play store的app数据分析](http://img.readke.com/220516/16092133B-17.jpg)
文章图片
![google play store的app数据分析](http://img.readke.com/220516/1609212310-18.jpg)
文章图片
将Size为0的填充为平均数
![google play store的app数据分析](http://img.readke.com/220516/1609211D8-19.jpg)
文章图片
Installs清洗
![google play store的app数据分析](http://img.readke.com/220516/1609212203-20.jpg)
文章图片
分布比较少,直接替换
![google play store的app数据分析](http://img.readke.com/220516/1609211E7-21.jpg)
文章图片
转换
![google play store的app数据分析](http://img.readke.com/220516/160921C01-22.jpg)
文章图片
Type处理
df.info() 查看到有na值,这里需要dropna参数
![google play store的app数据分析](http://img.readke.com/220516/1609211U6-23.jpg)
文章图片
![google play store的app数据分析](http://img.readke.com/220516/1609212101-24.jpg)
文章图片
删除这条数据
![google play store的app数据分析](http://img.readke.com/220516/1609213I6-25.jpg)
文章图片
数据清洗完毕,开始分析数据
4.数据处理和分析
分Category的数据
分类的个数
![google play store的app数据分析](http://img.readke.com/220516/160921G23-26.jpg)
文章图片
每个分类的App数量,排序,可以得出哪些分类的app最受开发者欢迎
![google play store的app数据分析](http://img.readke.com/220516/1609212002-27.jpg)
文章图片
分类的安装量排序:娱乐社交类最被用户需要
分类的评论数据:社交游戏评论多
![google play store的app数据分析](http://img.readke.com/220516/160921G31-28.jpg)
文章图片
分类的打分数据,和其他数据不太一致,需要进一步分析
![google play store的app数据分析](http://img.readke.com/220516/160921N35-29.jpg)
文章图片
分Type数据
![google play store的app数据分析](http://img.readke.com/220516/160921K21-30.jpg)
文章图片
免费占比大,付费占比小,免费仍然是主流
Category和Type一起分析
![google play store的app数据分析](http://img.readke.com/220516/160921F00-31.jpg)
文章图片
评论安装比
【google play store的app数据分析】相关性:评论数和安装数强相关,其他的连0.1都不到,可以认为是不相关的(0.5以上可以认为是相关的,0.3以上可以认为是弱相关)
![google play store的app数据分析](http://img.readke.com/220516/1609212224-32.jpg)
文章图片
推荐阅读
- hibernate.cfg.xml 中如何设置 hbm.xml 和 Annotations 的 mapping
- 安卓逆向之Java学习-03
- Android 多线程3秒执行一次
- Android项目——HttpUrlConnection上传文件(图片)
- spark中map和mapPartitions算子的区别
- 使用防病毒软件有哪些优势()
- 适用于计算机和智能手机的十大个人防火墙
- 如何创建匿名电子邮件以保护在线身份()
- 如何在物联网时代保持安全()