数据分析这碗汤
从接触数据分析到现在这短短的几年时间里,总是会听到周围有朋友问我“你做的数据分析到底是什么”。
【数据分析这碗汤】数据分析是什么
对于数据分析的工具来说,那真的算得上是“琳琅满目”。对于很多做数据分析的人来说,可能都会使用到EXCEL、SPSS、STATA、AMOS、EVIEWS、MATLAB、SAS、PYTHON、R等等一系列比较常见的数据分析工具,每一个工具都有他独到的地方,不同行业的人会选择适合他们自己的数据分析工具,而不是只要能做数据分析,管他三七二十一,直接拿来就用。这是数据分析的一个特别需要注意的地方。
五个手指有长有短
数据工具是一个大池子,我们需要从里面选择适合我们的工具并且熟练掌握,同时我们可能还需要搭配数据库一起,这样才能发挥他最大的威力。
文章图片
EXCEL是最常见的一个数据分析工具,只要是做数据分析的人不可能不知道它。在刚开始接触并处理数据的时候,EXCEL的表格是公认最方便、最容易上手的一个工具(EXCEL可是一个超级强大的工具),但是如果你的数据量特别大,那就需要用到数据库,这个咱们后面再谈。在EXCEL以外,很多的工具都能够直接读取EXCEL里面已经处理完的数据直接进行分析判断。在EXCEL里面有一个数据分析的模块,有的OFFICE可能没有启用,就需要咱们从加载项里面把它调用出来以后才能开始使用,在这个加载项里面,已经可以做一些像描述统计、相关系数、方差分析、回归分析等十几种分析(另:还有一个规划求解也需要从加载项中调用出来才能使用)。
文章图片
再说一下SPSS,这也是一款比较强大的工具,并且SPSS下面还有分支,比如专门做分析的Statistics,以及专门做挖掘的Modeler。对于SPSS来说,很多同学在大学的时候都已经接触或者听说过了,能够进行自动统计绘图、数据深入分析。并且SPSS它最突出的特点就是操作界面极为友好,输出结果美观漂亮。它将几乎所有的功能都以统一、规范的界面展现出来。集数据录入、整理、分析功能于一身就是对SPSS一个最好的描述,同时SPSS采用类似EXCEL表格的方式输入与管理数据,数据接口较为通用,能方便的从其他数据库中读入数据。其统计过程包括了常用的、较为成熟的统计过程,完全可以满足非统计专业人士的工作需要。后期小白会针对SPSS进行专题介绍和讲解。
文章图片
说完EXCEL和SPSS,我们还需要重点提一个现阶段比较火的一个工具—PYTHON。其实PYTHON是一种计算机程序设计语言,最初被设计用于编写自动化脚本,随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。在数据分析这个行业里,PYTHON可是有举足轻重的地位,它的行业应用相当广泛,不仅是系统编程、图形处理、数学处理、文本处理、数据库编程、网络编程、Web编程这些我们经常听到的,在黑客编程方面PYTHON也是有自己的一席之地(现在小白身边很多朋友都是用PYTHON来写爬虫)。最近几年PYTHON变得越来越火,大家如果有兴趣可以去了解一下,在小白看来,PYTHON是一个比较容易上手的工具,不管是读取EXCEL表格数据还是从数据库里直接提取数据都是非常方便的,并且还不用受到数据量大小的限制(EXCEL和SPSS都是有数据量大小限制的,并且数据量越大处理速度越慢,甚至死机),但是需要反复练习,不然的话基本上一段时间就该忘得差不多了。
除了上面给大家说的三个工具以外,其他几种工具以后有机会也会介绍给大家,这里先不作过多赘述了。
分析方法
在小白这么几年的数据分析经历来看,平时在数据分析中用到的方法基本上主流的还是那十来种方法,像回归分析、相关性分析、方差分析、因子分析、卡方分析、聚类分析等是属于比较常见的,对于不同的分析场景需要用不同的分析方法。每一种方法又需要针对不同的数据情况,因为其实有的东西在主观上我们是就能够看出来问题的,但是如果在输出结果时出来一个假现象就需要我们学会去判断分析的方法是不是真的没有问题。
例如在回归分析中,我们如果仅仅是分析自变量和因变量之间的关系结果,有的时候看起来完美的模型其实是有潜在问题的,在回归分析中最常见的就是异方差、自相关、多重共线这类问题(回归模型需要满足均值为零,同方差,协方差等于零),而这些情况出现以后如果不是特意关注有的时候是发现不了的(一般可以利用残差图进行判断)。
又例如如果需要做问卷分析,还会涉及到信度效度分析等其他分析方法,这些在以后的文章里面都会逐步分享给大家。
小建议
其实说了这么多,看起来数据分析是一件很复杂的事情,但是只要咱们做好下面这几件事情以后再回过头来看,其实真的没有那么复杂:
1.数据分析跟语文一样,需要我们不停的积累所学知识,最关键的首先是需要锻炼我们的数据思维能力,不能看到数据以后一脸蒙,不知道从哪里入手。
2.制定一份属于自己的学习计划,按照我们自己事先想好的路径去走,好的方法永远会事半功倍。
3.选择适合自己的数据分析工具并且熟练掌握,工具就是我们的武器,临阵磨枪不会是一个好的建议,只有信手拈来才能做到从容不迫。
总结
数据分析是什么?有人说作图就是数据分析,有人说相互比较就是数据分析。有错吗?其实没错,只是他们只是说了数据分析最普通的方面。我们需要从最基础的方面做起。只有这样,我们才能够走出属于我们自己数据分析之路,从数据小白变成数据大拿。
每天五分钟,轻松积累数据分析知识
讨论QQ群:514581193
数据干货,各种福利,不定期发放
推荐阅读
- Python数据分析(一)(Matplotlib使用)
- 你的口红,真的很美!
- 【花旗参石斛麦冬汤】
- 联机共读11期-6.2-汤亚萍|联机共读11期-6.2-汤亚萍 “好的内容+多的流量=知名的品牌”
- Python专栏|数据分析的常规流程
- r语言python|r语言python 比较_R语言vs Python(数据分析哪家强())
- 数据分析->分析方法
- 明朝建立后,朱元璋大杀功臣,汤和有何过人之处,能够寿终正寝()
- 让我们干了《小时光》这碗甜汤
- 秋季入冬学会为自己煲汤抵御寒冷吧!教你三大保暖汤