数据分析知识全解 如何学习数据分析

  • 数据分析
    基?。ㄒ欢ǖ氖菟嘉⑼臣蒲Щ『蛃ql能力)——能做最基本的取数工作
  • 数据分析能力(使用各种分析工具、套用数据模型、做可视化报表等)——能做简单的分析工作
  • 业务分析经验(熟悉各种业务逻辑和指标体系)——能做复杂的业务拆解
因此对新人来说,强烈建议按照下面的学习路径进行学习:1、数据分析常用的思维判断一个人做数据分析的水平,不是看他学习了几种工具,最核心的差距在于思考问题的思维能,这是数据分析的本质,也是最容易被人忽视的点
常用的思维有很多种,下面简单举几个例子:
(1)细分思维:
比如某次考试小明的名次很低,如果他的父母不懂细分,一定会不由分说地训斥小明,根本找不到小明成绩差的真实原因 。
而如果他们懂得细分分析,应该怎么做呢?应该将名次的维度转化为科目,然后分析每个科目的成绩,也许会发现小明只有某个科目没有考好,再针对这个短板采取相应的策略,这就是细分分析的思想 。
(2)趋势思维
你可以简单地把趋势分析定义为对比分析的一种 , 一般来说是按照时间的维度 , 对某一数据或者不同数据变化趋势进行差异化研究,以及对数据的下一步变化进行预测 。
趋势分析一般而言,适用于产品核心指标的长期跟踪,比如点击率,GMV,活跃用户数等 。做出简单的数据趋势图 , 并不算是趋势分析 , 趋势分析更多的是需要明确数据的变化 , 以及对变化原因进行分析 。
(3)目标思维
我们在接到业务的需求之后 , 需要先想一下这个需求的真正核心目的是什么?
如果知道了业务目标,那么就可以把这样一个取数需求变成一个分析类需求,最终的交付形式就成了一份PPT,这样 , 就能避免成为取数机器 。
(4)结构化思维
在面对这么一个问题时,结构化思维方法首先做的并不是立刻着手清洗数据 。而是根据对业务的理解,先为数据分析画一个思维导图,它的作用相当于你来到一个陌生的城市拿出百度地图查询乘坐交通工具到入住的酒店的路线图 。
事实上 , 结构化思维就是由麦肯锡提出的著名的“金字塔思维”,如下图就是典型的结构化:
(5)演绎思维、归纳思维
很显然,归纳是从个体属性出发 , 寻找因子之间的共性 , 总结出一个一般的特性;而演绎则相反,是从一般整体出发 , 寻找事物之间的逻辑 , 从而得到某个个体的特性 。
2、统计学相关的理论与基础(1)描述型统计
描述统计是我们做数据分析的主要基?。热缢迪廴嗽彼到衲晡颐堑南矍榭龊芎?nbsp;, 比去年要好很多 。这不叫做描述统计,因为“比去年好”这个特点不是定量的数据
描述性统计里大概有三个分类:集中趋势、离散趋势、分布 。集中趋势包含平均数、中位数、众数、分位数等 , 离散趋势包含极差、平均差、方差、标准差、分位差等,分布主要包含峰态分布和偏态分布
(2)推理型统计
也叫作推理性统计 , 他的目的是研究如何利用样本数据去推断总体数据的方法 。他跟描述统计不一样,描述统计是用整体的数据来描述整体特征 , 推理统计是用部分数据来推理整体特征 。我们经常说的假设检验、采样与过采样、回归预测模型、贝叶斯模型都是推理型统计 。
二项分布:如抛硬币n次,不同正面朝上的次数对应的概率;
几何分布:如抛硬币n次,到第k次才取得第一次成功的概率服从的分布
【数据分析知识全解 如何学习数据分析】泊松分布:在一定时间范围内发生概率相同 , 给定其发生的平均发生的次数μ,则事件在该事件范围内发生k次的概率服从泊松分布
(3)假设检验
假设检验就是通过抽取样本数据,通过小概率反证法去验证整体假设
(4)回归
回归分析的任务就是 , 通过研究X和Y的相关关系,尝试去解释Y的形成机制,进而达到通过X去预测Y的目的 。
(5)聚类
聚类是根据数据本身的特性研究分类方法,并遵循这个分类方法对数据进行合理的分类 , 最终将相似数据分位一组,也就是”同类相同、异类相异”
3、快速套用的分析模型(1)帕累托模型:
帕累托分析依据的原理是20/80定律,80%的效益常常来自于20%的投入,而其他80%的投入却只产生了20%的效益,这说明,同样的投入在不同的地方会产生不同的效益 。

推荐阅读