数据分析思维 数据分析的作用

数据分析的作用(数据分析思维)
数据分析的意义谷歌的数字营销传播者阿维纳什·考希克(Avinash Kaushik)曾说过“所有聚合的数据都是废话”,即“所有聚合的数据都是废话” 。我理解他的意思是,汇总的数据掩盖了很多问题,即我们需要对数据指标进行深入挖掘和分析,了解指标各种数值或趋势背后的真实原因(尤其是当指标数值或趋势异常时),从而优化指标 。
就今天的业务发展而言,我们也需要先了解业务数据,这样才能更好地用数据和算法赋能业务,实现高质量增长 。
两种常用的分析方法1什么是分析方法?在问题面前,平常的思绪就散了 。分析就是“把零散的思路整理成有组织的分析思路”的方法 。如下图所示,掌握分析方法可以快速洞察数据背后的本质原因,从而快速准确定位问题 。
2宏观战略分析常用的战略分析方法包括PEST、SWOT和五力模型 。
害虫
PEST分析是指对宏观环境的分析 。p是政治,E是经济,S是社会,T是技术 。
刻苦用功的人SWOT是基于内外部竞争环境和竞争条件的态势分析,能够对研究对象的态势做出全面、系统、准确的研究 。分析角度:优势、劣势、机会、威胁 。
迈克尔·波特五力模型波特的五种力量是指行业中有五种力量决定了竞争的规模和程度 。这五种力量共同影响着行业的吸引力和现有企业的竞争战略决策 。这五种力量分别是同行业现有竞争者的竞争力、潜在竞争者的进入能力、替代品的替代能力、供应商的议价能力和买方的议价能力 。
3 5W2H5W2H分析法,又称七问分析法,简单方便,易于理解和使用,富有启发意义 。它广泛应用于企业管理和技术活动中,对决策和执行活动和措施也很有帮助,也有助于弥补考虑问题的疏漏 。
5W指的是:what(什么),when(什么时候),where(哪里),why(为什么),who(谁) 。
2H指的是:如何(如何做),多少(多少) 。
4微观数据分析由于业务数据指标往往是由多个微观原因造成的,上述方法很难定位到此类问题的根本原因(如“订单量为什么下降了”),这时就需要其他微观数据分析方法 。
逻辑树分析法逻辑分析法是把复杂的问题拆解成几个简单的子问题,然后像分支一样逐步展开 。
费米问题是科学研究中用于量纲分析、估计和明确验证假设的估计问题 。比如北京有多少辆特斯拉?一个巷子里的煎饼摊一年能卖多少煎饼?深圳有多少产品经理?一辆公共汽车能装多少个乒乓球?一个正常的成年人有多少根头发?
要回答费米的问题,我们可以用逻辑树分析法,把一个复杂的问题拆解成子问题,然后逐个解决 。我们用一个例子来学习一下如何解决这类问题 。
有人曾问费米,“芝加哥有多少个钢琴调音师?”什么是钢琴调音师?为了保持钢琴的音高,需要专业人员定期对不准确的音调进行检查和调整 。做这种工作的人被称为钢琴调音师 。
对于这个问题,可以用逻辑树分析法进行拆解 。钢琴调音师数=全钢琴调音师一年的总工作时间/一个调音师一年的工作时间 。因此,这个问题可以分解成两个子问题(如下图所示):
钢琴调音师全部1年的总工作时间;
调音师每年的工作时间 。
对于所有钢琴调音师一年的总工作时间,可以分解为三个子问题(如下图所示):
有多少架钢琴;
钢琴一年要调几次音;
调整一次需要多长时间?
现在让我们逐一解决这些子问题 。
第一个子问题:有多少架钢琴(如下图)?
在我们分开之前,我们需要知道芝加哥有多少人,其次,拥有钢琴的人的比例 。芝加哥的人口可以通过网络查到,大概有250万人 。百分之多少的人有钢琴?我不知道确切的数据,但我们可以猜测 。钢琴对于普通家庭来说比较贵,而且占地面积大,放在家里不方便,所以我们猜测家庭拥有钢琴的比例是1% 。为什么是1%而不是5%?因为1%通常表示概率非常低,有些机构的钢琴比个人多,比如音乐学院,所以我们再猜一个数字,大概是2% 。有了这些数据,我们可以算出芝加哥大约有5万架钢琴 。
我们来看第二个和第三个子问题(如下图) 。
问题2:钢琴一年要调音几次?钢琴调音师是稀缺行业,人肯定不多 。钢琴不像吉他,需要经常调音,估计一年一次 。
第三个子问题:调整一次需要多久?大约需要两个小时 。
问题4:调音师每年工作多长时间(如下图)?
美国每年有四周假期,一年大约有50周 。每周工作5天,每天工作8小时 。将这三个数字相乘,你可以得到一个一年工作2000小时的调音师 。
但是钢琴调音师要到处跑,肯定要花时间在路上,所以减去20%花在路上的时间,调音师一年大概工作1600(2000-2000×20%)个小时 。
现在我们总结一下四个子题(如下图) 。
钢琴调音师一年的总工作时间乘以三个子问题的数字,总计10万小时,而调音师一年工作1600小时 。我们用在钢琴调音师一年的工作时间除以一个调音师人一年的工作时间,得到62.5 。费米再次指出,芝加哥大约有63个调音师 。
这个回答准确吗?后来,费米发现了一份芝加哥钢琴调音师的名单,上面有83个人,许多名字是重复的 。所以费米的估算结果已经相当准确了 。
多维拆卸方法假设最近各医院收治的1000名患者中,A医院有900名患者存活 。然而,B医院只有800名患者存活(如下图) 。看来A医院存活率更高,应该选择 。你的选择真的正确吗?
现在让我们用多维拆卸分析法来看一下 。
当我们从整体上看患者时,我们可能不会注意到“数据成分的差异” 。现在,我们根据患者的健康状况,将各医院收治的总人数拆分为两组,一组为轻症患者,另一组为重症患者(如下图) 。然后我们会计算病人的存活率 。我们会发现什么?
我们来对比一下A医院和b医院的重症患者群体 。
a该院100名患者入院时病情危重,其中20人存活 。
b医院400名患者入院时病情危重,其中200名抢救过来 。
所以,对于危重患者来说,去B医院的存活率更高,是更好的选择(如下图) 。
入院时亲人是轻症患者怎么办?用同样的方法,令人惊讶的是,B医院的轻症患者存活率也超过了A医院,B医院仍然是更好的选择 。
通过多维度拆解数据,我们从一开始就发现了相反的结论 。这种现象被称为“辛普森悖论”,即在某些情况下,我们通过考察整个数据和数据的不同部分,会得到相反的结论 。
仅从整体上看数据,我们可能不会注意到“数据内部各部分组成的差异” 。如果为了比较而忽略这种差异,可能会导致无法感知这种差异的影响 。和上一个案例一样,关注整个数据(所有入院的患者)和数据内的不同部分(根据患者的健康状况将患者分为两组数据),可以得出不同的结论 。
对比法1)什么是比较法?在数据分析中,我们使用对比分析的方法来跟踪业务中是否存在问题 。比如我的CTR是4% 。是高还是低?这个CTR有问题吗?这时候就需要用对比分析的方法来追踪业务是否有问题 。俗话说,没有对比,就没有好坏 。
心理学家为这种现象发明了一个术语叫做价格锚定,即通过与价格锚定的比较,某些商品会卖得更好 。
《经济学人》是美国最畅销的经济杂志 。它做了一个订阅实验,给用户以下3个选项供选择:
只订阅电子版,一年59美元;
只订阅纸质版,一年125美元;
订阅纸质版+电子版,一年125美元 。
第二个选项的价格与第三个选项相同,但第三个选项提供的服务更多 。
实验结果显示,只有16%的人选择了第一个选项,84%的人选择了第三个选项,即更多的人愿意花更多的钱订阅杂志(如下图) 。
如果去掉第二个选项,对用户有影响吗?
去掉第二个选项,选择125美元(原来的第三个选项)的用户减少到32%(如下图) 。
如果没有之前的选项2,用户会对比第一个选项,发现花125美元并不划算 。当存在第二个选项时,用户会将比较对象改为第二个选项,以体现第三个选项的折扣 。
2)和谁比?跟谁比一般分为两种:跟自己比和跟行业比 。
3)如何比较?一般从整体数据的大小、整体数据的波动和趋势变化三个维度进行比较 。
a)整体数据的大小:有些指标可以用来衡量整体数据的大小 。常用的是平均值、中位数或一些商业指标 。
b)整个数据的波动:标准差除以平均值得到的值称为变异系数 。变异系数可以用来衡量整体数据的波动 。
c)趋势变化:趋势变化是从时间维度看数据随时间的变化 。常用的方法有时间折线图、环比和同比
时间折线图是以时间为横轴,数据为纵轴绘制的折线图 。从时间折线图可以知道从过去到现在数据发生了什么变化,也可以通过过去的变化预测未来的趋势 。
与前一个时间段相比,环比用于观察短期数据集 。比如2020年12月的一个数据,比2020年11月低了10% 。
【数据分析思维 数据分析的作用】与去年同期相比,用于观察长期数据集 。比如2020年12月某数据比2019年12月下降了10% 。

    推荐阅读