读《啤酒与尿布》——大型超市购物篮中商品关联性分析

此书通过沃尔玛、家乐福等大型超经典销售案例分析,总结出人们购物车中商品内在关联。通过关联摆放促进销售额。大小超市、门店、销售人员可从书中案例吸取灵感、提升业绩。对于数据挖掘人员,有两处可借鉴:商品关联性分析、客户心里及行为模式分析。
数据挖掘人员的商品关联性分析
一、思维逻辑与经验直觉对数据分析的影响
作者一开始就收集统计数据,分析并锁定研究对象。
读《啤酒与尿布》——大型超市购物篮中商品关联性分析
文章图片


excel表格可快速做出上述表格,作者得出结论是:外资零售企业的购物车内商品单价明显高于国内、台资。研究前者规律可帮助后者提升业绩,赋予了这项工作意义。
相比起大量统计数据,直观的感受来得更迅速。在数据分析之前已经大概知道要得出的结论、用数据来佐证,是事半功倍的办法。如今技术手段远胜从前,却再也没有啤酒与尿布的事件发生,这提醒技术人员:有时候技术不是万能的。
但是技术人员也没必要沮丧,数据能做什么事情,完全看数据为谁所用、如何使用。思维和逻辑,相比起经验和直觉,自有它的优势。
2003年,美国顶级计算机专家奥伦·埃齐奥尼细心发现自己是飞机上最贵的,感觉被敲了竹杠,下定决心要帮助人们开发一个系统,用来推测当前网页上的机票价格是否合理,这促成Farecast的诞生。重点是,埃齐奥尼表示,他不需要去解开机票价格差异的奥秘。他要做的仅仅是预测当前的机票价格在未来一段时间内会上涨还是下降。系统的运转需要海量数据的支持。为了提高预测的准确性,埃齐奥尼找到了一个行业机票预订数据库。如今,这个名叫Farecast的系统已经拥有惊人的约10万亿条飞行数据记录。预测准确度为75%,使用该系统的旅客,平均每张机票可节省50美元。
技术是多变的,但智慧是相通的。以Farecast为例,宾馆预订、二手车购买等。只要这些领域的产品差异不大,同时存在大幅度的价格差和大量可运用的数据,就都可以应用这项技术。数据是静止和陈旧的。但是在以前,一旦完成了收集数据的目的之后,数据就会被认为已经没有用处了。比方说,在飞机起飞之后,票价数据就没有用了(对谷歌而言,一个检索命令完成之后)。

作为数据分析人员,尽可能扬长避短。擅长直觉联想,就把重心放在观察和收集数据,让繁琐的分析交给技术人员;擅长推理分析,可集精力于数据处理、模型匹配。要从数据中得出结论,前提是得到可靠、准确、充分的数据。
二、商品关联性分析主要在发掘弱相关的商品
常识可以推出大部分的商品关联性,比如建筑工地旁多销低档研究;高档社区旁边则销高档葡萄酒、高档烟;大连理工旁边则开了一家独一无二、平价有格调的超市——售卖盒装咖啡(苦逼学生)、进口果饮(外籍留学生)、中高档葡萄酒(教师)。
还有一部分关联是隐蔽的,肉眼不容易观察到的。数据分析人员需要依靠大胆假设和缜密分析来完成这部分工作。比如女性短裙长度和道琼斯股票指数的关系就不是日日加班的程序员一拍脑袋能想出来的,需要灵感或、兴趣支撑。如果大脑能时时处于活跃、休息两种状态是最理想的,然而我们却常常容许自己出现过负荷、混乱、亚健康态,十分不利于灵感生成。
同样是商品关联性分析,美国沃尔玛和日本7-11便利店思路全然不同。前者倾向于从购物车内部商品之间的组合频率推测关联性,后者则会考虑天气、温度、时间、事件、客户对购物车内商品的影响。两种思路一结合便是我们所关心并要分析的全部因素。猪肉与蔬菜、果汁与牛奶、凉面与冰棍这是商品内在关联,但是冬天储存一大批凉面冰棍是哪家超市也不会做的事情。
商品关联性算法号称数据挖掘算法之王,可见购物篮算法吸引人的地方。通俗来讲就是综合以上提到的各种因素,按不同权重参与算法,计算两种商品同时出现的概率。整个商店就是一个大购物篮,同样的商品在购物车中出现概率越大,货架摆放在一块的概率也应当越大。
RFID无线射频技术——新的购物篮分析技术
在沃尔玛购物的 你自有地选购商品,却不知你的每一条路线没个停留都被详细记录。这一切浑然不觉,因为购物车充当了间谍。2007年沃尔玛率先在每台购物车安装RFID卡,每个货架装追踪器,从而追踪客户形成完整的行动路线图。推着整个车子扫码而过,大大节省排队结款时间。所获大规模数据也是研究矿藏。
相关性报表阅读方法
一般而言组合概率达到15%以上值得注意,但是没有绝对,有些时候达到6%也值得注意,比如食品和香料。
购物篮比率:为商品与购物车结合概率,比如啤酒与购物车组合概率为35%。为所有上商品相互比较提供很好的参照点。
以支持度、置信度、提高度三项指标表现商品相关性
支持度:多个商品同时出现在一个购物车概率。与相关性区别是,相关性是单向的,买尿布与买啤酒高度相关,但买啤酒不一定会买尿布。支持度则忽略单向性。
置信度:衡量支持度的可靠和数据强度,反复计算求误差。
提高都:是对支持度和置信度的综合考量。提高度>1,极大相关;提高度<1,不那么相关;提高度<0,负相关。很多时候只看提高度来进行相关性判断。
有个经典客户心理案例:
读《啤酒与尿布》——大型超市购物篮中商品关联性分析
文章图片


表中看出,香蕉的缺货可能造成三种椒降低销量,青椒本地产品,价格低,面向低收入群体;而红椒黄椒进口,面向高收入群体。如果这两种人在同一摊位急急忙忙挑选,搞不好可能造成客户冲突,或者匆匆放弃选购。因此要分开摆放,互不影响。这个案例侧面说明,负向相关性也要引起足够重视。
R值——商品关联性统称
R=0 不相关;R=0.5 中度相关;R=1.0 完全相关。
但是当R值大于0.75不要盲目乐观,因为可能是司空见惯、无意义的结果,比如三文鱼和芥末,都是寿司必备。因此"不要尝试去发明车轮"。
当R值处于0.25-0.75,成为强关联,可能是临时性的,比如同处于货架堆头的促销,促销结束则关联消失,也说明促销的成功。
啤酒鱼尿布R值处于0.25一下,只针对特定人群、特定条件有限,因此最吸引人。也是购物篮分析主要任务,这点出乎意料。
R值为负,同行是冤家。
分析过程中警惕没有意义的关联和伪关联,即使关联性很高,也不要抓着不放。比如酒类和内衣相关性即使达到25%也是无意义的,但是电视和DVD相关性如果达到20%,则可考虑捆绑销售,卓有成效。
成箱购买——从不合理的孤立现象中寻找商机
得到分析结果,必须实地验证、现场观察,完善模型,才能使分析项目“善始善终”,比如下面这则有趣的案例。
读《啤酒与尿布》——大型超市购物篮中商品关联性分析
文章图片


很多关联数据稍纵即逝,7-11便利店有一天一位打工的女学生误将原本定3瓶的酸奶定成了30瓶,如果一天卖不完,损失将由她承担,灵机一动,她在所有面包、饭团、饭盒陈列区加放酸奶,写上”酸奶有助健康“,来选购此类商品的客人顺手买走了全部30瓶酸奶,总部细心发现这一反常现象,将其作为酸奶主要陈列方式,提高了业绩。
假说——实行——验证、反常——调查——推广可以说是7-11便利门店主要分析方式.
三、卖场心理暗示与商品关联关系
强关联关系是用户铭记在心的关联关系,丧失这种关联可能导致客户放弃购物,比如吃火锅必须有调料、有人喝酒必须有花生。
中等强度关联是用户有印象但不记得的关联,需要摆放来提醒客户,比如瓜子和果冻,鱼和花椒大料。
弱相关是用户不知道的,需要向用户暗示,若卖场没有组织合适的心理暗示,则相关关联不会出现。比如宜家家居以陈列好的客厅、厨房展厅来销售,刺激了客户的想象力和兴趣,相比单一商品的陈列取得不错效果。
四、没有比较就没有收入
天猫与淘宝的搭配也很早说明这一点。
读《啤酒与尿布》——大型超市购物篮中商品关联性分析
文章图片


红花需要绿叶衬,除此之外,沃尔玛的商品二次陈列、7-11一天四次改变门店陈列、卖鱼不佳的老板加大与的陈列面,都是打破常规的思路。鱼生与绿芥末在中国的关联售卖,但在日本就不需要,因为家家户户早已储备芥末,可见同样的商品陈列因地制宜,需要深入当地、灵活变通。
【读《啤酒与尿布》——大型超市购物篮中商品关联性分析】

    推荐阅读