?购物篮分析是一个非常重要的模型,关于啤酒与尿布的故事,这个故事很好地解释了商品关联性的作用,时至今日,仍有很强的现实指导意义。这种数据,将不同商品关联起来,并挖掘二者之间联系的分析方法,就叫作“购物篮分析”。购物篮分析的实现方法有很多,下面教一下大家如何去制作一个完整的购物篮分析模型。
一、前言:
在开始制作前,先来理解一下它的价值在哪。购物篮分析的本质是研究商品与商品间的关联关系,比如分析A商品和哪个商品搭配会卖的更好,或者分析客户在购买了A商品之后,对B商品会产生什么影响等等。通过这种交叉分析,我们便可以对客户感兴趣的商品组合去做出相应的调整,或者据此去深入研究更高层次的推荐算法。
文章图片
先来理解以下三个概念,支持度指同时被购买的概率,用公式则表示支持度=同时购买A和B订单数/总购买订单数;置信度是指购买A之后又购买B的条件概率,用公式表示就是置信度;提升度指的是先购买A对购买B的提升作用,用公式表示就是提升度((购买A次数)*(购买B次数))。可看下图说明,加深理解:
文章图片
二、购物篮分析步骤:
需先准备关于零售行业的数据源,包含单据编码、商品名称等信息,可以在文末进行获取。如果用Excel做购物篮分析,难度会很大,建议用其他工具进行制作,本文选择用SQL语句的方式去制作:
文章图片
第一步,新建临时表,进行交叉关联,为每一组交叉商品增加一列总订单数的字段,表命名为t1:
文章图片
执行语句后,可得出以下4个字段:
文章图片
第二步,新建临时表t2,再次进行交叉关联,算出同时购买A商品与B商品的订单数:
文章图片
执行后,可得出:
文章图片
第三步,把t1与t2两个临时表的字段进行关联:
文章图片
执行语句后,可得出以下4个字段:
文章图片
第四步,新建t4,算出A订单数:
文章图片
执行语句后,可得出以下2个字段:
文章图片
第五步,新建临时表t5,算出B订单数:
文章图片
执行语句后,可得出以下2个字段:
文章图片
最后一步,根据支持度、置信度与提升度的公式,以及我们得出的数据,便可运算了。根据t3表里‘’同时购买A和B订单数‘’与‘’总订单数‘’这两个字段,我们可以算出支持度的数据。根据t3表里‘’同时购买A和B订单数‘’与t4表里‘’A商品订单数‘’这两个字段,我们可以算出置信度的数据。同理,利用‘’同时购买A和B订单数‘’、‘’购买A订单数‘’、‘’购买B订单数‘’与‘’总订单数‘’这几个字段,我们最后就可以得出提升度的数据了。
文章图片
最后得出的结果如下:
文章图片
三、后续建议:
从上面的过程来看,我们可得出制作购物篮的过程很复杂。为了对数据建模以及多维分析有更深的认识,小编推荐大家利用智分析的数据模型去制作购物篮分析,智分析的数据模型具有非常强大的多维分析能力,不仅支持自助取数,还支持SQL、MDX等高阶的查询语法。智分析的数据源接口同样也很丰富,可以连接各种数据库,也可以以Excel文件导入的方式进行导入:
文章图片
进入数据模型的界面后,便可以开始搭建购物篮分析的数据模型了,这里依然是选择旧方法,新建一个SQL查询,按照步骤便可得出数据:
文章图片
数据模型搭建后,便可对购物篮分析的数据更为清晰地呈现出来,仪表盘便可进行高级操作,非常适合展示购物篮分析、RFM分析、ABC分析等数据模型:
文章图片
【数据建模实战,Smartbi带你玩转购物篮分析】PS:上方提及的资料,关注公众号【思迈特Smartbi】后私信便可获取。
推荐阅读
- R语言从入门到机器学习|R语言rename重命名dataframe的列名实战:rename重命名dataframe的列名(写错的列名不会被重命名)
- Pyecharts|Pyecharts 猎聘招聘数据可视化
- Python|Python--随机森林模型
- 数据挖掘|【数据挖掘】二手车交易价格预测(五)建模调参
- python|深度盘点(一文详解数据分析中100个常用指标和术语)
- python|【python】微信朋友圈数据分析及可视化(爬虫+数据挖掘)
- python|requests库请求获取不到数据怎么办(不妨试试看这种妙法)
- 还不了解数据库(Smartbi一文带你入门数据库!)
- 还不会做销售分析(掌握这3个思路,让你秒变分析高手)
- 手把手教你实现地图可视化分析