Data Knows,用分析师的观点解答一切关于数据的疑问,以第一财经商业数据中心(CBNData)专业的数据研究成果为载体,告诉你如何利用大数据协助日常商业决策。
写在前面
关联分析作为一种简单、实用的分析技术,通过发现大量数据以及项集之间有趣的关联性或相关性,描述一个事物中某些属性以及其呈现的规律和模式。
购物篮分析是关联分析中的典型例子,通过洞察消费者购物篮中的不同商品之间的联系,分析顾客的购买习惯。
著名的“啤酒+尿布”组合相信大家一定不陌生。品牌在制定营销策略时,需要根据自己货架上哪些商品品类同时受到顾客欢迎,进一步了解消费者购买行为。此处类似顾客在更广泛渠道中的购买习惯这样的分析显得尤为重要。其实商品的关联度和彼此之间的关系可以帮助品牌商和零售商作出更多的决策,包括但不仅限于品类选择和扩张策略、组合营销和推荐购买策略,以及潜客挖掘和会员运营策略。
本期Data Knows就要告诉你购物篮分析到底有什么好处?什么消费场景下,我们需要进行购物篮分析?购物篮分析到底如何进行的?
深夜可能是探究品牌发展的好时段
又是一个深夜。
依旧灯火通明的上海市区某甲级写字楼内,准备下班的数据分析师D仔看到品牌营销同学小A走过来,倦容满面,愁眉不展。自从D仔热心地向小A讲解了如何用TGI指数避开人群识别中常见的错误,小A就开始称呼D仔“大神”了。
“大神,你要下班了吗?”小A欲言又止地问道。
D仔略皱了皱眉,看起来还不太适应这样的称呼。“嗯,你怎么还不回家?”D仔心想小A应该又在工作中遇到了困难。
看到D仔已整理好文档了,把关好的电脑装进背包,小A连忙接着说道:“大神,我们正准备做为一个品牌的子品牌做营销策划。但我不知道如何在方案中论述拓展子品牌为什么要从面膜做起。我从面膜产品本身的优势来看,无非就是消费群体广,单价低,所以尝试新品牌的成本低,容易培养消费者。但是,但是,这只是我的经验之谈,怎么用数据论证产品会受到消费者欢迎呢?”
“早点回家吧!我电脑里有美妆行业的购物篮分析,明天早点来,给你看数据。”D仔说完头也不回地走了。
“等一下,大神!什么是购物篮分析啊?!”小A冲着D仔的背影大叫。
如何了解消费者的购物篮
第二天清晨,小A早早来到公司,在D仔电脑上看到了传说中的“购物篮分析”。
“这图表……是什么意思?”小A揉了揉惺忪的睡眼,仿佛看到了一张假的图表。
“这就是美妆行业的购物篮分析结果。购物篮分析结果,其实就是关联规则。”D仔没有理会小A崇拜的眼光,继续说道。“什么是关联规则呢?营销界著名的尿布啤酒案例你一定不陌生。其中“尿布=>啤酒”就是典型购物篮的关联规则,表示购买了尿布的消费者往往也会购买啤酒。那么,在这张图中,每个圆圈就代表了一条关联规则,箭头连接着这条规则中出现的品类,箭头前面的表示条件项,箭头后面的则表示结果项。所以在刚刚的案例中,尿布就是条件项,啤酒就是结果项。”说着,D仔在纸上画出了这条关联规则。
尿布 → ○ → 啤酒
“那这些圆圈的大小和颜色深浅代表着什么呢?”小A若有所思地问道。
“这就涉及到购物篮分析的几个重要的指标。”说着,D仔翻开一个文档给小A自己看。
购物篮分析概念和指标说明
【概念】
项集:在一篮子商品中的一件消费品即为一项(Item),则若干项的集合为项集,如{啤酒,尿布}构成一个二元项集。
关联规则:一般记为X=>Y的形式,X为条件项(也称前项或者左项,LHS),Y为结果项(也称后项后者右项,RHS),用于表示数据内隐含的关联性。
【指标】
关联性强度如何,由支持度、置信度、提升度三个指标控制和评价。
支持度(Support):支持度是指在所有项集中{X, Y}出现的可能性,即项集中同时含有X和Y的概率。支持度是对关联规则重要性的衡量,支持度越大,关联规则越重要。
置信度(Confidence):置信度表示在条件项X发生的条件下,结果项Y发生的概率。置信度是对关联规则的可靠性的衡量。
提升度(Lift):提升度表示在含有X的条件下同时含有Y的可能性与没有X这个条件下项集中含有Y的可能性之比。该指标与置信度同样衡量规则的可靠性,可以看作是置信度的一种互补指标。
“拿刚才的例子来说,在研究消费者的购物篮中,同时出现尿布和啤酒的购物篮的占比就是支持度。置信度呢,则是指消费者买尿布的情况下,买啤酒的可能性。
如果有1000个消费者的购物篮中有尿布,其中600个购物篮出现了啤酒,那么
置信度=600/1000=0.6
而提升度,则是指啤酒出现在有尿布和没有尿布的购物篮中比例的差异。
如果没有尿布的购物篮有2000个,其中1600个购物篮都出现了啤酒,那么
提升度
=(600/1000)/(1600/2000)=0.6/0.8=0.75
所以,通过这样的验算可以发现,
1)在有尿布的购物篮中,啤酒出现的概率很高。
2)没有尿布的购物篮中,啤酒出现的概率更高。
3)说明了啤酒购物篮的消费者基数非常大。
从这里可以发现这三个指标都是越高越好,并且重要性递减。
图中的圆圈大小就代表着这条关联规则的支持度,而圆圈的颜色深浅则代表了这条规则的提升度,是消除了结果项受众基数影响的相对指标。”D仔耐心地解读道。
购物篮里品类之间的内在联系
听到“受众基数影响”,小A联想到上次人群识别中自己惯性判断,不禁吐了吐舌头。
D仔在电脑前又敲下几行代码,跑出一张新的图表,指着屏幕说道:“你看,其实你的定性分析是有数据支持的,面膜确实因为受众广泛,是在购物篮中出现频率最高的品类。”
“但是,在研究产品的潜在能力是,我们更要看面膜与其他品类之间都存在着丰富的‘互动’。这张图展示的就是包含面膜这个品类的关联规则。”D仔一边解释,一边又用R跑了一张新的图表。
“还真的对的呢!品牌基本上的品类都在了,还包括我们不涉及的彩妆品类。所以说我是否可以理解为,消费者买了新品牌的面膜,培养了信任,等到扩展其他品类的时候,他们也会产生关联购买?”小A若有所思地说道。
“是的。”D仔欣慰地点了点头,“报告中的B品牌就是个从面膜开始做起,进而全面发展到护肤各品类的成功案例。你看,1/4购买面膜以外品类的消费者都是来自于‘面膜时代’的积累,而面膜的购买则更多来自于新增顾客。”
“这么说来,如果我们能了解到所想拓展的消费者的购物篮情况,是不是也可以指导我们扩展产品线呢?”小A一边记笔记一边问,这时,手机突然响了。“呀,大神,受教了,我得去开会了,下次给我讲!请你喝奶茶!爱你~”说着飞也似地跑去了会议室。
D仔看着远去的小A,突然想到了品牌的未来:
“
购物篮分析的颗粒度不仅限于品类,事实上,SKU层面的购物篮分析对于刻画消费者的行为更有想象空间。购物篮分析在微观层面上可以帮助品牌具体到每个产品每个渠道上的决策,在宏观层面上则可以帮助我们了解整个行业的趋势,继而预测行业的前景。
或许购物篮分析真的能帮助会品牌拓展以及鉴证消费者的改变。
好啦,D仔第二堂数据分析课就到此结束啦,如果你有更多想要了解的数据分析中的奥秘与窍门,别忘了留言或者私信D仔噢~我们下堂课见。
评论