深入了解用户标签画像 用户标签体系设计思路( 三 )

请问,张三到底是男生,还是女生?
这个故事里,其实张三有三个性别标签 。
首先是社交 APP 的资料,因为他填写了男性,所以我们可以认为他是男性,这是基于某个确切资料打的标签 , 这种类型叫事实标签 。
张三穿的是一件很有设计感的裙子 , 按照我们过去的经验,一般只有女性会穿裙子,所以我们也可以认为张三是女性 。这是基于我们设定的某个规则,只要有人穿裙子就是女性,去打的标签 。这种类型叫规则标签 。
最后,张三刷脸支付没有获得活动女性优惠 。摄像头是利用算法结合多种特征去预测张三是女性的概率的,因为张三长相很阳刚,算法认为他是女性的概率比较低,所以打标签他是男性 。这种类型叫算法标签 。
图 10 标签生产的基本方式
上述三种标签是最基础的标签维度,下图可以帮助我们更好地理解它们 。
图 11 三种标签定义的内涵
2. 标签创建场景
我们通过具体的场景,来加深对标签生产和创建的理解 。累计消费金额,即用户注册以来的总消费金额 , 就是一个用指标值作为标签值的例子 。
首先 , 这个例子是一个数值型标签,但数值型的标签不一定好用,如果这个标签是直接给到业务人员去使用的,应该先通过业务经验去把它分层,划分出高中低级别 , 将业务含义映射到特征上 。这样业务人员在使用标签的时,就能提高业务人员的认知效率 。
图 12 场景举例:将自然语言转换成配置规则
那么问题来了,业务经验可靠吗?我们评价一个规则,通常有几种标准,分别是覆盖率、准确率和召回率 。从这些指标去衡量,以经验为参考的规则就不一定符合真实业务需求了 。
事实上,定义标签是可以通过科学的数据分析方法进行的 。
我们前面有提到,对于数值类的标签,最好通过业务经验来分层 , 来提高业务判断的效率 。对于这种高中低分层 , 通常可以使用分布分析的方法 。
比如还是对于「用户点击商品详情页」的次数,我可以计算它的次数分布 , 再按照 25%,50%,75%,75% 以上划分标签 。
这样 , 我不仅能划出四个分层,还能保证每个层级都有很好的覆盖度 。对于资产盘点分层、付费用户分层这样的标签,分布分析是一个很好用的方法 。
图 13 使用分布分析进行用户标签分层
【深入了解用户标签画像 用户标签体系设计思路】当然了,我们需要的其实不是对「用户点击商品详情页」次数的分层,而是对「用户购买意愿」有解释力的标签 。算法类标可以有效地解决这个问题 。
所谓的算法类标签 , 本质上也是在做「预测」这个事情 。下图所示的是神策用户画像产品实现的相似人群扩散功能,通过提供种子用户,来学习他们的特征,并预测一个用户的标签 。对于「用户购买意愿」,我们可以用「实际真的有购买」过的人群 , 来作为我们的种子用户 , 让算法去学习他们的特征 。
图 14 算法型标签:相似人群扩散
算法类标签的好处,在于它能通过交叉验证,获得自己的预测相似度 。我们可根据对标签解释力的需求 , 设置一定相似度以上的人群,打上「高用户购买意愿」的标签 。
算法类标签也有坏处 , 它是个黑盒,不如规则那样简单明了可解释 。
我们神策的用户画像产品在做算法类标签实践的时候,也遇到了这样的问题 。所以,一个好的算法类标签,应该还能输出它所使用的行为特征权重 。这样,能让算法黑盒变成相对白盒,业务人员可解释度强 。同时还有一个好处,就是特征权重其实也展示了那些特征才是最影响业务结果的 , 有些时候我们不是想要预测标签 , 而是想要知道什么特征对转化更重要 。
四、如何利用好用户画像分析赋能业务落地?1. 用户画像的用法
我们在前面有提到,标签体系的用途,其实主要是两大类,一类是分析洞察获取业务灵感 , 另一类就是输出赋能精细化运营和数据产品系统使用 。
对于标签体系来说 , 利用标签去筛选目标客群,并且输出人群列表,其实是最简单直接的一种应用方法 。通过组合多个基础标签,可以快速做到很精细的目标人群输出 。
当然,这也对我们的基础标签梳理有一定的要求 。
图 15 画像基础用法:筛选客群输出
同时,当标签数据能与数据产品系统打通的时候,它就会变成强有力的武器 。

推荐阅读