数据产品工作指北(5)-用户画像
用户画像概念最早由交互设计之父Alan Cooper提出,是对产品或服务的目标人群做出的特征刻画,最初的研究也仅限于基于统计分析层面的用户画像标签,且大多数都只是通过用户调研得出结论。而随着互联网技术的发展和信息采集手段的完善,使得我们可以通过数据的采集积累,搭建标签体系,构建用户模型。而随着互联网数据的爆发式增长,如何对用户进行精准的数据标签抽象和特征算法建模,将成为我们关注的重点。
如腾讯广告对标签的分类可以分为:
人口学标签:性别、年龄、居住地、学历、婚恋、资产及工作状态等;
兴趣类标签:商业兴趣、泛娱乐兴趣、语义兴趣等;
设备类标签:设备品牌、运营商、 联网方式、型号、操作系统等;
行为类标签:人群上班地、出游频率、使用电商购物、O2O、游戏等应用特定行为、互动行为、支付行为等。
又如阿里电商对标签的分类可以分为:
用户属性类标签:性别、年龄、地域、注册日期、手机品牌、手机系统、联系方式、历史购买状态、用户活跃度、RFM价值度;
用户行为类标签:近30日访问次数、近30日客单价、近30日活跃天数、近30日访问时长、平均访问深度、充值用户等;
消费类标签:收入状况、购买力水平、已购商品、购买渠道偏好、最后购买时间、购买频次;
商品品类标签:高跟鞋、靴子、衬衫、法式连衣裙、肉脯、牛肉干、扫地机器人、智能音响等;
社交类标签:经常活跃的时间段、活跃地点、单身、评价次数、好评度等;
整个画像体系包括标签建模、画像系统、画像应用等一系列工作,那么如何搭建一个较完备的用户画像体系,以及如何更好的应用我们的用户画像?
一、业务需求分析
产品应当服务于商业价值,用户画像体系也应当具体问题具体分析,根据实际的业务要求,通过最终的价值导向进行建设。以笔者所在的教育行业为例,一个学生从小四到高三,理论上的用户生命周期是9年,期间单个学生产生的用户数据就已经很多,但是K12领域,竞争积累,如何保证9年的周期都能将学生留存下来,是业务营收的关键,我司的用户留存率在65%-85%之间,占到总营收的70%左右,数据相当客观。但是受到疫情的冲击,我们的业务目标由过去的线下社群争取留存,转变为了线上在针对新生的精准营销,实际上,由于公司是由传统的线下机构转型而成,对在线的用户运营没有一定的技术积累和储备,尽管我们在线下拥有几十万的学生群体,但是这些群体并没有产生足够多的在线行为数据,并且没有互联网运营这一专门角色。
我们拥有的是完备的业务数据,也就是学生课前预习、课中学习、课后复习、服务答疑、测试考试等教学相关数据,这决定了我们的用户画像基点在教学系统,并且会辅助信息运营系统即CRM,而流量、营销等面向C端的系统数据则会相应的在之后进行迭代介入,并且主要服务于管理层决策和市场运营人员。
此外,由于公司的行业和组织架构等特点,每个地区的中考高政策,服务重点,运营策略,教学方式等都不会太一样,所以如何共性出这些东西,也是需要值得细细考虑。用户画像,作为支撑系统,实际上并不会直接产生经济效益,他服务于管理层、市场、运营、数据分析等角色,所以在画像沟通过程中,一定要明确各个角色/部门的业务目标,尽最大的可能将过程和结果进行可视化的输出。
二、搭建标签体系
如果要构建精准的用户画像体系,则需要一套非常完备且服务业务逻辑的标签体系,从大多数的数据产品建设过程来看,根据标签的统计方式,可以分为统计类标签、规则类标签、预测类标签。
统计类标签是最常见的基础标签,如性别、年龄、城市、近7日活跃天数、近7日活跃次数、累计购买金额、累计购买次数、月均消费金额等字段;
规则类标签则是基于一定的用户行为和业务规则产生,如活跃度标签、RFM标签等,这一类标签则需要根据理论原则进行划分,如运用二八原则的高低频/远近/高低消费额、运用拐点理论的活跃流失等;
预测类标签则是基于用户的行为和业务数据,通过决策树、回归算法等挖掘用户的相关特征,针对用户的潜在需求进行精准营销和服务,如智能分班、续存相关性分析等;
根据我司的实际情况,我在搭建标签体系时,并不直接按照ToC端的方法进行,而是以业务绩效考核为指南,通过业务系统数据进行抽象。按照经济学中的货币政策理论,它将目标细分为最终目标、中介目标和操作目标,货币政策并不能直接作用在最终目标上,而是通过操作目标影响中介目标,最后传导到最终目标。
同理,我们的最终目标是营收,但用户画像这样的支撑系统很难直接作用到增加营收这个最终目标上去,所以我们要确定我们的中介目标,也就是我们可以通过用户画像达成什么样的操作,通过这样的操作影响什么样的中间值,进而增加营收。在公司业务中,营收主要是通过我们的学管、学规、老师和班主任完成的,如何能更好的让这些员工产生营收(对他们自己而言是产生绩效),其实就是用户画像如何更好的服务于他们,再往深层次就是他们如何更好的服务于学生和家长。
所以我的标签体系,基于教学系统和信息运营系统,主要基于学生课前、课中和课后的教学业务数据,分为课程资料类、学生错题类、学情分析类、学生个辅类、大考阶测类、结课报告类,并且辅以运营系统的学生基础信息、学生家长信息、历史报读信息等内容构建完成。
标签确定后,我们还需要对标签进行进一步的权重确认,哪些标签和学生留存相关性更高,或者就是单纯的哪些标签权重更高,这时候可以由TF-IDF词向量空间、时间衰变系数等算法可以使用,用户标签权重=行为类型权重*时间衰减*用户行为次数*TF-IDF计算标签权重。
三、构建用户画像系统
当我们的标签体系和用户画像等基础工作搭建完成后,如何建立一个标准的,适用于公司内部各角色使用的系统,满足包括用户分析、标签查询、营销活动对接在哪的各种需求,我们要考虑到角色的功能需求和非功能需求。
功能需求是直接由用户画像系统进行输出的功能,由搭建团队完成,主要有首页画像数据、标签管理、用户查询、用户分群;
非功能需求则主要是接口需求,由搭建团队对外输出标准化接口,再由其他团队完成对业务系统的对接和实现,如运营系统、教学系统、流量营销系统、大数据平台等系统;
实际上,由于公司的决策,我们的用户画像是集中在数据产品部完成的,并且作为数据中台的一部分进行,再加上业务对用户画像的认知不高,对标签体系和用户画像的维护,并没有进行一个标准化和可视化,所以我们更多的是直接输出最终的产品,如下一讲所示。
四、应用
【数据产品工作指北(5)-用户画像】大多数情况下提到用户画像大多都会提精准营销、用户分析、个性化推荐等内容;而我在实践中则总结出面对管理层、面对一线员工、面对用户三个方面的内容:
1、面对管理层,输出用户群体分析。支撑系统并不直接产生利益,所以在没有完全的数据证明用户画像带来了多少营收之前,是无法自证有多大价值的,甚至于会被认为是在做无用功。所以如果在高层没有统一认识的情况下进行用户画像系统的建设,那就需要将过程和结果进行可视化的输出,得到他们的信任,才能得到更多的支持。
在搭建用户画像之前,我们进行过一些手工的群体分析。但这些分析都被认为太过于表面,其结论是不用分析,只在日常业务活动中总结也能得出来的,这也是坚定我们做用户画像系统的原因之一。
文章图片
专题分析 面向管理层,我们参考了神策移动端的PUSH内容,通过每日的信息推送,给管理层带去每日的营销、营收相关信息,尤其是在留存大月(业内称之为窗口期),其留存数据是管理层必须关注的。以前只能被动的询问和查询数据,现在主动的推送可以培养管理层的数据意识和增加存在感。
文章图片
神策PUSH内容-1
文章图片
神策PUSH内容-2 2、面向员工,我们输出了基于多个系统数据的学生画像公共页面,包括了学生的各类标签,让员工能够在一页只能就能了解学生最重要的信息,最完备的数据,不用进行跨平台操作,并且各类标签也增加了理性的判断,避免主观层面的失误。并且一个公共页面,也便于我们进行维护和迭代,由于各种原因,进行该项目的前端开发仅有一位,并且采用的是Hybird模式,公共页面也许是我最好的选择。
文章图片
学生公共页 三、面对学生和家长。面对学生和家长,则主要类似于年终总结模型,并且扩展至结课、季度等时间节点,以H5分享页面为感情承载,归类于服务,通过口碑和精准营销扩大品牌效应,这一部分其实不仅仅是基于数据的用户画像,在实践中,我们还加入图片、文字等非结构化、非用户画像体系的内容。
此外还有面向线上的精准营销,但实际上由于转型尚未完成,并且更多的是针对线下业务场景,所以并不能完全等同于在线教育的精准营销,如何更好的达成最终目标,并且完善中介目标体系,还有很长的路要走。
以上就是对用户画像最近一段时间工作的总结。
推荐阅读
- Docker应用:容器间通信与Mariadb数据库主从复制
- 7.9号工作总结~司硕
- 高天天工作室|溧清的剧本4
- 如果你是一名工作乐之者,996的工作又算得了什么()
- 为什么985/211的学生能胜任工作获得老板的青睐。
- 2019-10-24工作感悟
- 高大上还是路边摊
- 使用协程爬取网页,计算网页数据大小
- 疲困,却仍得继续
- Java|Java基础——数组