微信聊天记录使用了什么样的搜索算法?( 三 )


1.标题党行不通 。尽量不要玩标题党 。我很少在“看一看”页面遇到纯标题党类型内容 。那些在微信公众号上大行其道的标题党似乎失效 。“看一看”页面呈现的标题类型 。多是含有跟内容主题密切相关且包含至少一个关键字/词 。尽量少用甚至不用一惊一乍式言语 。像“震惊体”行不太通(认证类媒体机构发布的此类内容除外) 。
2.原创内容占更大优势 。据不完全统计 。“看一看”页面呈现的内容 。绝大多数是打了原创标的公号推文 。比例远远超过一半 。高达70%-80% 。
3.认证公号的内容占更大优势 。据不完全统计 。“看一看”页面呈现的内容 。绝大多数是由认证类公号所推送 。比例在60%甚至70%以上 。
4.长篇类型内容更有优势 。据个人体验及观察 。劣质营销号鸡汤号那种惯用只有几百字的推送内容(含视频内容) 。很难有机会出现在“看一看”页面 。它更多呈现1500字甚至2000字以上的长篇类型内容 。
目前我尚无充分证据来判断算法是跟内容长度有关 。但推测算法的一个重要因子是用户停留时长 。即用户如果阅读这篇文章的时间越长 。它越有可能被精选、分发到“看一看”、“搜一搜”等页面 。
前述对算法有研究的技术人士向我提供了一段代码(返回码) 。它是微信用户在离开一篇文章时反馈给微信服务器的 。这段代码显示 。微信服务器可通过返回码来识别用户是否读完了一篇文章、阅读一篇文章的时长等 。这段代码可能佐证了我的猜想 。
5.聚集细分领域的公号更有优势 。据观察 。长期聚焦细分领域(比如科技、互联网题材)原创内容生产的公号 。更有机会出现在“看一看”页面 。
6.微信官方此前就微信指数接受新榜采访时指出:“微信有严格的隐私保护政策 。不会获取用户任何的敏感信息 。包括聊天记录、微信号、朋友圈评论等 。”
按照微信官方这种理念和逻辑 。我认为 。微信在“看一看”及“搜一搜”的算法中 。也不会采集用户聊天记录、朋友圈评论这类敏感数据 。但它可以通过一个微信公众号的主体(如认证号还是个人号)、是否开通原创功能及原创内容比例、公号过往的各种违规记录等 。以及一篇推文的用户阅读时长、推文被其他公号分享或白名单转载的次数、打赏数量及数额(遗憾的是iOS版微信已被取消赞赏功能)、真实阅读数点赞数、转发朋友圈次数等 。分别给各项指标不同权重来综合制定一个算法公式 。从而实现精准筛选和内容分发、流量分配 。
在上述所有因子中 。我建议公号运营者要高度重视其中四项:原创、认证、不要违规、用户阅读时长 。前两项比较容易做 。第三项需要精通微信规则并时刻关注政策变化 。用户阅读时长最重要也最难 。只有那些真正有料、用户喜欢的内容 。才有可能赢得用户最多停驻时间——我认为 。目前公号数据造假者因造假成本及造假技术原因 。很难对用户阅读节奏(划屏阅读行为)、阅读时长(停留页面时间)造假 。
从这个角度看 。“看一看”如果能走出“实验室” 。成为“微信第一入口”的标配菜单 。它就会成为真正基于人际关系、用户兴趣的精筛细选内容分发机制 。也将成为精锐小号的福音、垃圾大号的丧钟 。
“搜一搜”有两大劣势?
移动搜索可能是一条崭新赛道
说完“看一看” 。再来谈“搜一搜” 。
微信团队前成员陆树燊在5月19日的推文中 。列举了微信做搜索的两大劣势:
一是微信在全网数据(微信外)上没有基础 。跟百度等相比 。数据量少 。信息检索的算法没法比 。赶上仍需时间;
二是移动端搜索的产品仍沿袭PC搜索的体验 。主要靠打字搜索 。语音搜索、图片搜索的体验和效果都不够好 。这需要针对移动端的产品创新 。
陆树燊说:“我想 。微信团队如果要重仓移动搜索 。那就必须在前无古人的路上 。找到一种交互上的突破性创新 。也还是需要时间 。”
我赞成陆老师的观点 。并补充两点:
1.移动端是一个崭新赛道 。搜索功能的使用场景发生了巨变 。在全网数据搜索上 。百度确实依然是中文世界的霸主 。但是 。很多用户在移动端已没有使用百度的场景和习惯了 。
我曾在一个数百人微信群里做过一项小调查:有多少人目前仍有习惯在手机上打开浏览器输入百度网址 。或专门下载一个百度App来进行搜索?获得数十个答复 。结论是:在移动端仍使用百度搜索的人已不足20% 。且是低频使用(比如一周使用1-2次甚至半个月一次) 。

推荐阅读