【笔记】产品看不见的策略

2021年5月29日,UXRen上海举办了《看不见的数据策略和看得见的数据可视化》的主题沙龙分享会,本文基于嘉宾 萧饭饭(策略产品经理) 的现场主题分享《产品“看不见”的策略》总结而成。特别感谢UXRen志愿者 咋啦 & Andrea 的细致笔记整理。

 

本次活动中,嘉宾以搜索推荐为例讲述了产品背后的算法和策略。

分享框架:

 

活动笔记:

1. 算法的基本原理

1.1 策略概述

你可能会发现,当你跟身边的人同时打开一款app搜索一款商品时,你们得到的搜索结果页面内容可能画风完全不同,再看看你们各自的首页推荐内容,也风格迥异,但好像又正好迎合了你们各自的需求和爱好,这里就要提到“算法“ 和 ”策略”。当一个产品需要将信息呈现给不同用户时,“千人千面”难以避免,就需要算法从大量信息中“层层筛选”出来用户会喜欢的内容,最终通过排序为用户呈现。

 

1.2 算法的基本流程

搜索&推荐=从海量的信息中不断筛选最匹配的物品以topN形式呈现给用户的过程。

按照现有的算法逻辑来看,一般会分为四步流程:

  1. 召回
    即从海量信息先生成一个候选集,相当于一个筛子的第一步。
  2. 过滤
    因为候选集里有一些信息是我们用不到的,比如说一些敏感信息。
  3. 排序
    过滤之后的信息可能还是成百上千条的,手机/电脑屏幕能呈现的信息有限,用户只能一条一条浏览信息,在这一步,抓住用户的兴趣就至关重要,所以“排序”就是哪条信息排在什么顺序。
  4. 重排
    在前面“排序”的基础上,我们可能人工会有一些其它策略或者特殊的要求来进行信息的干预。

 

1.3 召回方案

以淘宝的“猜你喜欢”为例,“召回”的逻辑其实非常简单,以我们日常的生活经验为例,当一个用户进入一个页面的时候,按照常识怎么推测“他”喜欢什么呢?比如我们知道她是女生,那么可以猜测她大概率会喜欢连衣裙,利用用户的基础信息来猜测“他”喜欢什么就是“用户画像法”;另外,如果我不知道你是谁,但是如果我可以通过其它方法知道跟你相似的人是谁,那么他喜欢的东西你大概率也会喜欢,即“协同过滤”;除此之外,还可以通过“社交关系”(通讯录、关注用户)和“关联关系”(关联数据召回)来“猜你喜欢”。

 

1.4 用户画像

召回的核心是找到用户与用户、物品之间的相互关联,比较常用的就是“用户画像”,即以标签形式组织的用户的高度结构化信息。用户画像中每个用户都会有一个唯一的标识号,例如uid,其它基本的“标签”还有比如“性别”(男/女),标签后面可能会有一个数值,比如“连衣裙-0.98”,这个数字代表这个用户对于这个标签的偏好程度,数值越低,代表他可能越不喜欢这个这个连衣裙,一般0-1代表偏好程度。

目前对于大多数产品,一个用户下面所挂标签肯定不止下图列举的三个,而是成百上千个,如果将这些标签划分维度的话,可以分为基础属性、平台属性、行为属性、兴趣偏好、消费属性、用户生命周期及生命价值,这六个维度是用户画像比较核心的维度,要搭建一个比较完整的用户画像,主要包含这些,但是仅有这些肯定是不够的,基本上我们现在每个产品的维度可能有十几个或者几十个。

 

1.5 协同过滤

协同过滤时近几年比较热门的一个词汇,它的核心是“我虽然不知道你这个用户喜欢什么样的护肤品,但是我可以找中间一个桥梁“,这个桥梁可以分为两类,一种是我可以先找到跟你相似的用户在找的物品,另一种是也可以先通过这个物品再找到你要的物品,中间搭线的桥梁用户即”user“,这就是基于用户的协同过滤,如果中间搭线的是物品的话,它就是基于物品的协同过滤。

 

1.6 应用

比如我最近点击了一个连衣裙,然后你可能发现一些喜欢这个连衣裙的女生都是热爱时髦的,那么这些女生还喜欢过什么呢?可能喜欢化妆品、美容仪,所以即使你不知道我是否喜欢化妆品、美容仪,你仍然可以通过这个链路把这个化妆品推给我,虽然我从来没有点过化妆品,这样一个链路就搭建完成了,这就是推荐其中的道理,即“协同过滤”。

 

1.7 排序

排序=模型+特征

Y是我们的目标,x是里面的变量,f就是一个公式,这里可以理解为一个模型,目标可能是ctr,即希望用户点击的越多越好,x可能是一个特征,或者说是什么影响ctr,这里面的维度可能很多,那如何把这些因素转化为目标呢?中间的f就是模型,可能是机器学习的模型或者深度学习的模型,所以日常工作中说的算法工程师的核心工作就是这一点。

机器学习为例拆解算法模型训练的基本过程,训练模型之后找出来是什么东西影响用户点击或者没点击的,验证做完了后把它们放到一个验证机里,这个验证机就相当于我们的样板,有100份样本,把它拆解成一个70份的训练集,还有一个30份的验证集,很明显,训练集就是用来去挖掘那些关系的,验证就是校验你做的对不对,然后就是机器学校或者深度学习的基本流程。

 

1.8 重排

重排的策略=用户体验+结果校准+运营需求

重排就是刚刚的召回和排序仍然有一些业务的问题,比如这个模型看起来多么的高大上,但是为什么推出来满屏的连衣裙,为什么没有当季新款,重排可以让页面分布更均匀一些,可以加权排序,或者是其它非常简单的策略,比如薇娅推荐的东西要放在第一行。

 

搜索举例:

 

2. 算法产品的思考

2.1 日常

策略产品经理=算法细节+算法逻辑+用户/客户端产品经理

如果作为一个算法的产品经理,日常做的工作就是怎么召回、怎么排序、怎么重排,从宏观角度讲,大家做的工作没有什么差异,首先要了解产品定位,去找到目标用户、核心用户,比如抖音的核心用户跟快手的核心用户肯定是不同的,二者产品调性上也会有所不同,这可能会影响到底下每一个场景的涉及都有差异。

到了微中观层面,就是大家用各自擅长的方面去做擅长的事情,可能是页面设计、交互逻辑等。比如用户搜了一个“guccit恤”,人是很容易理解它的意思,gucci是一个品牌,交给机器的话可能会处理的比较粗糙,它可能误认为前面是一串字母,后面是一个汉字,把字母和汉字中间断开合情合理,这样的话这个query是没有什么意义的,所以这种情况就需要人工从微观去做一些逻辑的调整,要从品牌那里单独切。

 

2.2 核心工作

最后总结一下策略产品经理的三个核心工作吧,“定、拆、查”,其实也是对应刚刚的流程。

第一个是“定”,确定我们做这件事情的目标是什么,产品定位是什么样的,这个是需要大家共同探讨的,比如抖音是怎样一个产品,服务什么用户,目标是什么,我们要不要做下沉市场?第二个目标是算法的目标,以淘宝为例,同样都是首页“猜你喜欢”,是以ctr为目标还是以ctr*gmv。

第二个是“拆”,拆是策略最核心的部分,即拆场景,比如大众点评有人查酒店有人查美食有人查美容美发,这就是针对用户的目标,需要把一个一个场景拆出来,给出一个快速入口。

第三个是“查”, 360度确保系统完整、灵活、精准及可长期发展。正向的检查问题,或者逆向查平台上存在的问题。比如赵丽颖离婚了,这个事件明明已经发生了,然后头条已经推出去了,但是我这个产品却从来没有推,那为什么我的产品没有在第一时间推出这个东西?首选查是不是底层没有这个内容,再看召回层有没有问题,可能还要看排序有什么问题。

 

2.3 思维方式

将多问题进行分类,问题由大到小进行拆解,主观问题客观量化,具体问题抽象化。大问题是不可见即不可操作的,需要通过一个一个case去把它抽象出来,找到它们共性的问题,再返回去。

 

3. 书籍推荐

  1. 《机器学习》
  2. 《策略产品经理:实战进阶》
  3. 《推荐系统实践》

以上是关于产品背后的算法和策略的分享。

 

分享嘉宾:

 

萧饭饭(策略产品经理)

现在国内某手机厂商AI研究院任策略PM;
擅长领域:搜索、推荐、用户画像;
2020年网红书籍《数据产品经理:实战进阶》的核心作者之一。

 

发表评论

您的电子邮箱地址不会被公开。