【笔记】产品看不见的策略

由宝珠 · 2021-06-08

2021年5月29日，UXRen上海举办了《看不见的数据策略和看得见的数据可视化》的主题沙龙分享会，本文基于嘉宾 萧饭饭（策略产品经理） 的现场主题分享《产品“看不见”的策略》总结而成。特别感谢UXRen志愿者 咋啦 & Andrea 的细致笔记整理。

本次活动中，嘉宾以搜索推荐为例讲述了产品背后的算法和策略。

分享框架：

活动笔记：

1. 算法的基本原理

1.1 策略概述

你可能会发现，当你跟身边的人同时打开一款app搜索一款商品时，你们得到的搜索结果页面内容可能画风完全不同，再看看你们各自的首页推荐内容，也风格迥异，但好像又正好迎合了你们各自的需求和爱好，这里就要提到“算法“ 和 ”策略”。当一个产品需要将信息呈现给不同用户时，“千人千面”难以避免，就需要算法从大量信息中“层层筛选”出来用户会喜欢的内容，最终通过排序为用户呈现。

1.2 算法的基本流程

搜索&推荐=从海量的信息中不断筛选最匹配的物品以topN形式呈现给用户的过程。

按照现有的算法逻辑来看，一般会分为四步流程：

召回
即从海量信息先生成一个候选集，相当于一个筛子的第一步。
过滤
因为候选集里有一些信息是我们用不到的，比如说一些敏感信息。
排序
过滤之后的信息可能还是成百上千条的，手机/电脑屏幕能呈现的信息有限，用户只能一条一条浏览信息，在这一步，抓住用户的兴趣就至关重要，所以“排序”就是哪条信息排在什么顺序。
重排
在前面“排序”的基础上，我们可能人工会有一些其它策略或者特殊的要求来进行信息的干预。

1.3 召回方案

以淘宝的“猜你喜欢”为例，“召回”的逻辑其实非常简单，以我们日常的生活经验为例，当一个用户进入一个页面的时候，按照常识怎么推测“他”喜欢什么呢？比如我们知道她是女生，那么可以猜测她大概率会喜欢连衣裙，利用用户的基础信息来猜测“他”喜欢什么就是“用户画像法”；另外，如果我不知道你是谁，但是如果我可以通过其它方法知道跟你相似的人是谁，那么他喜欢的东西你大概率也会喜欢，即“协同过滤”；除此之外，还可以通过“社交关系”（通讯录、关注用户）和“关联关系”（关联数据召回）来“猜你喜欢”。

1.4 用户画像

召回的核心是找到用户与用户、物品之间的相互关联，比较常用的就是“用户画像”，即以标签形式组织的用户的高度结构化信息。用户画像中每个用户都会有一个唯一的标识号，例如uid，其它基本的“标签”还有比如“性别”（男/女），标签后面可能会有一个数值，比如“连衣裙-0.98”，这个数字代表这个用户对于这个标签的偏好程度，数值越低，代表他可能越不喜欢这个这个连衣裙，一般0-1代表偏好程度。

目前对于大多数产品，一个用户下面所挂标签肯定不止下图列举的三个，而是成百上千个，如果将这些标签划分维度的话，可以分为基础属性、平台属性、行为属性、兴趣偏好、消费属性、用户生命周期及生命价值，这六个维度是用户画像比较核心的维度，要搭建一个比较完整的用户画像，主要包含这些，但是仅有这些肯定是不够的，基本上我们现在每个产品的维度可能有十几个或者几十个。

1.5 协同过滤

协同过滤时近几年比较热门的一个词汇，它的核心是“我虽然不知道你这个用户喜欢什么样的护肤品，但是我可以找中间一个桥梁“，这个桥梁可以分为两类，一种是我可以先找到跟你相似的用户在找的物品，另一种是也可以先通过这个物品再找到你要的物品，中间搭线的桥梁用户即”user“，这就是基于用户的协同过滤，如果中间搭线的是物品的话，它就是基于物品的协同过滤。

1.6 应用

比如我最近点击了一个连衣裙，然后你可能发现一些喜欢这个连衣裙的女生都是热爱时髦的，那么这些女生还喜欢过什么呢？可能喜欢化妆品、美容仪，所以即使你不知道我是否喜欢化妆品、美容仪，你仍然可以通过这个链路把这个化妆品推给我，虽然我从来没有点过化妆品，这样一个链路就搭建完成了，这就是推荐其中的道理，即“协同过滤”。

1.7 排序

排序=模型+特征

Y是我们的目标，x是里面的变量，f就是一个公式，这里可以理解为一个模型，目标可能是ctr，即希望用户点击的越多越好，x可能是一个特征，或者说是什么影响ctr，这里面的维度可能很多，那如何把这些因素转化为目标呢？中间的f就是模型，可能是机器学习的模型或者深度学习的模型，所以日常工作中说的算法工程师的核心工作就是这一点。

机器学习为例拆解算法模型训练的基本过程，训练模型之后找出来是什么东西影响用户点击或者没点击的，验证做完了后把它们放到一个验证机里，这个验证机就相当于我们的样板，有100份样本，把它拆解成一个70份的训练集，还有一个30份的验证集，很明显，训练集就是用来去挖掘那些关系的，验证就是校验你做的对不对，然后就是机器学校或者深度学习的基本流程。

1.8 重排

重排的策略=用户体验+结果校准+运营需求

重排就是刚刚的召回和排序仍然有一些业务的问题，比如这个模型看起来多么的高大上，但是为什么推出来满屏的连衣裙，为什么没有当季新款，重排可以让页面分布更均匀一些，可以加权排序，或者是其它非常简单的策略，比如薇娅推荐的东西要放在第一行。

搜索举例：

2. 算法产品的思考

2.1 日常

策略产品经理=算法细节+算法逻辑+用户/客户端产品经理

如果作为一个算法的产品经理，日常做的工作就是怎么召回、怎么排序、怎么重排，从宏观角度讲，大家做的工作没有什么差异，首先要了解产品定位，去找到目标用户、核心用户，比如抖音的核心用户跟快手的核心用户肯定是不同的，二者产品调性上也会有所不同，这可能会影响到底下每一个场景的涉及都有差异。

到了微中观层面，就是大家用各自擅长的方面去做擅长的事情，可能是页面设计、交互逻辑等。比如用户搜了一个“guccit恤”，人是很容易理解它的意思，gucci是一个品牌，交给机器的话可能会处理的比较粗糙，它可能误认为前面是一串字母，后面是一个汉字，把字母和汉字中间断开合情合理，这样的话这个query是没有什么意义的，所以这种情况就需要人工从微观去做一些逻辑的调整，要从品牌那里单独切。

2.2 核心工作

最后总结一下策略产品经理的三个核心工作吧，“定、拆、查”，其实也是对应刚刚的流程。

第一个是“定”，确定我们做这件事情的目标是什么，产品定位是什么样的，这个是需要大家共同探讨的，比如抖音是怎样一个产品，服务什么用户，目标是什么，我们要不要做下沉市场？第二个目标是算法的目标，以淘宝为例，同样都是首页“猜你喜欢”，是以ctr为目标还是以ctr*gmv。

第二个是“拆”，拆是策略最核心的部分，即拆场景，比如大众点评有人查酒店有人查美食有人查美容美发，这就是针对用户的目标，需要把一个一个场景拆出来，给出一个快速入口。

第三个是“查”， 360度确保系统完整、灵活、精准及可长期发展。正向的检查问题，或者逆向查平台上存在的问题。比如赵丽颖离婚了，这个事件明明已经发生了，然后头条已经推出去了，但是我这个产品却从来没有推，那为什么我的产品没有在第一时间推出这个东西？首选查是不是底层没有这个内容，再看召回层有没有问题，可能还要看排序有什么问题。