你需要定义唯一的“UX北极星指标”吗？

由宝珠 · 发布日期 2022-02-09 · 已更新 2022-02-09

翻译：Mio J 审校：小黑 | UXRen翻译组 #395译文
原作者：Tomer Sharon
原标题：《Should you create one user experience metric?》

假设典型的产品开发生命周期有以下四个阶段：产生想法、构建产品、发布产品、听取用户反馈。头图是我自己针对产品的不同阶段总结的三类用户研究范式。本文聚焦在“度量（Metrics）”这个研究范式。

一般来说，用户研究可以分为三大：战术研究（Tactical research）、策略研究（Strategy research）和度量（Metrics）。

战术研究：
战术研究通常是在设计和构建之间进行（或者说在此期间开展是最为有效的），它旨在确定产品的优劣势，迭代并优化。例如，找到四个被试者通过在原型上完成任务来测试你的新App。
策略研究：
策略研究可以在产品或服务全生命周期的任何阶段进行，当然，设计和构建之前是最佳阶段，它旨在了解用户，包括他们的行为、动机，并发掘他们当前的需求、问题及工作流程。例如，观察销售人员与潜在客户的互动交流，以便我们可以识别痛点和机会。
度量：
度量是在产品发布后进行的定量研究和数据采集，目的是了解人们使用时的真实情况。例如，我们可以度量产品核心功能的用户留存。

当提及产品体验分数的创建时，相关的讨论往往聚焦在体验指标的类目（category）上，而且只局限在产品发布以后的相关研究。在这个阶段，产品团队会遇到的相关重要问题如下：

我们为用户创造的体验是怎样的？是好还是坏？
随着时间的推移，体验会趋向变得更好还是更糟？
不同的产品和服务之间如何对用户体验进行比较？

所有这些问题的共同答案都指向“创建一个全局的用户体验度量指标”。由于没有单一指标可以整体地反映用户体验本身，因此，可以结合“公式”及“权重”，综合多个体验指标算出一个体验总分。多年来，我通过在google、WeWork、高盛的从业经历和指导全球数百家初创公司的经验得出了明确的结论。那么，到底应不应该创建一个用户体验评价指标呢？

答案好像是Yes

当我在WeWork担任用户体验负责人时，我创建了这样一个UX北极星指标。我们将其称为会员体验分数（Member Experience score），这个指标可以为每栋WeWork大楼、每个城市、每个地区甚至WeWork的一切提供一致且持续的体验分数。它囊括了物理空间（physical spaces）、数字产品（digital products）、人与人之间的互动（human-to-human interaction）等10多个影响WeWork全面体验的度量维度。我们使用了多个体验指标来度量这些维度和功能。

我们的产品总经理、社区经理和高管们都可以随手get这个分数，这有助于他们更好洞察客户、理解体验趋势、评估规划中的变化，并及时响应有意义的变化。这个分数使得我们为用户创造的体验是可见的。

看起来很完美，对吧？

也有可能是No

Google从不缺少用户使用数据（usage data）。当我在谷歌搜索任职研究员时，我们并没有一个体验总分数。相反，我们有大约120个不同的指标。这120个指标所折射的信息量非常庞大，他们可以及时反映任何触点的体验情况。比如说，对于搜索结果，我们有两个非常有说服力的指标，我们称之为长点击和短点击（long and short clicks）。

长点击（long clicks）
是指搜索用户点击某个结果并在该页面停留很长时间甚至不再返回搜索结果页面的点击。我们认为这是一件好事，因为我们相信用户找到了他们想要找到的东西。
短点击（short clicks）
是更反复且不稳定的点击行为。用户在结果页面和我们提供的结果链接之间来回切换。我们认为这是一件坏事，因为他们找不到他们想要的东西，因此一直在持续寻找。

但是，后来，我们的定性研究证明我们这个假设是完全错误的。（但这就是另一篇文章要说的事情了。）

长/短点击以及许多其他数据促成了多次富有成效的讨论，并推动我们做出更好的产品决策。我们从始至终都没有考虑过用一个总分来体现用户体验的好坏，但google及其搜索产品的成功依然无可辩驳。

这听上去也很不错，对吧？

或是Maybe（或许）

在WeWork，没有人关心会员体验指标（member experience metric）。创建一个人们认为有效、可靠、有意义的单一北极星指标，意味着很多人需要就创建分数的公式达成一致。想象一下WeWork的庞大产品体系，数百个大大小小的功能和细节共同打造了它的专属体验，每个功能或细节背后，都倾注着一个团队的心血，并且每个人对其负责功能在公式中的权重拥有发言权，当他们关注的功能没有得到高权重时，这个团队将不再相信汇总后的总分。关于汇总公式的讨论往往充满细节且过于复杂，这导致了人们的不信任甚至疲惫感。总之，用一个总分来反映用户体验好坏，理想很丰满，但现实却很骨感。

而Google正相反，内部并没有这样单一的北极星指标，因此也不会困扰到任何人。也就是说，有120个不同的使用指标，任何人都可以选择一个以“天”为单位的变化指标（或稳定、或增加、或减少），并在下次会议上亮出其观点。

也就是说，我们很少听到某个组织开发并并使用单一用户体验北极星指标，对吧？他们对KPI或是其他指标是否也这样做？你是否听说过单一的商业指标，或一个运营或技术性能指标？

并没有听过，对吧？

我的终极结论：几个指标的紧密组合

我的经验是，虽然对多个产品的体验进行定量比较是一个强烈需求，但就单一的用户体验北极星指标达成一致是极其困难的。相反，我认为有4个体验指标比其他指标更重要（这也是我最近正在试验的），并且我正在将其数据可视化，让高层领导们可以使用这些指标对比他们的产品。我选择的四个指标是：

满意度得分：
用户对产品的平均满意度。
7日活跃度（或任何对产品有意义的时间单位）：
在过去7天内至少使用过一次产品的用户占用户总数的比例。
首次使用率：
（在给定的时间范围内）第一次使用此产品的用户占用户总数的比例。
留存率：
在给定时间范围内持续使用产品的用户占用户总数的比例。

请注意，所有这些指标都要以百分比表示，以便进行跨产品的横向比较。

诚然，创建单一或四维的体验指标能使任何组织的用户体验变得直观。然而，为了能持续追踪体验变化，为了能在产品之间进行横向比较，更重要的是，能用它来推动积极的变化，我们应该着力于建立信任感（团队对你和对度量流程的信任感），与团队达成一致并获得认可和支持。否则，度量什么、如何度量以及何时度量，这些都不重要。

原文来源：https://tsharon.medium.com/should-you-create-one-user-experience-metric-ed8e19c2ab22（2020.2.25）
版权声明：该文章在UXRen公众号（cnUXRen）首发后方可转载，转载时请注明出处及译者、审校者信息，如有违背，UXRen社区保留侵权追责的权力。