【笔记】数据科学家职业成长之路

2019年9月21日,UXRen在北京举办了《用户研究的全链路赋能》的沙龙交流,本文基于嘉宾李典典博士(爱彼迎Airbnb数据科学家)的现场主题分享《斜杠用研青年的职业摸索和一点思索》总结而成。

 

分享笔记:

我今天讲的主题是关于一个用研斜杠青年职业上的一些折腾,磕磕绊绊、还有中间产生的一点感想。

我会跟大家聊四个方面,第一个是我作为一个跟UX人组织很有缘的人,我是谁;第二个是给大家讲一下我这几年做过哪些工作,在哪些坑里面趟过、这中间发生了怎么样的转折;第三个方面想跟大家聊一下,作为一个用研的编外人员,我如何看待跟用研的数据有关的一些主题;最后是一个老生常谈的问题,用研是什么,用研能发挥什么,用研的边界在哪里,我来抛砖引玉给大家讲一些我自己的观察和观点。

 

一、关于我和我的职业曲线

首先是“我”,我把自己叫做编外用研,因为我的title里面从来就没有叫用户研究这样的职位。 但是我还是非常自豪地觉得我跟用户研究很有缘分,怎么说呢?我是浙江大学一个管理学的博士,我做的研究叫做决策神经科学。主要的创新的点就在于我们把认知神经科学实验心理学里的方法理论跟测量工具用到了商业和管理的决策中,用这些新的思路和方法去研究问题。

我当时研究的主题包括判断决策中间的锚定效应,还包括人们在社会交往中涉及的物质、经济交换的互动过程背后的心理跟神经机制。之后我加入了一家叫做数字新思的营销科技相关的初创企业。

我们的业务是把神经科学心理学测量的理论跟方法技术用到对用户及消费者的探索中间,然后基于这些方法提供基于测量数据的咨询服务,以及基于这些数据的产品。我当时的工作一方面作为乙方在各种咨询的项目中间服务于甲方爸爸,另一方面是把这些理论和方法技术在商业中的应用做一个方法论的沉淀,即打造成一个产品。 这是我当时第一份工作所做的内容。

在做这段工作到了一个阶段,我突然想从更广泛的意义上去理解到底用户研究是什么?或者是商业分析能做什么?而且我特别希望知道研究分析的产出在一个组织或企业中,它最终达到了什么效果,有没有人去用,最后用的是怎么样的?在乙方的视角下,我很难有直观的感受。所以我当时希望有一些转变,于是我就来到了美团打车这个新的业务线。

我过去以后带了一个团队,我们的工作是在乘客侧做一些用户研究以及数据分析。但是比较特殊的地方在于我们当时是把研究产出直接运用到运营的策略中,这相当于我们在回答自己提出来的问题,把回答的结果直接落地到了业务中。这是一个非常宝贵的机会,满足了我当时的心愿,我既可以做探索,也知道这些产出最终能不能用,做了会有什么样的效果?

我今年初加入了Airbnb——爱彼迎北京,我的职位是“数据科学家”也是现在比较热门的一个岗位,这是一个用户增长的团队,我们关注的点在于如何在中国能够获得更大的房客源,使得业务有一个长足的发展。

回顾这几段经历,虽然我没有做过一个叫做用研的角色,但是都跟用户研究大的主题有着非常紧密的联系。在这些经历中,我想来说一下自己的感受,我做过的工作中,有什么样的点跟用研有关,而且有斜杠的概念存在。我自己归纳了一下,我觉得在之前的这几段工作经历中有两个关键词。

 

第一个关键词:交叉。

我自己的那几段经历中,每一段都有一交叉点,就是跨界的成分。首先从我做的研究的内容开始,虽然我是商学院的,但是我在做研究的时候会借助其它学科的研究成果、方法和思路,来试图解答另外一个领域的问题。这也使得我可以研究人在商业中怎么想、大脑的机制是怎么样?我产生了这个兴趣,而这个兴趣一直驱动着我在这几次职业转换中去思考,我能用什么方法来解答我对人对用户的兴趣,这段的交叉的研究经历,塑造了我职业发展中的轨迹和兴趣点。

第二个交叉的地方在于我做了很多研究和分析,而这中间会有一些外部或者内部的驱动,让我去考虑如何把研究和分析打造成一个产品。相当于是我做一些零碎的东西的时候,还需要思考这个东西如果系统地抽象出来,它作为一种产品的形态去提炼的话会是怎么样?这种职能或者工作内容上的交叉,对我个人来说很有帮助。

第三个交叉就是刚刚说到的,我在美团打车,既当甲方又当乙方,自己回答自己提出的问题。我们这个团队是一个双线并行的,在供应链的上下游都覆盖了的团队。当你研究和分析产出的结果在业务中使用,跟你的业务指标息息相关的时候,有两方面好处。 一方面是你能够更快速地提出更有价值的问题,而不会陷在一堆问题里面。另外有了运营的经验,看一些产品和业务的时候,更加有实践者的思维。探索产品和业务时会具备一个更好的思维框架,这让我受益匪浅。

第二个关键词:转变。

我从学术界去了业界,到了商业界会发现之前的学术的训练、分析的思维框架、能力,是你之后职业发展的很好的驱动力,但是它同时也会有些阻碍和限制,所以到了业界以后,其实是我自己踩过很多坑,意识到有很多问题,调整了自己的一些做事情的方式,才让自己变得更加的职业化。

第二个方面是我在自己的岗位上,历经了从纯做技术的独立岗,去了一个带团队的管理岗,然后现在又回归到了做技术的岗位。因为我的管理经验太短了,没有足够的能力来给大家来分享这一块,但是我有一个很强的感受,当你具有了管理者的身份之后,你在解决问题的时候不再沉溺于局部的效用,或局部的满意,你会从全局来考虑如何让这个组织最有效。 有的时候在跟你的团队的成员合作的时候,可能会有很多不开心,但是很多时候我们不能被这些不开心,或者个别人的个别因素局限了,作为管理者最大的职责不是让所有人开心,而是让这个组织更有效、资源更有效地发挥。

 

二、重新谈谈:数据、产品和用户

2.1 数据

这是我一直在做的工作,数据是我非常重要的一个武器,也是我每天都在面对的东西。我有一个很强的感受,当我们去“用数据说话”和“让数据说话”的时候,我们还是会不由自主地陷入一些误区。

我第一个想说是“用数据说话”。

对于用户研究这个岗位,数据是我们的好朋友,我们需要用它来帮我们验证假设,推出结论,基于这些东西来更好的理解我们所面对的对象,以及去推动我们产品跟业务的发展。

有一些东西我叫它“伪数据科学”,每一个数据的生产者和使用者,不管你是不是有数据分析数据科学的头衔,都应该跟伪数据科学去抗争。举几个简单的例子,常见的论调就是“研究表明”,后面就举一些数据,由此推一个结论。但我们不管做哪个职位,都应该在看到数据以及它推出的结论时,反复的练习,追究这个数据是谁做的? 他是商业的还是非商业机构的?他是为了盈利还是不为了盈利?发布数据和信息的人,他有何种能力和可信度来获得这些数据?他给了你最终的数据产出,是否同时提供产出之前的加工和来源的简单描述?这既代表了数据的良心也代表了数据的来源跟加工方式的知情权。

期望大家在可能的情况下,尽量多地去探索和提供数据的源头和背景,大家可以拿着这些数据的源头去进一步鉴别到底是不是可以使用这个信息,而且也更方便其他人用。这样重复去探索,这一次的发现是不是将来还是能继续被发现? 学术研究上叫元分析,从业界来说就是可重复性,产出更有普适性的结论。尤其是有些颠覆我们日常认知的结论,我们是否应该先考虑这件事情的整个的流程是不是可信的,是不是比较严谨的,得到这个结论之后,以后还有多大程度我们可以再看到类似的结论,来帮助我们获得更稳定的更真理的东西。

第二点就是大数据的迷思。到现在为止,关于大数据的价值和应用还是一个挺火热的话题,有许多人觉得这个时代数据有很大的魔力来帮助我们解决曾经解决不了的问题。数据的量大,肯定有很大的价值,但是即使在很多时候,我们基于非常大量的数据得到的结果,也不一定就比量不大的数据天然的具有更好的可信度跟效率。 实际上也要去看到底有多大的普适性,是不是加了很多限制,是不是只有在这个公司才会观测到这样的现象,是不是只有这个行业,别的地方能不能再现。作为数据消费者,我们应该有打假的能力,而作为数据生产者,我们应该保持住数据的良心。

第二个是“让数据说话”。

跟学术研究不一样,在业界很多消费数据的时候,都是借由数据来发现问题的,而不是说前面就有很强的假设了。通过数据观测到问题,由此产生一个新的idea,然后再去做验证。跟数据打交道的人,应该提升对数字数值本身的敏感性,否则就会出现原始数据可能是有异常,也许是采集的时候出了问题,但是没有被觉察到,然后由此推导出来很奇怪的结论,却百思不得其解,这样很浪费时间。Data sense是一个非常好的工具。我提一个问题,你们平时在工作中最为关心哪几个指标。你们能否很自信地说出这些指标在什么情况下它应该是什么样的一个值,它的变化范围大概是多少?到什么程度就是异常?这样的业务素质对大家的工作是很有帮助的,我自己也在逐渐地去提升这方面的能力,这也体现了我们对业务的了解。不管大家是在工作中做的是哪个岗位和什么项目内容,多看一些整个公司层面上的总体的数据分析报告或者是报表,对个人的工作会有一些作用。

 

2.2 量化所有能量化的

这句话有点极端,不是说一切都用数字去说话,但是如果我们可以量化我们工作的、个人的方方面面,对于我们做一些理性的决策会是一种很好的框架。我觉得量化是帮助我们认知世界跟认知自己的非常好的一种工具。

我们公司有两个经常说的概念,一个叫sizing,一个叫measurable,在任何商业决策的时候, sizing就是量化的去评估,如果我们要做这件事情,它最好的结果能达到多大量的影响力提升,最小是多少?同时对成本也是一样的,我们要花费多少各种方面的资源才能达到预期。在业务开始之后,我们数据科学家有一个基本的职能,就是去替业务方定义好指标,以及评估方式,很多公司其实现在都会用这个框架。我们为什么不把这个框架用在自己的发展上呢?比如说对自己的发展做数据分析、商业分析、用户研究等等。其实我们每个人都是一个很珍贵的资源,应该如何有效利用,大家是不是也可以在生活中去尝试分析一下? 个人作为一个有限的资源,能不能对一些重大的事情做一些这样的sizing,去measure做的怎么样,从中思考一下投入的产出比。

我觉得Airbnb的数据工作方面有很多这样的思路给了我启发。比如说我们数据科学家会给公司搭建dashboard方便大家使用数据,但是我们还会有基于dashboard的dashboard,我们会监测搭建起来这些东西的output到底有多大影响力,有多少人去看了你的dashboard、平时有多大频率来访问它,还有数据质量是不是稳定的,这其实是在量化我们所做的量化工作,我觉得这是感触比较深的。

回到个人的规划,有一个很重要的点在于量化的时候,你要非常清楚地知道你要的是什么。这个从业务上的概念叫做north star的指标。比如说我这一辈子做人最重要的就是开心,那么开心的程度就是你的north star,这一辈子你要用这个来衡量,然后量化也是向着这个目标去。

 

2.3 产品化的思维

从我第一份工作到现在,我做的工作内容很多时候是用产品化的思维来驱动我做的分析和研究工作。比如说第一段数字新思的经历,我会参与到具体的专项分析当中。研究当中,能不能把经过我们验证过的高效的方法跟手段,提炼成能够让更多人都能快速用上的产品。

神经科学技术在商业中的应用很多人都不了解,但是我们能不能把它翻译成大家能懂的东西,一个成本低的工具,用来帮助提升营销方面的各种投入。比如说我们当时会用脑电来测量受众对于视频广告的反应,来知道大家有多喜欢。如果说只是一个纯研究项目的思维,可能就是为某客户测了几条片子,然后把测试结果交付出去。

但是产品化的思维下,会在前期有一些不一样的拆解,比如说要保证测量的设备以后可以在更大范围内复用;要标准化测试流程,以便再测所有的广告片的时候都走一样的流程;找的样本需要具有代表性,而不是很偏向客户指定的人群。然后测广告的时候,如果是产品化的思维,会去想所有的视频广告它具有的特性是什么? 比如说它的时长,它包含的元素,有没有情节,有人吗?有物吗?有动物吗?有声音吗?有音乐吗?它在什么样的媒介上去被播放?把每一个样本素材,通过这样标准化的形式去拆解,然后用标准化的方式去测量之后,拿到一个标准化产出的数据。这样的话,其实每一个专项的项目,每一个研究都是为了一个更大的更有普适性标准化的产品去做积累的。其实这个产品化的思维,在我之后的工作和个人发展中都有一些启发。

比如说在美团打车的时候,我们的团队,虽然说我们做商业分析,做用户研究,同时我们也实际上去做了运营策略的实施。但是我们的团队不是一个业务团队,他还是一个商业研究分析团队。我特别感谢我当时老板的构想,就是我们团队就像一个最小化可行产品mvp。在这个业务发展到后期的时候,我们在前期通过运营中积累的运营策略以及具体的运营手段,还有基于它所产生的各种业绩的数据指标,其实都能够构成一个产品化的东西。

比如说当这个业务扩展到了其他城市的时候,当地的城市的运营团队不需要具备很强的商业分析能力,也不需要很多用研,运营的人基于总部积累下来这些东西,能够快速地出来决策,可以很灵活的,就像用一些产品一样,把以前做过的事情复用,而且所观察到的绩效可以拿之前累积下来那些数据去做对比,能够有个评估,而且越多的城市运用这些运营的策略跟手段的时候,我们可以比对同一个策略,在各个城市的表现是怎么样的? 在不同季节的表现是怎么样的?然后从中再发现新的规律,反过来又去优化整个打车的运营。

到了第三段工作中,我们还是用这个思路去做各种研究和数据分析的项目。这是我们数据科学团队特别强调的一个使命,就是要让数据去做enable。我们特别强调数据在整个公司的民主化,不要让获得数据和解读数据的能力技能只限定于专业的岗位,而应该想怎么把我们自己懂得的东西,我们知道的东西,让更多的人轻易的把它用起来。 一个是解放自己,第二个对整个公司也会有一个更大的帮助。所以我们平时在工作中,很多时候会把数据用各种各样的,可能是很简陋的产品形态提炼出来,用enable的思路去思考,我应该怎么样去设计好数据报表,我怎么样去迭代,可以让我们的数据的使用者用的更开心。这个产品化的思维,在我之前做过的事情中间是一直贯穿下来的。

有的时候也会带着这个思路去想一些日常的生活的例子,比如说我现在去健身,我就觉得我教练人很好,但是挺替他可惜的,他一个小时,那么辛辛苦苦挣的钱就只能是我付给他的课时费。但如果说健身教练他去打造一个产品会怎么样?他会有他自己的方法论的沉淀,他有这么多学员,他带过这么多人,他是不是可以给我们搞一些数据的积累,有个数据库,从中发现一些规律去优化它,对于每个不同学员根据他自己的特质,基于以前的经验跟产品中间含有的东西,我知道我给你定制什么计划可能会更好。

 

2.4 做好一个乙方

然后是最后一点,我们不管自己是在哪个岗位上,很重要的一点是做好一个乙方。有可能我们是在甲方公司,然后我们在工作岗位中也是个偏甲方的角色,但是每个人的职业发展中间也可以去从一些乙方的角度去考虑问题,对于外部客户,当然如果我们是乙方的话,我们肯定是好好的服务。但是在工作中,如果可以能够更好的把自己定义为乙方,想着我的合作伙伴的需求是什么? 我提供的东西怎么样让人家觉得更有价值,能发挥更大的效果。我觉得这中间同理心和耐心还挺重要的。比如在有大数据之前,数据获得还有点难的年代,宝洁入华,有蛮多的项目是去乡村,去观察人们的日常生活。不要只是用公司唾手可得的数据,而是能够用比较好的方式去亲历自己真正最终服务的终端对象的观察,我觉得还是挺宝贵的。

再比如我过来的时候坐北京地铁,我心想这可能真的没有怎么做好用研。因为我妈快来北京了,她身体不好,我想她这样的群体是不可能在北京坐好地铁的,因为没有很清楚的标识,换乘非常的难。

我们平时在日常生活中面对各种问题时,可以假想如果我是用户,我现在感受到的是什么? 反过来说,假定做设计和制造的人,他能从我们这个角度去想,会不会可以更优化,我觉得我这辈子最像个用盐的时候就是当时在美团打车,我们其实当时想在北京做打车业务,所以每天打车的时候,我都会在心里列一个访谈提纲,然后就跟司机去聊、去了解。我觉得用户研究可以任何时候都有的。

 

还有一个很小的例子,我觉得可以将用户研究的思路用到我们的工作中。 我平时会用到google系,我的一些数据工作的结果产出,每一张google sheet都有一个activity的dashboard,你能知道你提供的这个数据的PV、UV、使用时长随着时间的变化。这个时候我其实在做一个用户研究,相当于我提供的数据就是我做的一款产品,我可以看到用户的使用情况。 我本以为很多人都会拿我的数据用,其实不一定。这时候就要想想看是什么原因?是沟通出了问题吗?是数据可视化呈现出了问题吗?是结论给的不够清楚,让人家觉得不好用?举这个例子是想跟大家共勉,如果能有这样的一种方式,用在自己的生活当中,或者是在具体的职能当中,这个也是我们用研人很宝贵的一个思路。我们应该比普通的群体具有更深的感受,我们更容易想到这个角度,所以可以做得更多。

 

 

三、用研的边界(或者用盐是什么)

正因为我自己做的事情比较杂,也一直不是纯用盐,所以有时候会思考“这是个问题吗”?我讲几点我的观察所得。

以下是一些我觉得也算是用户研究的岗位,比如有一个商业咨询公司叫Gap International,这是我曾经找工作的时候搜到的。 一个咨询公司,从16年到现在一直在招语言学家,他们把Linguistic(语言学)的思维方式拿来研究语言跟消费者或者是用户之间的关联。另外他们之前还招聘有神经科学背景的,但是可能发现有点难招。其实很多时候可能做一些看上去不相关的研究或技能的人,还是有很多的点可以去发挥。

第二个是互联网公司也有很多经济学家团队,比如快手有一个叫经济学家的团队。 另外我看到Uber会招聘Applied Behavior Data Science,而他们要求的背景都是心理学、认知神经科学、营销科学等。一个典型的应用的案例是这样子的,拿经济学的计量模型举例,比如业务中A影响了B,那么Uber会探究A是怎么影响B的,假设有很多个C,这叫中介,那么A是通过C作用到B的。所以假定我们能搞清楚C是什么,我们就能够基于C影响B的机制去反推更多的A出来,就有更多的业务上的选项。

为什么这个团队能做好这件事情?是因为除了经济学家,他们还有一些认知神经科学的人和心理学家一起研究,A到B的作用机理,基于我们对人类心理的认知,可能会是哪些C指标,它们的定义和测量要有这样背景的人才能提出来。

这些人都是用户研究者。大家有兴趣可以去搜一下Martin Lindstrom,他写过《Small Data》,他以一个人类研究学的视角去做一些商业的咨询。

Dan Ariely是我之前研究领域中的一个很权威的教授,我非常敬佩他。他基于对人类行为机制的理解,通过一些商业化或者非商业化的产品去提升大家的决策效率,说得更宏大一点,就是去创造更多的人类的福祉。这两个人其实都很有意思,他们俩之所以会走上这条路都是因为年轻的时候生了大病,在医院里很痛苦,但是痛苦的时候其实更容易感受到别人的反应,于是有更多的心思去琢磨人为什么这么做。

何志森是我在听一席的演讲时了解到的,他是一名建筑师,作为一个设计者,他创造了很多方法来理解我们城市设计是为什么样的人服务。

我不能说我对用户研究做什么以及它的边界有一个非常清楚的答案,但是这是我的一些小小的观察,今天拿出来给大家分享一下。我今天分享到这里,很高兴能够跟大家来聊。

 

现场问答:

提问1:如何根据客户对于客户体验的热情确定测量指标,并将这个指标运用到商业决策中,促进商业增长?

回答:从数据科学家的角度来看,首先怎么定义用户对爱彼迎的热情,你刚刚说的只是一个现象。然后我们要做的事情是,这个现象我们是通过什么样的数据指标能说明这个问题的?比方说我们用一个常用的NPS指标来代表客户的热情度,其实在爱彼迎我们会有一个思考的框架,我们叫做input metrics 和 output metrics,其中output matrix 就是我们关心的业务指标,比如更多的订单量、或者更多的盈利等等。数据科学家一个很重要的工作就是把包括这个指标在内的很多input matrix拿去跟output matrix做关系分析,两者之间可能还会出现中介变量,而不是直接有强相关。比如说你可能会发现input matrix中的一个指标上去了,半年之后,会影响到output matrix的指标。你会发现从input matrix到output matrix 中间会有很多层的转化。

例如我们通过一些手段吸引到更多的用户下载应用,中间才有一定的可能性,在某些条件下更多地转化为我们最后想要的订单。我们数据的工作中会把这些input matrix和一些second level的matrix去建立联系,又会发现在一定程度上这些second level的matrix其实也能够跟我们最终关心的指标正相关。比如说 NPS涨上去以后,可能你会发现UV也涨了,这个也是一个很强的signal,可能也是某些部门所关心的output matrix。

以上是从数据科学的角度来讲一下,我们怎么样去用一些方法来去寻找中间的关联来支持业务。

 

提问2:在大团队中的数据科学家的职能分类及工作详情,协调方式

回答:首先我在的岗位是数据科学家(分析),还有一些数据科学家是做统计建模的,偏经济学统计学的功底,还有就是像机器学习、人工智能的这些,所以我们会有三种类型的数据科学家在Airbnb。

大家工作的侧重点会有所不同,我们其实是跟业务方合作最紧密的,我们时时刻刻关心着业务的指标状态,通过一些分析探索、指标的监控来评估我们的业务发展状况,发现一些问题来提供给像pm他们这些人。

偏建模的数据科学家会基于我们的业务去设计一些更好的AB测试方案,一些基于计量经济学的分析模型,使得我们可以用更科学或者高阶的方法来做一些数据分析,能够有一个多维度的产出。

机器学习和人工智能背景的同事,他们会把厉害一点的方法用在我们的业务当中,比如图像识别技术

数据和用研是分在大的职能线中的,会有很多交叉合作,有很多反复的输入输出,合作是完全双向的。例如Pm 产生用社交分享来驱动业务发展的想法,用研负责研究为什么用户愿意社交分享,数据科学家对社交分享后对业务数据的影响进行分析,再反馈给用研,产品更新后产生新数据,数据科学家通过新数据定位到需要研究的用户,用研再进行进一步研究,像一个链条一样。其实我们是一直在双向的配合的。但是大家切入点和视角不一样,我们用不同的方法工具去揭示我们现在的房客们,他们来不来,他为什么不来?房客们用的好不好,他们喜不喜欢我们给出的这些东西。

在爱彼迎北京,我们用户科学团队会分为房客和房东两个大方向,而我主要负责的是房客侧的研究。但是在房客范畴之内,我会持续地去支持这个领域中不同项目。在项目团队中有working team,包括用盐、设计。 我90%的时间是跟其他职能的同事一起合作,而不是和其他数据科学家在一起。

 

提问3:对于语言不通的用户研究,如何快速了解其他文化用户的需求。

回答:跨语言、跨文化的工作环境容易出现问题。可以考虑用人类学的方式,沉浸到他们的生活中去了解他们的文化。或者利用留学生、华人组织的力量,收集到比较好的一手数据。如果当地已经有类似产品,则可以找到最受欢迎的本地产品,研究产品中的最大差异。

感谢樂樂详实的记录,晓頔细致的审核。


【完整视频】用户研究的全链路赋能(约150分钟)
  • 《斜杠用研青年的职业摸索和一点思索》主题分享(约43分钟)
  • 《斜杠用研青年的职业摸索和一点思索》问答(约16分钟)
  • 《用户研究的全链路赋能》圆桌问答上(约57分钟)
  • 《用户研究的全链路赋能》圆桌问答下(约26分钟)

 

发表评论

您的电子邮箱地址不会被公开。