如何做一枚合格的数据产品经理

大数据文摘出品

编译:王富贵

来源:medium

每一个公司都有产品经理。

根据定义,产品经理负责统筹各方需求,选择业务模式,并根据公司产品的生命周期进行协调、研发、营销、运营。

传统业务还好说,毕竟一些流程已经成熟。但是对于数据科学这一比较新的领域来说,需要发掘的东西太多,不能拘于传统范式。

如何做好数据圈的产品经理?一位曾在Uber战略&运营部门的数学科学家Wafic EI-Assi给出了七条建议,助你成为合格产品经理。

对于任何产品团队,都需要一个人来对产品生命周期的负责。换句话说,我们需要一个数据科学产品经理。而且,由于当时的组织结构有变动,我不得不暂时接盘这个职位。下面是我对如何成功地做一枚数据产品经理的理解:

译者注:

Proof of Concept,它是一套建议的电子模型,它可用于论证团队和客户的设计,允许评估和确认概念设计方案。

1.培养对机器学习的认知

我有一个朋友最近在加拿大的魁北克开始了一份工作。魁北克省是加拿大讲法语的省份,而作为一个只说英语的加拿大人,他很难适应,直到他学会了法语!你懂我的意思了吧……

作为一个数据产品,你必须能够发现机会,在哪里可以利用到机器学习。此外,你需要能够与你的数据科学家和工程师对得上话。如果你不了解如何用机器学习构建模块,你就很难与团队建立同理心。索性,在网上有无数的免费资源可以帮助你提高速度(coursera,medium,youtube……)。

2. 理解模型评估

在机器学习中,选择合适的模型评价指标以及确定最小可接受误差,是两个最具挑战性的任务。你不需要(也不可能)为手头的任务提供极高的精确度。另一方面,对于整体业务来说高错误率太话费时间人力成本。因此,你应该积极主动地学习评估指标和可接受的误差范围。例如,当机器学习产品正在替换一个已经存在的任务时,你可以使用当前的错误率作为衡量标准。总的来说,评估标准将取决于可用的数据、所使用的模型以及手头的应用程序。

3.对实验要虚心

判断机器学习产品何时可以交付是一个 具有挑战性的任务。在测试误差较低、不存在过拟合的情况下,是否应该采用模型?我们是否应该先在生产环境中使用我们的客户群样本来测试模型,然后再声明它可以供所有客户使用?答案会在时间,成本和准确性之间可能会做出权衡。事实上,机器学习的产品生命周期依赖于大量的实验,所以我的建议是你在产品路线图中加入测试的时间。

4.先考虑冷启动

因为很难确定一个机器学习产品是否可以运转,所以先考虑冷启动。冷启动在收集顾客反馈信息方面非常有用。

在B2B环境中的软启动可能与在B2C环境中非常不同。在B2B环境中,你可以用客户群的代表性样本来测试机器学习的产品。在这里,你可以与你的客户建立合作伙伴关系,在发布时请求产品反馈。另一方面,在B2C环境中,你可以进行A/B测试,验证产品是否达到预期的结果。

5.还没完事呢!

你已经制造了你的机器学习产品。干得好!然而,你还远未完成。除了传统的部署后PM职责之外,还有一些应该注意的事情。

首先,你需要一个应急计划。确保有监视和警报系统设置,当模型的性能开始下降时警告你和你的团队。如果你有一个更通用的备份模型(尽管可能不那么准确),甚至有一个基于规则的系统,可以在预测下降时部署来替代你的选择模型,这是比较理想的状态。

其次,为你的客户设定清晰的关于模型性能、错误边际和时间延迟的期望。你的SLA(服务品质协议)中还应该反映这一点。

最后,为了保持其SLA以及推广再培训模型所需的时间,你需要确定需要多少次模型再训练。

6.采取敏捷的心态,而不是具体的敏捷框架

Scrum或类似的方法在软件社区中相当流行。然而,并不是机器学习周期的所有阶段都接受定时的或t恤大小的用户故事。至少,在研究或POC阶段,大量的实验是必要的,在那个阶段采用一个限制较少的敏捷框架(如看板)可能是理想的。

除了熟悉机器学习概念和机器学习产品生命周期之外,你作为数据产品经理的角色与常规产品经理没有太大区别。你仍然需要构建一个待办事项列表,提供发布计划,开发业务案例,并充当团队与内部和外部接洽的接口。

7.最后:把大家整合在一起

如果你要从这篇文章中去掉一样东西,那就是你需要对你的数据团队中不同成员的角色和责任形成一定程度的理解和同理心。不用说,这在传统软件环境中也是如此。如果你了解你的同事们所经历的事情,你就会开始思考如何才能帮助他们成功。

相关报道:

https://towardsdatascience.com/on-being-a-data-science-product-manager-5c8baf42e0a7

Image placeholder
hughruby
未设置
  93人点赞

没有讨论,发表一下自己的看法吧

推荐文章
当前政府发展大数据产业思路分享

笔者认为大数据发展大体会经历三个阶段,一、业务的数据化;二、数据的业务化;三、业务的智能化。2018年,各地方政府包括企业通过这几年的大数据建设,基本完成了业务的数据化、和数据开放共享的第一阶段,20

平安科技数据库总经理汪洋:开源数据库在平安的应用实践

本文转自| 平安科技数据库产品团队2019年5月9日,平安科技数据库产品及存储产品部总经理在第十届数据库技术大会DTCC上分享了《开源数据库在平安的应用实践》,本文根据演讲内容整理,围绕以下几个方面进

大数据是个技术,数据库才是它最好的产品形态

星环科技(以下简称:星环)的定位是大数据基础软件公司,而非数据库公司,却在数据库方面,做的比很多数据库公司更好更猛?这是为何?“我们认为,大数据是个技术,数据库才是它最好的产品形态”,星环科技研发总监

如何用react做一个表格

如何用react做一个表格1、首先使用React.createClass方法创建一个组件;2、在render中通过React.DOM创建table、tr、tbody标签;3、在tr标签中使用map方法

如何利用Reworld做一个一键吸空投箱的效果

功能效果展示运行环境Win7,Win8,Win10Reworld版本体验版vc_redist.x64运行环境针对零基础读者的补充下载安装Reworld对应版本Reworld官网链接:http://ww

同义词搜索是如何做到的?

前面几个章节我们使用到了Lucene的中文分词器HanLPAnalyzer,它并不是Lucene自带的中文分词器。Lucene确实自带了一些中文分词器,但是效果比较弱,在生产实践中多用第三方中文分词器

TPC-C解析系列02_OceanBase如何做TPC-C测试

导语:蚂蚁金服自研数据库OceanBase登顶TPC-C引起业内广泛关注,为了更清楚的展示其中的技术细节,我们特意邀请OceanBase核心研发人员对本次测试进行技术解读,共包括五篇:1)TPC-C基

号称以客户为中心的保险行业如何做到真正的“按需”服务?

随着客户消费模式的改变和对服务要求的不断提高,当前保险行业正经历深刻变化。虽然保险行业已经积累了大量的客户数据,但由于其业务的复杂性及缺少系统的建设,大多数数据都是孤立的。而在数字化浪潮的推进下,许多

“听完你的评价,我们决定拒绝这位明天入职的技术经理”

每个工作日的中午,只要天气晴朗,我都会在午餐后去附近的公园溜达溜达,一来可以帮助肠胃消化,二来则有助于我静心思考工作总结,从而增强写作主题构思的能力。所以,我比较厌烦在这个时间段里聊工作。上周的某天,

Oracle 之利用BBED修改数据块SCN—-没有备份数据文件的数据恢复

测试环境 OS:redhat6.6 oracle:12.1.0.2  BBED(OracleBlockBrowerandEDitorTool),用来直接查看和修改数据文件数据的一个工具,是Orac

专访腾讯云数据库负责人丁奇:打造超越用户想象的产品

“就市场份额来说,腾讯云在国内还不是第一名,但从国内上云企业比例看,剩余的还有很多,因此,大家都还有机会,就看谁能真正解决用户的痛点。”                                

使用 Workerman 做一个聊天室

为什么要写这篇文章? 我学习Workerman好几次了,每次都失败(没做成想要的功能,原谅我比较笨)。但是这次也花了好几个小时,把之前没做成的功能实现了。其实就是两个简单的功能:一对一发送消息,广

直男福利!手把手教你做一只口红色号识别器,秒变李佳琦

大数据文摘编辑组出品技术实现:宁静 七夕将至,送礼时节。直男送礼,首选口红。毕竟李佳琦一句”OMG买它”,女朋友披头散发抢购,钱包就空了一半。但是,口红色号千千万,选对了牌子才成功了一半。快乐橙、伤心

软件定义IT基础架构,如何看待深信服的产品战略布局?

在很多人的潜意识里,深信服是一家令人尊敬的企业,技术支撑能力强,产品种类多,功能全面,后劲足,是少数能和华为、新华三同台竞技的企业之一。但有时候,深信服也会被这些优势所累,比如经常会被问道:你们和华为

JS 中一定要了解的数据类型和数据转换

数据类型 前言 Js中的类型只有6种,其中基本数据类型有5种分别为string,number,boolen,null,undefined,引用类型有一种,就是object,object是一个大的综合

JS 中一定要了解的数据类型和数据转换

Js数据类型 前言 Js中的类型只有6种,其中基本数据类型有5种分别为string,number,boolen,null,undefined,引用类型有一种,就是object,object是一个大的

腾讯基于全时态数据库技术的数据闪回

作者简介:李海翔,网名“那海蓝蓝”,腾讯金融云数据库技术专家。中国人民大学信息学院工程硕士企业导师。著有《数据库事务处理的艺术:事务管理和并发访问控制》、《数据库查询优化器的艺术:原理解析与SQL性能

2019数据库趋势研究:谁是最受青睐的数据库?

哪些数据库在2019年最受青睐?本文向DeveloperWeek的数百名业内人士咨询了当前NoSQL与SQL的使用情况,得到了有关MySQL、MongoDB、PostgreSQL、Redis和其他方面

2019数据库趋势研究:谁是最受青睐的数据库?

哪些数据库在2019年最受青睐?本文向DeveloperWeek的数百名业内人士咨询了当前NoSQL与SQL的使用情况,得到了有关MySQL、MongoDB、PostgreSQL、Redis和其他方面

做银行家里的数据专家:ING探索大数据时代下的金融最佳实践

大数据文摘出品记者:高延6月18-21日,O’ReillyAIConference在北京召开。大会上,来自荷兰的金融公司ING的IT主管BasGeerdink带来了《关于数字驱动企业》的主题分享。进入

巧用自动化测试组合拳保证产品质量

一、背景 我们的测试工作经历了以下四个阶段。第一阶段,产品需求评审完成,开发团队实现功能开发,然后草草提测,不写单元测试。测试人员进行人工测试,没有工具或系统做辅助,测试用例编写是在excel或脑图中

极致产品

不断打磨极致的产品,是学习猿地发展的猿动力! 教学产品定义 教学产品和我们平时能看的到、摸的着、用的上的实体产品不一样,教育产品通常理解为是围绕学习目标设计的课程内容、教学过程、学猿服务,以及教学资源

从reddit的一亿美元商业逆袭,看移动与PC产品的时代天堑

提起有“互联网头版”之称的reddit,你会联想到什么?想到这一网站上层出不穷的搞笑梗或meme图?还是程序员们经常制造出的各种有趣小发明?说起来在这个体量巨大、包容性极强、时刻制造着互联网新热点的论

从产品到解决方案,GaussDB与FusionData之我见

摘要:连接、计算和数据是ICT基础设施的三大基石,华为IT产品线副总裁、智能数据与存储领域总裁周跃峰在接受媒体采访时强调,这或许是华为在数据领域全面持续发力的原因之一。时隔不足一个月,华为连续召开两次

IT168企业存储月刊|十月多款新产品面世,上半年市场“交卷”

对于企业数据管理与存储市场而言,十月似乎是一个忙碌的月份。全球各大厂商相继发布新的产品与解决方案,为市场提供更多选择,帮助推动企业数字化升级。此外,IDC也发布了最新的市场调查报告,涉及企业级外部存储