美漂数据科学家年薪多少?爬了6年H1B签证数据发现,招的人多了,但钱少了

大数据文摘出品

来源:medium

编译:张睿毅、曹培信

自2012年起,一直被称为“最性感的工作”的数据科学家职位,吸引了大批远渡重洋到达硅谷,做着“数据梦”的留学生们。

但他们也付出了不菲的前期投入,除了时间精力,要拿到一个数据科学相关学位并顺利留在硅谷大厂,学费生活费培训费少说要几十万。

那么,顺利留在美国的数据科学家们,一年究竟能赚多少钱呢?

一位名叫Tony Yiu的数据科学家就想统计一下,在美国做数据分析师,到底收入如何?

Tony统计收入的方式很特别,不是用招聘数据,而是通过美国H1B(美国最主要的工作签证),作为公开的工资数据,进行了一个数据分析。他爬取了2014年到2019年6年的H1签证的职位和工资数据,想要了解一下,在美国工作的外籍数据科学家的年薪究竟怎么样。

下面文摘菌就带大家一起看看,去美国当数据科学家一年能赚多少钱!

数据来源

首先,分析数据来源于h1bdata网站上的工资数据,该网站为劳工部(DOL)的劳动条件申请(LCA)数据的编制索引。基本上,当公司打算雇用需要H1B签证的员工时,他们需要在提交H1B签证申请之前向DOL提交LCA。此LCA包含公司、薪水和职位名称等公开数据。

数据链接:

https://h1bdata.info/index.php

我只搜索了美国西海岸的区域,因为我生活在那里:

  • 旧金山湾区(旧金山,圣何塞,库比蒂诺,帕洛阿尔托等)
  • 西雅图(包括Redmond for Microsoft)
  • 奥斯汀
  • 洛杉矶(包括圣莫尼卡)

此外,我将此分析仅关注于数据科学家。因此,这种分析不包括更高阶的数据科学职位,如高级数据科学家或员工数据科学家,也不包括数据分析师。

最后,请注意这是与H1B相关的薪资数据,因此,我用于分析的薪资数据不包括美国公民的收入。

由于我没有看到任何相反的证据,我将假设美国公民数据科学家和持有绿卡的数据科学家的数据遵循都与H1B数据大体是相同的。项目Github链接:

https://github.com/yiuhyuk/ds_salary_h1b

数据爬完了,话不多说,直接上分析结果。

年薪中位数稳定在12w美元

数据科学家年收入中位数(美元)从2014年到2019年,数据科学家的年薪中位数为120,000美元。正如上图所示,当我们逐年分析时,年薪中位数趋势相当平稳,且稳定在120,000美元左右。但是,这个中位数只是基本工资,不包括现金奖励,股权和福利。因此,数据科学家的总薪酬中位数很可能更高。

招聘人数逐年递增

在过去的5年中,在美国从事数据科学工作的人数大幅增加。2019年刚到8月,人数也已经超过2018年的2/3。

每年入职的数据科学家数量(H1B)数据科学现在绝对是一个时髦的专业,我个人认为,过去几年雇用的数据科学家的上升也反映了另一个因素——很多公司都试图紧跟大数据和AI浪潮。

因此,这些以前称为决策分析或研究的公司的团队正在重新命名为数据科学,包括几年前曾被称为研究分析师的角色现在也被称为数据科学家。这并没有什么不妥,所以数据科学家的头衔没有什么神圣之处,如果你能够应用量化数据来帮助你的企业做出更好的决策,那么你就是一名数据科学从业者!

图片来源:Pexels

相比去年,今年数据科学家的薪水降了

但并非所有数据科学工作都是相同的。A公司的数据科学家可能将80%的时间花在SQL上,而B公司的数据科学家则花费一整天的时间在Python中实现机器学习算法。

数据科学家的工作范围如此之广,也可能是数据科学家工资表现出如此高差异的原因之一(其他明显的原因是工作经验、地点、公司的平均薪酬水平以及员工学位)。

通过直方图来看看薪水的分布情况。由于薪水分布在不同年份比较相近,因此在下面的直方图中绘制了所有5年的数据。两条黑线显示下四分位数($102,600)和上四分位数($135,475)的薪水,红线显示中位数($120,000)。

数据科学薪资直方图

可以用箱形图来比较年薪的工资分布:

数据科学家年度薪资的箱形图

作为参考,在2015年,工资四分位数值为:

  • 下四分位数:十万美元
  • 中位数:十一万五千美元
  • 上四分位数:十三万美元

现在为2019年,同样的四分位数值为:

  • 下四分位数:十万美元
  • 中位数:十二万美元
  • 上四分位数:十三万五千美元

所以工资确实有所上升,但并不明显。此外,截至本文撰写时,2019年数据科学家的工资与2018年相比有所下降。但是同为数据科学家,最高薪水和最低薪水的差却着实不小,而且有增大的趋势,2015年最高年薪和最大年薪相差将近95,000美元,到2019年这个差值达到了135,000美元。

最大方的金主是哪家?沃尔玛比苹果给钱多

那么去哪里做数据科学家能赚大钱?下图是按公司从最高到最低排名的数据科学家薪酬表(按中位数)。在此图表中,只包括在聘请了10位或更多数据科学家的公司,所以如果只雇用一位孤独的数据科学家的公司,即使这个人一年赚了20万美元,也不会统计在内。

数据显示,AirBnB、Lyft、Facebook、Apple都有着超过135,000美元的年薪。出人意料的是,Ancestry是给数据科学家开的年薪也很高,同时没想到的是沃尔玛,原来超低价不意味着工资超低。

各大公司数据科学家薪酬表下图中绘制的是数据科学家(提交H1B申请较多的企业)的大雇主的名单。正如预期的那样,顶尖公司会雇佣更多的数据科学家。

然而令人意外的是谷歌,谷歌在雇主数据库中显示没有太多的数据科学家,原因可能是Google使用的职位头衔不同。

相关报道:

https://towardsdatascience.com/how-much-do-data-scientists-make-cbd7ec2b458

Image placeholder
candy3721
未设置
  92人点赞

没有讨论,发表一下自己的看法吧

推荐文章
你的公司是需要数据科学家还是数据工程师?差别有点大

越来越多的企业关注AI,企业组织也意识到拥有相关人才和技能非常重要。特别是最近对AI、机器学习(ML)、非ML预测分析和“大数据”的应用,使得数据科学家的需求有了显著的增长,未来还将继续。事实上,对数

数据科学家的高级能力:“讲故事”

在不算太遥远的过去,业界对数据科学家的评判主要依据于他们发现、理解、管理和综合信息的能力。随着数据环境的不断发展和计算能力的不断提高,编码技能变得越来越重要。随着时间的推移,又出现了更加细致入微的技能

【系列】股份制银行在职员工有多少?其中研发又有多少人?

本篇为系列文章第一篇,下一篇, 2018年,股份制银行在IT方面都花了多少钱,做了哪些事?摘要:虽然做过些与银行相关选题,比如《四大行、股份制银行、城商行都在使用什么数据库?》《银行数据库选型之秘》《

那些“中漂”的欧洲科学家们

大数据文摘出品来源:Sciencemag编译:武帅、刘俊寰就近几年的科技发展水平来看,中国已逐步向科技大国迈进,这在提升中国在全球的科研影响力之余,也在一定程度上改变了全球科学人才流动背后的格局。比如

数据科学在信任与安全领域的7个典型用例

什么是信任和安全?它们在当前世界中扮演什么角色?我们经常在许多网站和平台上遇到“信任与安全”这个词。它被要求规范访客和平台之间的交互,以此促使用户的权益得到保障。从电子商务网站到社交网络,都需要防止欺

数据科学领域的核心技能和新兴技能分别有哪些?

近年来随着大数据的迅速发展,各种各样的数据分析技能也逐渐大热,为了找到数据科学领域目前最常用的技能和未来最流行的应用趋势,我们进行了一项调查。我们确定了数据科学技能的两个主要类别:一个是大多数受访者拥

零基础学习Swift中的数据科学

概述Swift正迅速成为数据科学中最强大、最有效的语言之一Swift与Python非常相似,所以你会发现2种语言的转换非常平滑我们将介绍Swift的基础知识,并学习如何使用该语言构建你的第一个数据科学

数据科学在市场营销领域的8个最佳用例

在这篇文章中,我们将介绍一些数据科学在营销领域的关键用例。就数据科学的关键目标是将数据转化为可操作的洞察而言,为了获得更高的盈利,营销领域不能忽略这些洞察的应用。大数据技术,为在营销中更好地了解目标受

你公司所拥有的数据,真正被使用的有多少?

如今,很多公司的领导者基本都可以认定一个事实:你的公司有很多数据。但有一个非常重要问题是,任何组织内部,可能都会有大量数据从来没有被收集、处理或使用过,当然造成这种现象的原因有很多。我们可以把这些数据

中国移动智能硬件质量报告解读 分布式路由市场你了解多少?

今年6月份,中国移动终端实验室发布了《中国移动2019年智能硬件质量报告》(第一期),并于近日对该报告进行了相关解读,同时对优秀智能硬件产品进行颁奖。根据介绍,本次报告在内容上主要包括手机产品综合评测

吊打面试官!MySQL灵魂100问,你能答出多少?

推荐阅读:面试机会不等人,资料看精不看多!史上最全Java技术资料合集!2019年中总结,400道一线大厂高频精选面试题合集(JVM+Spring+RabbitMQ+Mybatis+Redis+分布式

css怎么解决h1不独占一行?

css怎么解决h1不独占一行?H标签默认都是独占一行的。当它们不独占一行时,可能有以下原因:设置了display为inline或inline-block设置了父级元素display为flex,并且fl

耗时6年生成代码1.6亿行,农业银行大数据平台打造攻略!

摘要: 耗时6年,135个项目,8000页需求,累计投入11000多人月,生成的代码行1.6亿行,支持了8大业务领域,33条业务线,120多个应用场景,这就是中国农业银行大数据平台。近日,中国人民银行

MySQL是怎么保证数据一致性的

在《写数据库同时发mq消息事务一致性的一种解决方案》一文的方案中把分布式事务巧妙转成了数据库事务。我们都知道关系型数据库事务能保证数据一致性,那数据库到底是怎么设计事务这一特性的呢?一、MySQL事务

如何在复杂的后端系统中保证数据库安全?

以技术为中心的时代,信息至关重要。数据库及其安全性已成为每个企业极具挑战性的任务。数据库可以包含关键信息,例如个人身份、信用卡信息、金融交易以及应用程序密码,这些都是对黑客和网络犯罪分子有价值的信息。

首日精彩 DTCC大会见证数据库领域十年变迁!

【ITPUB独家报道】2019年5月8日-10日,第十届中国数据库技术大会(DTCC2019)在北京新云南皇冠假日酒店隆重召开。作为国内顶级的数据领域技术盛会,本次大会以“数据风云十年变迁”为主

单点登录系统原理与实现,图文并茂,附源码

本原文:整理自互联网一、单系统登录机制1、http无状态协议web应用采用browser/server架构,http作为通信协议。http是无状态协议,浏览器的每一次请求,服务器会独立处理,不与之前或

死磕Synchronized底层实现,面试你还怕什么?

关于 synchronized 的底层实现,网上有很多文章了。但是很多文章要么作者根本没看代码,仅仅是根据网上其他文章总结、照搬而成,难免有些错误;要么很多点都是一笔带过,对于为什么这样实现没有一个说

走近科学,探究阿里闲鱼团队通过数据提升Flutter体验的真相

背景闲鱼客户端的Flutter页面已经服务上亿级用户,因此用户体验尤其重要,完善Flutter性能稳定性监控体系,以便及早发现线上性能问题,也可以作为用户体验提升的衡量标准。那么Flutter的性能到

InnoDB到底支不支持哈希索引,为啥不同的人说的不一样?

继续回答水友提问(最近问MySQL的多):沈老师,我在网上看到不同的资料,有的说InnoDB支持哈希索引,有的说不支持,到底哪个是正确的呢?对于InnoDB的哈希索引,确切的应该这么说:(1)Inno

贫民窟的人工智能

大数据文摘出品编译:Jiaxu、小七、夏雅薇26岁的单身母亲Brenda住在非洲最大的贫民窟基贝拉,这也是全球最贫困的社区之一。每天早上,Brenda从家离开,乘坐公共汽车前往内罗毕东部,和她的100

DBA跳槽应该去大公司还是小公司?99%的人这样说…

职场生涯总会面临着选择,尤其对我们这些IT人来说,跳槽的频率应该是所有行业中相当大的了。那么我们跳来跳去,究竟该选择什么样的公司?大or小。 工作三年多了,经历一大一小,最近也面试了不少家公司,形态各

丰巢刷脸取件被小学生破解,号称3D、深度学习加持的人脸识别究竟靠谱吗?

大数据文摘出品作者:曹培信经费不够,2D来凑?前些天,丰巢智能快递柜被“小学生”用打印照片破解,让人大跌眼镜。据《人民日报》报道,嘉兴上外秀洲外国语学校402班科学小队向都市快报《好奇实验室》报料:他

甜过初恋!浙大博士用200个西瓜130页论文,教你用机器学习科学挑瓜

大数据文摘出品作者:易琬玉刚刚送走了最热七月,转眼就迎来了最热八月。2019年是人类有气象纪录以来最热的几个年份之一,虽然这个夏天还没结束,但气象学家们已经有十足把握做出这个判断。为了应付热,人们想出

Google 出品的 Java 编码规范,强烈推荐,既权威又科学!

这份文档是GoogleJava编程风格规范的完整定义。当且仅当一个Java源文件符合此文档中的规则,我们才认为它符合Google的Java编程风格。与其它的编程风格指南一样,这里所讨论的不仅仅是编码格