Python数据分析实战 | 爬遍拉勾网,带你看看数据分析师还吃香吗?

微信公众号:「Python读财」
如有问题或建议,请公众号留言

伴随着移动互联网的飞速发展,越来越多用户被互联网连接在一起,用户所积累下来的数据越来越多,市场对数据方面人才的需求也越来越大,由此也带火了如数据分析、数据挖掘、算法等职业,而作为其中入门门槛相对较低、工资高于大多传统行业岗位的数据分析一职,则成为了许多想转行进入数据领域的同学的首要选择。

那么在现在的互联网寒冬下,数据分析岗位是什么行情呢?不同城市对该岗位的需求又是怎样的?岗位的具体薪资状况咋样?有哪些工作要求?大公司和小公司在招聘职位的要求上有什么特点?带着这些疑惑,我爬取了拉勾网上一些主要城市的数据分析岗位信息,带你看看互联网寒冬下,数据分析岗位的市场现状。

各城市对数据分析岗位的需求量

image

从招聘信息的所在地来看,对数据分析师岗位需求量较大的是四个一线城市,其中北京上海分别位列前两位。除了北上广深和杭州外,其他热门城市的需求并不大,所以,如果你想找数据分析相关的工作,最好还是去一线城市寻找相应的机会。

不同细分领域对数据分析岗的需求量

国内大数据行业发展得如火如荼,几乎在各行各业都能见到数据分析的身影,那哪些领域对数据分析岗位的需求较大呢?

image

对岗位信息按照不同领域进行分类统计后发现,电商金融数据服务这三个领域的需求量位列前三位,电商和金融领域的需求远远超过其他领域。其他领域如消费生活、企业服务和文娱业也有不少的机会。

各城市数据分析岗位的薪资状况

不论是应届毕业生还是考虑转行的同学,在选择一个行业时,行业的钱途是一个很重要的参考因素。那么现在数据分析这个岗位的薪水是个什么水平呢?我们按不同的城市进行了统计。

image

图中柱状图上的黑条(暂且取这么个名字)统计学上叫做置信区间,代表着95%的职位所对应的薪水在黑条的区间范围内。我们可以发现在数据分析这个岗位上,北京上海杭州深圳处于第一梯队,月均薪水都超过了20k,苏州、南京、广州以及武汉位列第二梯队,月均薪水在15k左右,其他城市则处于第三梯队。其中令我比较好奇的是广州的平均薪水,作为四大一线城市之一,虽然生活成本比其他一线城市略低,但均薪却被其他三个兄弟甩了一截。

带着好奇心,我绘制了四个一线城市的薪资分布图,看看四大一线城市数据分析岗位薪资的具体分布。

image

从四大一线城市的薪资分布来看,深圳和上海的分布较为接近,广州大部分职位的薪水在10k左右,分布和其他三个城市差异较大。那会不会是因为广州的招聘信息中,工作经验要求低的岗位占比较高而拉低了整体的薪资水平呢?(假设越资深的数据分析师工资会越高)

城市、工作经验与薪水的关系

带着上面的疑惑,我绘制了热力图进行进一步的分析,图中的空白部分表示该部分是缺失值。由于北上广深杭的样本较为充足,这里主要针对这五个 城市的热力图部分进行分析。(由于工作经验小于1年和大于10年的样本太小,故没有绘入其中。)

image

从横向对比来看,可以明显的看出,随着资历的增加,数据分析师的薪水也会相应提高。对有3-5年经验的数据分析师,若符合企业的招聘条件,在北上广深杭基本平均而言都能拿到20k及以上的薪水。纵向对比来看,广州在各个经 验段上的薪资均不及其他三个一线城市,而且差距还不小。所以,广州给的钱确实少(但还应该结合生活成本进行综合考虑)。

技能要求和技能与薪水的关系

看了上面的15k和20k,甚至30k、40k,不知道你是否有心跳加速的感觉,不管有没有,咱还得回到现实,看看数据分析岗都有技能要求。

image

如图中所示, 要求会Python/R的公司占到60.8%,和SQL的60.7%相接近。有33.1%的公司要求会Excel,要求会Tableau的公司仅占9.5%。这说明,Python/R和SQL已成为超六成公司的必备技能。

那是不是技能要求越高所对应的薪水就越高呢?为了得到相应的结论,我们把技能从低到高分为Excel、SQL、Python/R,并将公司要求的技能取技能最高的那个来表示(如同时要求Python/R、SQL、Excel,则取Python/R,若要求SQL、Excel,则取SQL),绘制了如下的箱型图。

image

从这个对比图来看,要求会Python/R和要求会SQL所对应的薪资中位数均为20k,会Python/R并没有比会SQL在薪资上更有优势,但仅要求会Excel的岗位对应的薪资则明显低于前两者。因此,从数据的角度来看,想往数据分析方向走的话,技能方面可以先把SQL掌握了(SQL入门简单但精通并不容易的)。

学历要求   

image

其实可以看到,数据分析这个岗位对学历的要求并不是很高,绝大部分岗位的要求都是本科即可。

不同规模公司的用人需求差异 

小公司好还是大公司好?大公司又有哪些要求?为了进一步分析,我们将公司规模、经验要求以及薪资信息绘制到散点图上,一探究竟。

image

image

对小公司(50人及以下)而言,大部分公司开出的薪资不会超过30k,规模更大的公司开的起更高的薪水,即便是对于一些工作经验不到1年的数据分析师,规模稍大的公司也能开出20k-30k的薪水,所以如果从面向工资编程的角度看,大公司具有较为明显的优势。

另一方面,从图中可以看到,当薪水超过30k时,公司对数据分析师的经验要求大多都是3-5年以及5-10年,此时经验成为了较大的门槛。接下来看看大公司在技能方面的要求,这里定义2000人以上的公司为大公司。

image

除去一些没有具体技能要求的岗位信息,对大公司(2000人以上)中有具体技能要求的职位而言,约76%的职位要求掌握Python/R,仅要求会SQL的职位占比不到20%,所以,如果想进大公司的话,还是得把Python/R学好。

 总结       

  1. 对数据分析师有较大需求的主要还是一线城市,且主要集中于电商金融和数据服务领域。
  2. 从薪水上看,北、上、深、杭处于薪资第一梯队,广州作为一线城市在薪资上并无优势。
  3. 工作要求方面,学历上数据分析岗位对学历的要求并不高,超过八成岗位仅要求本科学历即可;技能上超过六成的公司要求会Python/R和SQL, 对大公司而言,大约76%的职位要求掌握Python/R。
  4. 对薪水超过30k的职位,经验是一个较大的门槛。

注:为了提升阅读体验,没有展示相关代码,有兴趣的同学可以在微信公众号「Python读财」后台回复关键词【拉钩】获取完整代码以及相应的数据,动手练起来!
公众号二维码.jpg

Image placeholder
zhouqi
未设置
  57人点赞

没有讨论,发表一下自己的看法吧

推荐文章
最适合入门的Python数据分析实战项目

微信公众号:「Python读财」如有问题或建议,请公众号留言伴随着移动互联网的飞速发展,越来越多用户被互联网连接在一起,用户所积累下来的数据越来越多,市场对数据方面人才的需求也越来越大,由此也带火了如

流畅的Python读书笔记 --- 第一章 Python数据模型

近期开始读“流畅的Python”这本书,想把自己的读书笔记分享给大家,希望能帮到也对这本书感兴趣但是没时间看的各位。(文章中大部分的话和图片摘录总结自“流畅的Python”一书,以及python官方网

AB test | 数据分析师面试必知 !

前言关于ABtest的重要性无需多言,数据、产品等从业人员几乎必知,好的数据科学家我想一定是知道理解业务比模型更为重要,而ABtest就是伴随着业务增长的利器。如果你心中的ABtest几乎都没有用到中

基于 Spark 的数据分析实践

转载本文需注明出处:微信公众号EAWorld,违者必究。引言:Spark是在借鉴了MapReduce之上发展而来的,继承了其分布式并行计算的优点并改进了MapReduce明显的缺陷。Spark主要包含

python数据类型

1.string字符串类型 字符串是通过单引号、双引号或三引号进行定义的; 单、双引号定义字符串不能随意换行,需要在换行时指明换行符; 字符串中的引号可以互相嵌套,但不能嵌套自己(例如不能再单引号中

Python 教程-了解Python

什么是Python Python能干什么? 有什么特点? 什么是Python 官方介绍: Python是一个易于学习、功能强大的编程语言。它拥有高效高级的数据结构和一种简单有效的面向对象编程的

Python 教程-Python 安装

在Windows上安装 访问https://www.python.org/downloads/并下载最新版本。在撰写时当前最新是3.8。在安装的时候和其他软件一样,无脑式下一步。需要注意的是如果在W

Python入门教程_2. 使用 Python 解释器

2.1.调用解释器 Python解释器通常安装在目标机器上的/usr/local/bin/python3.7目录下;把/usr/local/bin目录放进你的Unixshell的搜索路径里,确保它可以

Python入门教程_3. Python 简介

在下面的例子中,输入和输出分别由大于号和句号提示符(>>>和...)标注:如果想重现这些例子,就要在解释器的提示符后,输入(提示符后面的)那些不包含提示符的代码行。需要注意的是在练习中遇到的从属提示符

Python入门教程_4. 深入 Python 流程控制

除了刚刚介绍的while语句,Python还有一些在其他语言中常见的控制流语句,并做了一些改动。 4.1.if语句 也许最著名的语句是if语句了。 例如: >>>x=int(input("Please

【python测试开发栈】帮你总结python random模块高频使用方法

随机数据在平时写python脚本时会经常被用到,比如随机生成0和1来控制逻辑、或者从列表中随机选择一个元素(其实抽奖程序也类似,就是从公司所有人中随机选择中奖用户)等等。这篇文章,就帮大家整理在pyt

【python测试开发栈】帮你总结python time模块高频使用方法

在平时写python脚本时,时间是我们经常用到的数据,比如:时间戳、前端展示的对应格式的时间等,在python中主要有三个和时间处理相关的模块:time、datetime、calendar,这篇文章主

MySQL 数据库操作:创建和查看数据库

数据库是数据的集合。MySQL允许我们高效地存储和检索数据库中的数据。在MySQL中,我们可以使用CREATEDATABASE语句创建数据库。但是,如果数据库已经存在,则会引发错误。为了避免该错误,我

jquery怎么遍历json数组?

jquery怎么遍历json数组?jquery遍历集合可以使用$.each(集合,回调函数)方法,//这里直接使用Array来构造json数组,服务器返回的数据可以使用JSON.parse()函数进行

Python分析42年高考数据,告诉你高考为什么这么难?

大数据文摘授权转载自数据森麟作者:徐麟对于已经工作的“上班族”来说,6月7号到9号三天无疑是兴奋到飞起的,终于迎来了令人愉悦的端午假期。然而有那么一群人,将在端午节日之际迎来人生特别重要的一次经历或者

数据分析利器之Pandas

Pandas是一个python的开源库,它基于Numpy,提供了多种高性能且易于使用的数据结构。Pandas最初被用作金融数据分析工具而开发,由于它有着强大的功能,目前广泛应用于数据分析、机器学习以及

如何避免人类偏见对数据分析产生影响

随着越来越多的企业开始采用机器学习技术以实现流程的自动化,人们也逐渐开始质疑计算机决策中的伦理含义。我们如何处理计算机系统中潜在的偏见?相对较少被提及但同样重要的,是人类本身的偏见,它与分析和商业决策

实现人工智能落地 你还差一个“数据分析流水线”的距离

在智慧生产场景,生产制造商可以在生产线上利用深度学习,尤其是图像识别,将产品的质量检测自动化。比如自动检测产品表面有没有划伤、有没有零部件的缺失、有没有标签的错位。研究表明,相比人工检测,智慧检测可以

调查:2019年数据分析市场面临的挑战有哪些?

分析和数据科学行业对人才的需求急剧增长,为该行业求职者提供了很多工作机会。无论是500强还是初创企业,每个团队都在使用分析来从数据中获得有价值的信息。然而,在人才、客户定位和收集数据等方面,这个行业仍

零基础的小白怎么学习数据分析?

微信公众号:「Python读财」如有问题或建议,请公众号留言作为一个从超级菜鸟阶段过来的人,也曾迷茫,也曾面对一大堆资料不知所措,从无到有踩过太多的坑,在这里分享一下我总结出来的数据分析学习路径,为了

Pandas数据分析——超好用的Groupby详解

微信公众号:「Python读财」如有问题或建议,请公众号留言在日常的数据分析中,经常需要将数据根据某个(多个)字段划分为不同的群体(group)进行分析,如电商领域将全国的总销售额根据省份进行划分,分

超8千Star,火遍Github的Python反直觉案例集!

大数据文摘授权转载作者:SatwikKansal译者:暮晨Python,是一个设计优美的解释型高级语言,它提供了很多能让程序员感到舒适的功能特性。但有的时候,Python的一些输出结果对于初学者来说似

面向回家编程!GitHub标星两万的”Python抢票教程”,我们先帮你跑了一遍

盼望着,盼望着,春节的脚步近了,然而,每年到这个时候,最难的,莫过于一张回家的火车票。据悉,今年春运期间,全国铁路发送旅客人次同比将增长8.0%。达到4.4亿人次,2020年铁路春运自1月10日开始,

核心业务“瘦身”进行时!手把手带你搭建海量数据实时处理架构

01背景 在线交易服务平台目的是减轻核心系统计算压力和核心性能负荷压力,通过该平台可以将核心系统的交易数据实时捕获、实时计算加工、计算结果保存于SequoiaDB中。并能实时的为用户提供在线交易查询服

python set (集合)数据结构

set(集合)是一个非常有用的数据结构。它与列表(list)的行为类似,区别在于set不能包含重复的值。这在很多情况下非常有用。例如你可能想检查列表中是否包含重复的元素,你有两个选择,第一个需要使用f