浅对boss直聘上广州的数据分析岗位发布情况进行分析

本文通过Boss直聘数据,分析广州各区域数据分析岗位的数量、薪资水平,以及公司对学历和经验的要求。数据清洗使用TableauPrepBuilder,结果显示天河区需求最大,但荔湾和海珠区薪资上限平均值较高。主要技能需求包括SQL、Excel和Python。大部分岗位倾向本科及以上学历,1-3年和3-5年经验者更受欢迎。
摘要由CSDN通过智能技术生成

1.项目背景

马上就要出去实习了,想对广州各个区数据分析岗位做一个了解,看看自己成为一名数据分析师还需要学习哪些技能还有了解广州各区数据分析岗位薪资如何。

2.研究问题

(1)广州哪个区的数据分析岗位招的最多?

(2)广州各个区的薪资最低是多少?

(3)公司招人需要应聘者具备哪些技能?

(4)公司招人他们的学历和工作经验是怎样的?

目录

一. 数据采集

二. 数据清理

三. 数据可视化及分析

一. 数据采集

这里我们通过采集器对boss直聘网进行数据的采集

首先,我们在网上打开boss直聘,在里面搜索数据分析,然后复制网址到采集器里。

爬出我们想要的数据后我们点击“开始采集”即可,这里总共采集了三百条数据,对应得上网页里的数据(网页中boss直聘里每页有30条,一共10页)

数据采集完成后我们把数据导出即可。

 我们看看导出后的数据,在这里我们把不需要的字段进行删除,比如标题链接,缩略图。然后再将列名称进行修改。

 修改完之后是这样的,完成这一步后我们就可以进行数据清洗了。

二. 数据清洗

这里我用到的工具是tableau prep builder

打开tableau prep builder,然后点击“连接到数据”,选择Microsoft Excel,导入我们的数据。

 

 导入数据后,按如图的步骤依次点击

我们先对薪资范围进行清洗,我们可以看到【薪资范围】里的数据是不统一的,这里我们要把它们进行拆分然后创建一个计算字段来统一它们的格式,我们把它们统一为按月发放多少K。

第一步:拆分

我们把后面的13薪,15薪,16薪什么的单独拆分出来。

选中薪资范围,右击选择“拆分值”选里面的自定义拆分。

 里面的内容按照如图,点击“拆分即可”

拆分完以后是这样的,这里我们把他们改一下名方便后续操作。

然后我们再吧把【薪资范围待清洗】里面的数据再进行拆分,把/后面的字拆开,操作如下:

然后得到下面两个字段,这里圈起来的部分我们把它命名为月,双击即可命名,因为除了按天发放工资那么剩下的就是按月发放了。然后再重新命名这两个字段,分别为【薪资范围待清洗2】和【发放频率】。

接下来我们再把【薪资范围待清洗2】里面的薪资单位取出来,点击创建计算字段,把计算1改为“薪资单位”,然后在里面写RIGHT([薪资范围待清洗2],1),代码的意思是得到【薪资范围待清洗】右边的第一个字。

拆分完后是这样的,然后我们再把【薪资范围待清洗2】进行拆分,这次我们按-来进行拆分,拆分完后把新拆出的两个字段分别命名为【薪资下限待清洗】和【薪资上限待清洗】。

 搞完之后 我们点击【薪资上限待清洗】旁边的这三个小点,选中“清理”点击移除字母。

 这样我们就把【薪资上限待清洗】里面的字母和文字清理干净了,然后我们就可以创建计算字段来处理薪资下限和上限的问题,由前面的数据我们知道,有些公司它的薪资是按每小时多少元发的有些则是按月发的,我们需要做的是把它们统一改为按月发多少K。

在此之前我们要把【薪资下限待清洗】和【薪资上限待清洗】转为整数,点击左上角的“Abc”,再点击“数字(整数)”即可

 

 创建计算字段,名为薪资下限,里面的代码为:

IF [发放频率] = "月" AND [薪资单位] = "K" THEN [薪资下限待清洗]
ELSEIF [发放频率] = "月" AND [薪资单位] = "元" THEN [薪资下限待清洗] / 1000
ELSEIF [发放频率] = "天" AND [薪资单位] = "K" THEN [薪资下限待清洗] * 30
ELSEIF [发放频率] = "天" AND [薪资单位] = "元" THEN [薪资下限待清洗] *30 / 1000
ELSE -1000000000 END

代码的含义是:

  • 如果“发放频率”为“月”,且“薪资单位”为“K”(千元),则将“薪资下限待清洗”的值直接作为结果输出。
  • 如果“发放频率”为“月”,且“薪资单位”为“元”,则将“薪资下限待清洗”除以1000,将单位转换为千元后输出。
  • 如果“发放频率”为“天”,且“薪资单位”为“K”(千元),则将“薪资下限待清洗”乘以30,将发放周期转换为月后输出。
  • 如果“发放频率”为“天”,且“薪资单位”为“元”,则先将“薪资下限待清洗”乘以30,再将结果除以1000,将单位转换为千元后输出。
  • 如果以上条件均不满足,则输出-1000000000

代码写好之后点击保存即可,然后再创建一个计算字段,名为【薪资上限】里面的代码也是差不多的,不过要修改一下,把里面的[薪资下限待清洗]改为[薪资上限待清洗]。

 搞好之后就是这样

 我们来确认一下,第一行数据是150-250/元每天,那么150*30就是4.5K的薪资下限,上限就是250*30也就是7.5K,对应得上我们刚刚创建的计算字段的结果,完全没毛病。

 然后我们再把之前拆分出来没用的删除,只留下下面的字段,然后再把这些字段排到你想要的位置。

 接下来,我们再把【经验要求】和【学历要求】里面的内容进行分组,如图,按住“Ctrl”选中下面五个(选完后就可以松开Ctrl了),然后在“经验不限”这里右键点击“将值分组”即可,【学历要求】也是一样的操作。

 分完之后就是这样的。

 然后我们看到【融资情况】和【公司规模】,这里我们看到【公司规模】里的null值都落在了【融资情况】里,这里我们要做一个字段偏移。

 创建计算字段,如下,点击保存。

 这样在【公司规模新】里就没用空值了,然后把【公司规模】删除即可。

 到这里,数据的清洗就完成了,将清洗后的数据导出即可。操作如下:

在输出类型选择我们要的xlsx文件

 

 然后在工作表里填上sheet1,并点击创建新工作表

 点击浏览,把你最后输出的文件放到你想要的位置上即可,最后点击“运行流程”就可以了.

 

三. 数据可视化及分析

这里我用的是tableau进行数据可视化的,作图的过程就不细说了,不会的可以看b站上面tableau的教程非常简单。

1.

 分析:我们可以明确地看到在广州各个区薪资上限平均值最高的是荔湾区,其次是海珠区,而薪资下限平均值最高的是海珠区,其次是荔湾区。这里很多人会问为什么薪资下限和上限平均值最高不是天河区,原因是天河区招聘的人数太多的,工资高的低的都有,所以平均薪资就没那么多了。

2.

分析:我们可以知道在广州,数据分析这个岗位70%要的都是本科生,其次是大专16.7%,硕士5.0%。

3.

 分析:我们知道,广州的天河区对数据分析这个岗位的需求是最大的,达到37.4%,毕竟天河区是广州最繁华的社区了,所以我们投简历的时候可以多往天河区投。

4.

 分析:我们可以知道,数据分析岗位你得具备sql,excel,python等技术才有优势,这是绝大数公司招聘条件,目前想成为数据分析师但还没方向的同学可以参考。

 5.

 分析:可以看到,在各个区里经验要求在1-3年,3-5年有超过一半以上。

Corsini217
关注 关注
  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
28 | Boss数据分析
微信号:RunsenLiu
08-11 1167
根据统计,在boss聘上爬取的岗位的学历要求,以本科为主,但是不同岗位的比例不同。在我看来,学历要求占比,可能在某种程度上反应了,当前社会上的学历占比,我们发现本科生还是占大多数的,所以本科毕业就就业的压力还是很大的,更体现了,如果有能力读研还是要继续深造的好,毕竟硕士只有百分之10的占比。需要根据岗位名称提取出对应的岗位类别,并且将工资的单位变成“元”,并且将最低工资,最高工资分开,如果类似一年14薪这种,需要将每个月的工资乘相对应的比例,换算成一年12薪,方便我们计算(虽然税钱会增高)。
毕业设计(Boss岗位数据分析
06-18
​ 该项目一共分为三个子任务完成,数据采集—数据预处理—数据分析/可视化。 ​ 爬取 Boss聘热门城市岗位数据,并将数据以 CSV 文件格式进行保存。如下图所示: 爬取到的数据出现了大量的脏数据和高耦合的数据。我们需要对这些脏数据进行清洗与预处理后才能正常使用。最后使用 python + sql 脚本的方式对数据进行多维度分析,并使用 Pyecharts 工具进行数据可视化。整个分析可视化通过轻量化 WEB 框架 Flask 来进行部署。
BOSS聘Python相关招聘岗位数据可视化
04-22
BOSS聘Python相关招聘岗位数据可视化
基于Python大数据BOSS招聘数据分析可视化 毕业设计-附源码70434
最新发布
yuyuxun的博客
08-24 1671
该平台以BOSS聘等主流招聘平台为数据源,利用Python编程语言及其相关库如Pandas、Matplotlib和Seaborn等,对招聘数据进行采集、清洗、分析可视化。首先,通过网络爬虫技术获取招聘网站上的各类招聘信息,并进行数据清洗和预处理,以确保数据质量。其次,利用Pandas库对数据进行结构化处理和分析,包括数据的统计描述、聚合和转换等。
Boss 数据岗招聘信息分析(二)
Earl
09-08 2177
项目背景 上一篇爬取Boss数据数据后,我们可以试着对这些数据进行分析并整理一些结论出来。我们的大致步骤如下: 清洗整理 确定分析目的与思路 进行数据分析 得出数据分析结论 分析思路 数据岗位基本就业情况:学历要求、工作经验要求、工作技能要求、薪资待遇、公司福利 学历要求:饼状图,学历要求的占比 工作经验要求:饼状图 工作技能要求:词云 薪资待遇:条形图 公司福利:词云,降序 工作经...
Python数据可视化分析项目(boss数据可视化分析
Abtxr的博客
06-05 3164
python数据分析大作业(django+爬虫+前端+数据库+数据分析+模型预测)
毕业设计(Boss岗位数据分析)python实现源码.zip
10-08
毕业设计(Boss岗位数据分析)python实现源码.zip 基于python对网页数据的爬取,进而分析数据得到数据,并对数据进行可视化。 毕业设计(Boss岗位数据分析)python实现源码.zip 基于python对网页数据的...
基于Python和Selenium的BOSS聘Python岗位数据分析系统的设计与实现.docx
10-26
本文主要探讨了基于Python和Selenium的BOSS聘Python岗位数据分析系统的设计与实现,旨在通过自动化工具收集和分析BOSS聘上的Python职位信息,为求职者和企业提供有价值的参考。 第一章介绍了研究背景,指出在...
项目来源:选用boss聘网站的数据分析职位的招聘数据
10-07
项目来源:选用boss聘网站的数据分析职位的招聘数据 数据结果总结 通过以上分析,可以发现,如果要成功进入数据分析行业,应该往北上广深行这几个城市考虑,这些城市的薪资水平高。 而行业方面应该着眼于互联网及...
Boss岗位数据爬虫分析可视化.zip
03-01
爬虫(Web Crawler)是一种自动化程序,用于从互联网上收集信息。其主要功能是访问网页、提取数据并存储,以便后续分析或展示。爬虫通常由搜索引擎、数据挖掘工具、监测系统等应用于网络数据抓取的场景。 爬虫的...
Hive数据仓库之boss聘平台薪资数据分析
08-14
本项目“Hive数据仓库之boss聘平台薪资数据分析”聚焦于利用Hive对boss聘平台的薪资数据进行深入洞察,以揭示职场薪资的分布规律、行业差异以及职位之间的关联性。 首先,我们要了解Hive的核心概念。Hive是建立...
编写Spark程序对Boss聘网站数据分析
huangkeqin123的博客
11-16 294
原本数据是城市的,后面我自定义了一个findObjectPRovince函数,重写call方法的时候我再里面调用了写好的类FromCityToProvince,这个类可以根据城市判断出是哪个省份。然后我上百度查了查,说是我运行环境的JDK版本与编译时的JDK版本不匹配,我立即去看了jdk版本,是1.8的版本,版本是没错,后来我上百度查了好久,依然没有解决。可以看出本学历为本科和大专的占比是挺高的。这里原本的数据是由学历以外的字符串的,我这里就接使用filter过滤掉,方便后面的统计。
BOSS聘上数据分析岗位的薪资分析
机器学习、深度学习、文本分类、异常检测、风控等知识的积累和分享
12-25 1715
昨天-2023年12月24日抽空爬取了一下BOSS聘上base北京的数据分析岗位的相关数据,本文简单分析拿给大家做参考,该说不说、在现在的大环境下数据分析薪资还是高的呀。 在PC端上打开BOSS聘网页搜索数据分析,只会显示10页岗位(每页30条),所以我按照工作经验要求对应届生、 1年以内、 1-3年、 3-5年、 5-10年、 10年以上分别爬了10页数据,总共1800条。
数据分析职位需求分析报告-数据来源于Boss聘网站
m0_38057720的博客
06-06 3687
数据分析职位需求分析报告-数据来源于Boss聘网站1.背景2.目的3.数据说明4.具体内容4.1 学历分析4.2 工作地点分析4.3 经验分析4.4 技能分析4.5 公司规模4.6 工资分析5.结论 1.背景         目前,越来越多的人涌入到数据分析领域的相关工作中。然而,数据分析工作的职位待遇参差不齐,月薪...
爬取boss聘“数据分析”工作
qq_34764206的博客
02-18 5983
爬取boss数据1 1、背景:面临工作,需要数据支持,看到各大数据源(天池、和鲸社区…),萌生一种自己爬取数据分析工作的信息,将数分融入进找工作的环节中,利用数据分析分析当前数据分析就业环境,就业前景,以及提高找工作的效率。 2、使用工具:python3.10,sublimeText3 3、工作任务: A:获取数据 B:保存数据 C:清理数据集 4、开始任务: 4.1 安装python3,sublimeText3环境,安装所需pip插件和类库 4.2 新建boss.py文件 #!/usr/bin/e
计算机毕业设计:python招聘数据爬取分析可视化系统(BOSS聘)+Django框架(源码+文档+全套讲解视频)
十多年程序猿资深互联网人,目前专注于Python/Java/大数据项目解决方案制定,提供各行业各编程语言的全套开发服务,喜爱code,喜爱分享,生命不止,编码不息!
12-03 1899
计算机毕业设计:python招聘数据爬取分析可视化系统(BOSS聘)+Django框架(源码+文档+全套讲解视频)
基于Django的boss数据分析可视化系统的设计与实现
weixin_49081159的博客
08-16 968
随着互联网的发展,在线招聘平台逐渐成为求职者与企业之间的重要桥梁。Boss聘作为国内领先的招聘平台,以其独特的聊模式和高效的匹配算法,吸引了大量的用户。然而,随着平台用户的增长,海量的招聘数据带来了诸多分析与处理的挑战。如何通过有效的数据分析可视化手段,从这些数据中提取有价值的信息,已经成为当前亟待解决的问题。Django作为一个高效、灵活的Web开发框架,因其强大的数据库管理功能和便捷的模块化设计,成为构建数据分析可视化系统的理想选择。
BOSS 数据分析及薪资预测系统
csbysj2020
01-08 1013
BOSS 数据分析及薪资预测系统是一个旨在为求职者和企业提供全面、准确的职位信息和薪资预测的人才市场数据分析平台。通过对 BOSS 聘网站上的招聘信息进行数据采集、处理和分析,该系统能够帮助用户更好地了解市场需求、制定求职计划,并为企业提供准确的人才需求分析,为人才招聘提供参考。BOSS 数据分析及薪资预测系统是一个基于 Python Django、Echarts 等技术栈开发的人才市场数据分析平台。
BOSS招聘中数据分析岗位分析
qq_42863025的博客
07-10 1669
data=data[data['职位'].str.contains('数据分析',na=True)&~data['职位'].str.contains('兼职',na=True)&~data['职位'].str.contains('实习',na=True)]#筛选数据分析且不包含兼职的岗位。data['s_mean']=(data['s_max']+data['s_min'])/2#计算平均薪资。data['s_min']=data['薪资'].str.extract('(\d+)')#取出最低薪资。
写文章

热门文章

  • 网易云评论进行LDA主题模型分析 3497
  • 【记搭建云端数据库过程】 2801
  • 浅对boss直聘上广州的数据分析岗位发布情况进行分析 1356

最新评论

  • 【记搭建云端数据库过程】

    joybo1: 你好,看这个能学会吗?

  • 【记搭建云端数据库过程】

    socialbutterfly: 哪个视频啊

  • 网易云评论进行LDA主题模型分析

    weixin_57118268: 想问问为什么分完词之后的数据会变少呢?我原来有1048576条数据,分完词变成1044480条了

  • 【记搭建云端数据库过程】

    想去看海..: orders表导入有错的话,将订单id,用户id类型改为bigint

  • 【记搭建云端数据库过程】

    weixin_46845018: 可是我现在连接云端数据库连接不上。

大家在看

  • Verilog:参数(parameter)的使用
  • (八千字心得笔记)零基础C语言入门第三课——scanf函数和printf函数详解
  • ESP8266学习记录 340
  • ros中的cpp和py运行 132
  • 三周精通FastAPI:9 声明请求示例数据

最新文章

  • 网易云评论进行LDA主题模型分析
  • 【记搭建云端数据库过程】
2023年3篇

目录

目录

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

玻璃钢生产厂家东莞玻璃钢造型雕塑深圳市园林雕塑艺术玻璃钢丹阳商场中秋美陈马鞍山雕塑玻璃钢玻璃钢花盆适合种花吗代理山羊玻璃钢雕塑玻璃钢喷水大象头雕塑无锡玻璃钢雕塑设计价位圣诞新年商场美陈方案品牌玻璃钢雕塑销售电话玻璃钢大象头雕塑柳州仿铜玻璃钢雕塑定做绍兴商场美陈现价商场外部美陈摆设贵州玻璃钢青椒雕塑云南房地产水景玻璃钢卡通雕塑广东大型商场美陈销售公司临沧市玻璃钢雕塑设计如何兰州玻璃钢雕塑制作的公司长沙不锈钢牛玻璃钢彩绘雕塑德州玻璃钢广场雕塑舟山佛像玻璃钢雕塑哪家便宜江苏商城艺术玻璃钢雕塑工厂安徽花钵玻璃钢雕塑定做定西广场玻璃钢雕塑多少钱深圳泡沫玻璃钢雕塑哪家专业学校玻璃钢雕塑订做价格山东商场美陈价钱虎门销烟玻璃钢雕塑广东艺术商场美陈销售企业香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡 多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克 外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤 司机系学生315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人?张立群任西安交通大学校长杨倩无缘巴黎奥运“重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街 黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身!外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长 师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒 投喂者赔24万房客欠租失踪 房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫:哈马斯三号人物被杀测试车高速逃费 小米:已补缴老人退休金被冒领16年 金额超20万

玻璃钢生产厂家 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化