python 求职 Top10 城市,来看看是否有你所在的城市

前言

从智联招聘爬取相关信息后,我们关心的是如何对内容进行分析,获取用用的信息。

本次以上篇文章“5分钟掌握智联招聘网站爬取并保存到MongoDB数据库”中爬取的数据为基础,分析关键词为“python”的爬取数据的情况,获取包括全国python招聘数量Top10的城市列表以及其他相关信息。

一、主要分析步骤

  • 数据读取
  • 数据整理
  • 对职位数量在全国主要城市的分布情况进行分析
  • 对全国范围内的职位月薪情况进行分析
  • 对该职位招聘岗位要求描述进行词云图分析,获取频率最高的关键字
  • 选取两个城市,分别分析月薪分布情况以及招聘要求的词云图分析

二、具体分析过程

1 读取数据

结果如图1所示:

2 数据整理

2.1 将str格式的日期变为 datatime

2.2 筛选月薪格式为“XXXX-XXXX”的信息

2.3 分割月薪字段,分别获取月薪的下限值和上限值

运行结果如图2所示:

  • 将数据信息按职位月薪进行排序

  • 判断爬取的数据是否有重复值

  • 从上述结果可看出,数据是没有重复的。

3 对全国范围内的职位进行分析

3.1 主要城市的招聘职位数量分布情况

  • 对结果进行绘图:

运行结果如下述饼图所示:

3.2 月薪分布情况(全国)

运行结果如下述图所示:

不考虑部分极值后,分析月薪分布情况

运行结果如下述图所示:

3.3 相关技能要求

对获取到的职位招聘要求进行词云图分析,代码如下:

得到结果如下:

4 北京

4.1 月薪分布情况

参考全国分析时的代码,月薪分布情况图如下:

4.2 相关技能要求

词云图如下:

5 长沙

5.1 月薪分布情况

参考全国分析时的代码,月薪分布情况图如下:

5.2 相关技能要求

词云图如下:

1 12 收藏 3 评论

相关文章

可能感兴趣的话题直接登录
最新评论
跳到底部
返回顶部