伯乐在线面向对象真是个非常好的平台,上面有很多美丽的姑娘,但是姑娘们都青睐什么样的小伙大家都知道吗?下面我跟着大家试着来挖掘其中的奥秘;

  1. 首先通过python + beautifulsoup抓取姑娘们的最低要求与特殊要求;
  2. 将所有要求以标点符号分割加入list;
  3. 通过算法找出高频要求(通过apriori找出描述中高频关联项目,再通过朴素贝叶斯算法将所有描述分组计数)
  4. 使用flask+echarts生成字符云

github: https://github.com/huzuohuyou/JobboleGirls/

最后的效果

http://i1.piimg.com/567571/f0d9ba38653e5d63.jpg

github图床

7 6 收藏


直接登录
最新评论