+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

2019-08(47)

2019-09(90)

2019-10(13)

2019-11(9)

2019-12(19)

Python爬虫实战简单分析知乎用户粉丝

发布于2020-08-30 11:07     阅读(764)     评论(0)     点赞(27)     收藏(5)


0

1

2

3

4

5

6

7

开发工具

**Python版本:**3.6.4

相关模块:

pyecharts模块;

requests模块;

jieba模块;

fake_useragent模块;

以及一些Python自带的模块。

相关文件

关注微信公众号:python工程狮,回复:“知乎粉丝

环境搭建

安装Python并添加到环境变量,pip安装需要的相关模块即可。

额外说明:

pyecharts模块安装时请依次执行以下命令:

pip install echarts-countries-pypkg

pip install echarts-china-provinces-pypkg

pip install echarts-china-cities-pypkg

pip install pyecharts

原理简介

感觉很多爬过知乎的人应该都知道,知乎有三个常用的API接口,如下图所示:

image

因为是随便玩玩的,所以本文只用了第三个接口来获取指定用户的粉丝信息,信息包括用户昵称、标题、性别、回答问题的数量等。然后再利用pyecharts等库对数据进行简单的可视化分析。

顺便提一下,那些号称用python爬了几十万知乎用户信息的,用的大多都是这三个接口+Scrapy框架。以后有时间我也来过把瘾试一试。T_T

That’s all.

完整源代码请自行参考相关文件。

结果展示

爬虫部分:

修改下图中的用户为需要爬取的用户:

image

在cmd窗口运行**“Zhihu_Spider.py”**文件即可。

注意,这里的用户指代url_token,比如:

image

运行截图:

image

数据分析:

粉丝男女比例:

image

image

粉丝昵称词云:

image

粉丝标题词云:

image

粉丝的粉丝:

image

image

粉丝的回答数量:

image

That’s all.

0

1

2

3

4

5

6



所属网站分类: 技术文章 > 博客

作者:dfh8374

链接: https://www.pythonheidong.com/blog/article/498492/0e14162953e3bd24e52f/

来源: python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

27 0
收藏该文
已收藏

评论内容:(最多支持255个字符)