本站消息

站长简介/公众号


站长简介:逗比程序员,理工宅男,前每日优鲜python全栈开发工程师,利用周末时间开发出本站,欢迎关注我的微信公众号:幽默盒子,一个专注于搞笑,分享快乐的公众号

  价值13000svip视频教程,python大神匠心打造,零基础python开发工程师视频教程全套,基础+进阶+项目实战,包含课件和源码

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

使用 python 和 BeautifulSoup 从网页中检索链接 [关闭]

发布于2021-07-21 19:11     阅读(1013)     评论(0)     点赞(14)     收藏(3)



如何使用Python检索网页链接并复制链接的url地址?


解决方案


这是使用 BeautifulSoup 中的 SoupStrainer 类的简短片段:

import httplib2
from bs4 import BeautifulSoup, SoupStrainer

http = httplib2.Http()
status, response = http.request('http://www.nytimes.com')

for link in BeautifulSoup(response, parse_only=SoupStrainer('a')):
    if link.has_attr('href'):
        print(link['href'])

BeautifulSoup 的文档其实很不错,涵盖了很多典型场景:

https://www.crummy.com/software/BeautifulSoup/bs4/doc/

编辑:请注意,我使用了 SoupStrainer 类,因为它的效率更高(内存和速度方面),如果您事先知道要解析的内容。






所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:https://www.pythonheidong.com/blog/article/1003332/06c112215fc74d4e5f6a/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

14 0
收藏该文
已收藏

评论内容:(最多支持255个字符)