程序员最近都爱上了这个网站  程序员们快来瞅瞅吧!  it98k网:it98k.com

本站消息

站长简介/公众号

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

如何获取组中的元素?Python

发布于2022-09-16 13:37     阅读(1252)     评论(0)     点赞(13)     收藏(3)


我需要获取列表中每个元素的 href,我该怎么做?在 bs4 上

<div class="group">

<a href="link1" target="_blank" rel="rel" class="class">
    <h1>"test"</h1>
</a>
    <a href="link2" target="_blank" rel="rel" class="class">
        <h1>"test2"</h1>
    </a>
<a href="link3" target="_blank" rel="rel" class="class">
    <h1>"test3"</h1>
</a>            </div>

解决方案


选择<div>with 类组并迭代其<a>例如 withcss selectorslist comprehension

[x['href'] for x in soup.select('div.group a')]

例子

from bs4 import BeautifulSoup

html = '''
<div class="group">
<a href="link1" target="_blank" rel="rel" class="class">
    <h1>"test"</h1>
</a>
    <a href="link2" target="_blank" rel="rel" class="class">
        <h1>"test2"</h1>
    </a>
<a href="link3" target="_blank" rel="rel" class="class">
    <h1>"test3"</h1>
</a>
</div>
'''
soup = BeautifulSoup(html)

[x['href'] for x in soup.select('div.group a')]

输出

['link1', 'link2', 'link3']


所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:https://www.pythonheidong.com/blog/article/1742893/b0c853db49e6f4462a8b/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

13 0
收藏该文
已收藏

评论内容:(最多支持255个字符)