本站消息

站长简介/公众号


站长简介:高级软件工程师,曾在阿里云,每日优鲜从事全栈开发工作,利用周末时间开发出本站,欢迎关注我的微信公众号:程序员总部,程序员的家,探索程序员的人生之路!分享IT最新技术,关注行业最新动向,让你永不落伍。了解同行们的工资,生活工作中的酸甜苦辣,谋求程序员的最终出路!

  价值13000svip视频教程,python大神匠心打造,零基础python开发工程师视频教程全套,基础+进阶+项目实战,包含课件和源码

  出租广告位,需要合作请联系站长

+关注
已关注

分类  

暂无分类

标签  

暂无标签

日期归档  

暂无数据

python scrapy xpath text() 使用 <b /> 提取文本失败

发布于2021-12-02 03:16     阅读(810)     评论(0)     点赞(0)     收藏(0)



我正在使用scrapy shell并尝试获取以下元素的文本部分

<div class="CCCCC">AAA<br />BBB<br />CCC<br />DDD</div>

通过使用

response.xpath('//div [@class="CCCCC"]')[0].extract()

我得到了一个包含标签的整个元素,

<div class="CCCCC">AAA<br>BBB<br>CCC<br>DDD</div>

但使用

response.xpath('//div [@class="CCCCC"]/text()')[0].extract()

我只是'AAA',而不是'AAA<br>BBB<br>CCC<br>DDD'我的预期。

text() 的行为是否正确?


解决方案


行为是正确的。

response.xpath('//div [@class="CCCCC"]/text()')

[AAA, BBB, CCC, DDD]作为列表提供,但您的代码是

response.xpath('//div [@class="CCCCC"]/text()')[0].extract()

请注意,您询问with第一个元素[0]这就是为什么你只得到AAA.

如果您删除 ,[0]您将拥有所有四个元素。







所属网站分类: 技术文章 > 问答

作者:黑洞官方问答小能手

链接:https://www.pythonheidong.com/blog/article/1107001/917a095e506748c06ec5/

来源:python黑洞网

任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任

0 0
收藏该文
已收藏

评论内容:(最多支持255个字符)