发布于2019-08-07 09:49 阅读(906) 评论(0) 点赞(5) 收藏(0)
BeautifulSoup相关概念总结
:https://www.cnblogs.com/pythonywy/p/11134481.html
css基础以及选择器基础
:https://www.cnblogs.com/pythonywy/p/11266221.html
css选择器进阶
:https://www.cnblogs.com/pythonywy/p/11276513.html
解析页面
提取元素
主要有4大元素
元素操作
使用
re_lxml.find('css选择器')
重点
只选择第一个出现的
使用
re_lxml.select('css选择器')
重点
会把满足CSS选择器所有内容都显示出来,输出为列表的形式
使用
re_lxml.标签名.标签名而不是用css选择器
重点
只选择第一个出现的
会把满足CSS选择器所有内容都显示出来,输出为列表的形式
但是有几个优点
使用多个指定名字的参数可以同时过滤tag的多个属性
rp_lxml.find_all('属性1','属性2')
要某个标签不要其中某个属性
rp_lxml.find_all('标签名',class_='属性')
定义一个字典参数来搜索包含特殊属性的tag
rp_lxml.find_all(attrs={'属性名':'属性值'})
tap.标签p.['属性名']:标签内标签p的指定属性属性
tap.get('属性名'):标签的指定属性对应的内容
tap.标签p.get('属性名'):标签内标签p的指定属性属性
NavigableString.string即可获取标签内部的文字
他是一种特殊的Tap所有tap可以的操作他都可以
rp_lxml.attrs为{}
rp_lxml.name为[document]
剩下的可以去尝试不过个人感觉没啥意义
我觉得吧一个可以用用就是判断他是不是这个数据类型
print(type(未知对象.string))看他是不是comment对象
作者:雪儿
链接:https://www.pythonheidong.com/blog/article/9528/da4066fd30c78b46a0ef/
来源:python黑洞网
任何形式的转载都请注明出处,如有侵权 一经发现 必将追究其法律责任
昵称:
评论内容:(最多支持255个字符)
---无人问津也好,技不如人也罢,你都要试着安静下来,去做自己该做的事,而不是让内心的烦躁、焦虑,坏掉你本来就不多的热情和定力
Copyright © 2018-2021 python黑洞网 All Rights Reserved 版权所有,并保留所有权利。 京ICP备18063182号-1
投诉与举报,广告合作请联系vgs_info@163.com或QQ3083709327
免责声明:网站文章均由用户上传,仅供读者学习交流使用,禁止用做商业用途。若文章涉及色情,反动,侵权等违法信息,请向我们举报,一经核实我们会立即删除!