当前位置:网站首页 > 更多 > 编程开发 > 正文

[Python] python爬虫之xpath的基本使用

作者:CC下载站 日期:2020-02-23 00:00:00 浏览:70 分类:编程开发

要先将源码etree

html=requests.get(=url=headers).text
html=etree.HTML(html)
html=etree.tostring(html=).decode()
html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()')

或将html.text转换为选择器对象

importparsel

html=parsel.Selector(html_str)
url=html.xpath('//div').extract()


您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯