当前位置:网站首页 > 更多 > 编程开发 > 正文

[Python] 国内高匿免费代理 爬虫代码

作者:CC下载站 日期:2021-11-27 00:00:00 浏览:66 分类:编程开发

只爬了ip

import requests
import parsel
import base64
import re

res = requests.get('http://ip.yqie.com/proxygaoni/index.htm')
res.encoding = 'utf-8'
for i in parsel.Selector(res.text).xpath("//tr/td[2]").extract():
    print(base64.b64decode(re.findall(f'window\.atob\("(.*?)"\)', i)[0]).decode())

新增一个lxml的xpath版本

import base64
import re

import requests
from lxml import etree

res = requests.get('http://ip.yqie.com/proxygaoni/index.htm')
res.encoding = 'utf-8'
for i in etree.HTML(res.text).xpath('//tr/td[2]/script'):
    print(base64.b64decode(re.findall(f'window\.atob\("(.*?)"\)', i.text)[0]).decode())

您需要 登录账户 后才能发表评论

取消回复欢迎 发表评论:

关灯