当前位置: 首页 > article >正文

8.User-Agnet代理池

在编写爬虫程序时,一般都会构建一个 User-Agent (用户代理)池,就是把多个浏览器的 UA 信息放进列表中,然后再从中随机选择。构建用户代理池,能够避免总是使用一个 UA 来访问网站,因为短时间内总使用一个 UA 高频率访问的网站,可能会引起网站的警觉,从而封杀掉 IP

自定义UA代理池

构建代理池的方法也非常简单,在Pycharm 工作目录中定义一个 ua_info.py 文件,并将以下 UA 信息以列表的形式粘贴到该文件中

ua_list = [
    'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; Maxthon 2.0',
    'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_7_0) AppleWebKit/535.11 (KHTML, like Gecko) Chrome/17.0.963.56 Safari/535.11',
    'User-Agent:Opera/9.80 (Windows NT 6.1; U; en) Presto/2.8.131 Version/11.11',
    'Mozilla/5.0 (Windows NT 6.1; rv:2.0.1) Gecko/20100101 Firefox/4.0.1',
    'Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 6.0)',
    'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-us) AppleWebKit/534.50 (KHTML, like Gecko) Version/5.1 Safari/534.50',
    'Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0',
    ' Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1',
    'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1',
    ' Mozilla/5.0 (Macintosh; Intel Mac OS X 10.6; rv:2.0.1) Gecko/20100101 Firefox/4.0.1',
]

模块随机获取UA

也可以使用专门第三方的模块来随机获取浏览器 UA 信息,不过该模块需要单独安装

pip install fake-useragent
from fake_useragent import UserAgent
# 实例化一个对象
ua = UserAgent()
# 随机获取一个ie浏览器的ua
print(ua.ie)
print(ua.ie)
# 随机获取一个火狐浏览器的ua
print(ua.firefox)
print(ua.firefox)

运行结果:

Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.1; Trident/4.0; InfoPath.2; SV1; .NET CLR 2.0.50727; WOW64)
Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0; chromeframe/13.0.782.215)
Mozilla/5.0 (Windows NT 6.3; rv:36.0) Gecko/20100101 Firefox/36.0
Mozilla/5.0 (Windows NT 6.2; Win64; x64; rv:21.0.0) Gecko/20121011 Firefox/21.0.0


http://www.kler.cn/a/505659.html

相关文章:

  • 探索 Transformer²:大语言模型自适应的新突破
  • 《鸿蒙Next平台:决策树面对噪声数据的鲁棒性逆袭》
  • 信凯科技业绩波动明显:毛利率远弱行业,资产负债率偏高
  • Docker
  • 如何解决Webview和H5缓存问题,确保每次加载最新版本的资源
  • Three.js 性能优化:打造流畅高效的3D应用
  • 链家房价数据爬虫和机器学习数据可视化预测
  • 解决 Git SSL 连接错误:OpenSSL SSL_read: SSL_ERROR_SYSCALL, errno
  • 【嵌入式——Linux】Ubuntu网络环境配置
  • 【大厂面试AI算法题中的知识点】方向涉及:ML/DL/CV/NLP/大数据...本篇介绍自动驾驶检测模型如何针对corner case 优化?
  • 个人主页搭建全流程(Nginx部署+SSL配置+DCDN加速)
  • 《鸿蒙开发-鸿蒙教程-答案之书》组件margin左和右等于没偏?
  • LeetCode第432场周赛 (前3题|多语言)
  • 如何使用插件(刷课,游戏等)
  • Sonatype Nexus OSS 构建私有docker 仓库
  • 拆分工作簿转换PDF格式文件一步到位-Excel易用宝
  • PHP深度学习探索
  • AI数字人小程序:解锁个性化智能交互体验
  • Spring WebFlux 高级实战(3-3)
  • android Recyclerview viewholder统一封装
  • Android Auto能够与Android设备整合的几项功能有哪些?
  • PostgreSQL-WAL日志介绍(二)
  • STM32-笔记43-低功耗
  • 机器学习(2):线性回归Python实现
  • npm更换淘宝镜像源
  • AI 编程工具—Cursor进阶使用 阅读开源项目