当前位置: 首页 > article >正文

python selenium 爬虫入门备忘

在Linux上使用Python Selenium和GoogleDriver进行自动化测试或网页爬取时,需要安装和配置几个关键组件。以下是详细的介绍和步骤:
安装Google Chrome浏览器我用的版本是96.0.4664.45-1 :
可以使用包管理工具如yum。

https://download.csdn.net/download/cheng_ji/90085155 可以在这里下载浏览器和驱动,已经为大家打包好了。

下载解压后安装
在CentOS上可以使用以下命令安装:

yum install google-chrome-stable-96.0.4664.45-1.x86_64.rpm

解压安装ChromeDriver:

unzip chromedriver_linux64\(1\).zip 
mv chromedriver /usr/bin/
chmod +x /usr/bin/chromedriver
chromedriver --version


ChromeDriver是用于与Google Chrome交互的驱动程序,必须安装。

安装Selenium:
使用pip安装Selenium库:pip3 install selenium
配置环境变量:
确保ChromeDriver的路径被添加到系统的PATH环境变量中,以便Selenium可以找到它。
编写Python代码:
示例代码和相关配置如下:

options = webdriver.ChromeOptions()
options.add_argument('-headless')
options.add_argument("--remote-debugging-port=9222")
options.add_argument("--no-sandbox")
options.add_argument("--disable-setuid-sandbox")
options.add_argument("--disable-dev-shm-using")
options.add_argument("--disable-extensions")
options.add_argument("--disable-gpu")
options.add_argument("start-maximized")
options.add_argument("disable-infobars")
driver = webdriver.Chrome(options=options)


这些步骤涵盖了在Linux上部署Selenium,安装Google Chrome和ChromeDriver的基本过程。具体的安装命令和配置可能根据不同的Linux发行版和系统环境略有差异。参考文章提供了更详细的步骤和示例,可以进一步查阅。


http://www.kler.cn/a/427566.html

相关文章:

  • [高阶数据结构七]跳表的深度剖析
  • C# 设计模式--建造者模式 (Builder Pattern)
  • 深度解析 Ansible:核心组件、配置、Playbook 全流程与 YAML 奥秘(上)
  • [C++]构造函数和析构函数
  • 如何“安装Android SDK“?
  • 华为问界M9 [电气架构] 信息梳理
  • 专题02-7-5 打印菱形图案
  • Brocade 7840 Extension 交换机
  • 一文了解MySQL写缓冲Change Buffer(定义 作用 执行过程 触发时机 业务场景)
  • Elasticsearch scroll 之滚动查询
  • Spring Cloud Alibaba 之 “Sentinel”
  • 21. C++STL 7(8000字详解list及其迭代器的模拟实现)
  • python实现AES加解密功能
  • Reactive-Resume - AI 驱动的简历匹配分析工具
  • 药剂学试卷
  • LeetCode279. 完全平方数(2024冬季每日一题 27)
  • 【Rive】混合动画
  • STM32进阶 定时器4 高级定时器 + 高级定时器实验输出有限个周期的PWM波
  • 01、SpirngMVC快速入门
  • 四十一:掩码及其所针对的代理污染攻击