当前位置: 首页 > article >正文

【爬虫】web自动化和接口自动化

 专栏文章索引:爬虫

目录

一、介绍

二、推荐

1.接口自动化

2.Web自动化


一、介绍

爬虫技术一般可以分为两种类型:接口自动化和web自动化。下面是它们的简要介绍:

1.接口自动化

接口自动化技术的主要目的是通过模拟HTTP请求来实现自动化,通常用于测试web API和抓取数据。接口自动化爬虫可以直接访问数据接口获取数据,它可以通过发送规范的HTTP请求来实现数据的抓取和操作。接口自动化技术适用于需要大量抓取数据的需求,以及在抓取时对页面交互没有要求的场景。

综上所述,根据不同的需求和场景,可以选择适合自己的爬虫类型,分别应用Web自动化或接口自动化技术来进行网页数据的抓取和处理。

2.Web自动化

Web自动化技术旨在模拟人类操作浏览器来实现自动化,通常用于对网页进行操作和抓取数据。Web自动化爬虫可以通过自动化浏览器驱动,模拟人类的行为来实现数据的抓取和操作。Web自动化技术可以模拟页面操作、登陆、填表、拖拽等操作,非常适合于需要登录并模拟用户操作的网站、复杂的网页交互以及需要抓取动态网页数据的需求。

二、推荐

1.接口自动化

  • requests库

python的第三方库,目前使用比较多

2.Web自动化

  • Selenium

初学者可以先学习这个工具

  • DrissionPage

语法跟Selenium类似,由于出现的比较晚,检测还不是很严格

  • SaossionPage

DrissionPage的plus版



http://www.kler.cn/a/273937.html

相关文章:

  • 【QT-QTableView实现鼠标悬浮(hover)行高亮显示+并设置表格样式】
  • 什么是网络安全攻防演练,即红蓝对抗?
  • HTMLElement、customElements及元素拓展
  • 从零开始开发纯血鸿蒙应用之实现起始页
  • 嵌入式ARM平台 openwrt系统下 基于FFmpeg 的视频采集及推流 实践
  • 【信息系统项目管理师】第15章:项目风险管理过程详解
  • 【c++】string类---标准库(STL)中的string类
  • duckdb如何使用extension以及直接连接数据库
  • IonQ最新研究突破!引入光量子纠缠以构建量子计算网络
  • UG NX二次开发(C#)-通过控制点创建样条曲线(UF_CURVE_create_spline )
  • XR虚拟拍摄助力短剧制作:探索未来影视新纪元
  • 敏捷开发——elementUI/Vue使用/服务器部署
  • 邮箱验证码api接口申请流程?有哪些条件?
  • 网络安全防御策略
  • 面向对象程序设计c++有什么合适的习题吗?
  • Python爬虫案例-爬取主题图片(可以选择自己喜欢的主题)
  • 为什么技术人员副业赚钱那么难?
  • 官网有没有用?就这个问题,我曾经鼓舞数个建站老铁。
  • SpringBoot+Vue项目(后端项目搭建 + 添加家居)
  • 深入浅出:数据库的世界 - 介绍、分类、作用与特点
  • LabVIEW湍流等离子体束热效率优化
  • C++ 内存泄露调试技巧
  • android adb 实时画面 和操作
  • 单例模式的两种方法:饥汉模式和懒汉模式
  • Typecho博客网站底部添加网站已运行时间教程
  • 使用 @JsonIgnore注解后 获取不到参数值问题