当前位置: 首页 > article >正文

python爬虫,使用pyppeteer异步,爬取,获得指定标签内容

获得指定

#pip install pyppeteer,使用 Pyppeteer(异步方案)
import asyncio
from pyppeteer import launch
async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto('http://xxx/#/login')
    # 等待页面加载完成
    await page.waitForSelector('div[class="el-select"]')
    # 获取 div 内容
    div_content = await page.querySelectorEval('div[class="el-select"]', 'el => el.textContent')
    print(div_content)
    await browser.close()
asyncio.get_event_loop().run_until_complete(main())
#pip install pyppeteer,使用 Pyppeteer(异步方案)
import asyncio
from pyppeteer import launch
async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto('https://www.bai.com/?tn=98010089_dg&ch=2')
    # 等待页面加载完成
    await page.waitForSelector('span[class="title-content-title"]')
    # 获取 div 内容
    div_content = await page.querySelectorEval('span[class="title-content-title"]', 'el => el.textContent')
    print(div_content)
    await browser.close()
asyncio.get_event_loop().run_until_complete(main())

在这里插入图片描述

获得全部

#pip install pyppeteer,使用 Pyppeteer(异步方案)
import asyncio
from pyppeteer import launch
async def main():
    browser = await launch()
    page = await browser.newPage()
    await page.goto('http://xxx/#/login')
    # 等待页面加载完成
    await page.waitForSelector("*")
    # 获取 div 内容
    div_content = await page.querySelectorEval('*', 'el => el.textContent')
    print(div_content)
    await browser.close()
asyncio.get_event_loop().run_until_complete(main())

http://www.kler.cn/a/282366.html

相关文章:

  • 基于视觉智能的时间序列基础模型
  • 【书生大模型实战营 闯关材料】入门岛:第4关 玩转HF/魔搭/魔乐社区
  • 【Linux】Ubuntu中muduo库的编译环境安装
  • Python爬虫项目 | 一、网易云音乐热歌榜歌曲
  • L11.【LeetCode笔记】有效的括号
  • SystemVerilog学习——构造函数new
  • 【lua实战】lua中pairs和ipairs的区别
  • 2、Spring手写系列-实现 Bean 的定义、注册、获取
  • 用于不平衡分类的 Bagging 和随机森林
  • CentOS 7更换YUM源为国内源的保姆级教程
  • 如何学习Linux性能优化?
  • chrome cookie编辑
  • servlet的过滤器filter和springmvc的拦截器Interceptor
  • 如何更改 Mac 上 Java 的默认版本?
  • 基于 INFINI Pizza 为 Hugo 静态站点添加搜索功能
  • spring clould中使用naocs热部署读取配置文件
  • Dockerfile+私有仓库
  • Leetcode Day16 定长滑动窗口
  • LuaJit分析(四)luajit 64位与32位字节码区别
  • hive-去字符串前导0
  • 先从路径优化开始学习FastPlanner之B样条曲线平滑路径(一):从拉格朗日插值到B样条曲线
  • 不同语言的转义字符
  • flutter执行Asset中的可执行文件
  • PHP $_GET 变量
  • Oceanbase 使用OBD 一键性能测试(Sysbench,TPCC,TPCH)
  • Superset 连接elasticsearch