当前位置: 首页 > article >正文

使用python脚本爬取前端页面上的表格导出为Excel

前几天有前端小伙伴说后端没写导出功能,但是现在人事需要用到这个表,要导出Excel给她,那就用脚本爬一下吧,30行代码搞定。

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
电脑需要有python3环境,用解释器打开,没包的下载包,然后跑一下就行,需要注意的是,直接用的find('table') ,如果有多个table,想要爬某个表格,那就指定id去查。下课。

import requests
from bs4 import BeautifulSoup
import pandas as pd

#   获取网页内容
url = "http://127.0.0.1:53893/"
response = requests.get(url)
html_content = response.text

#  解析html 获取表格 提取表头
soup = BeautifulSoup(html_content, 'html.parser')
table = soup.find('table')

headers = []
for th in table.find_all('th'):
    headers.append(th.text.strip())

#  提取表格的行数据
rows = []
for tr in table.find_all('tr')[1:]:  # 从第二行开始,第一行是表头
    cells = tr.find_all('td')
    row = [cell.text.strip() for cell in cells]
    if row:
        rows.append(row)

df = pd.DataFrame(rows, columns=headers)

#  导出为Excel
df.to_excel('index.xlsx', index=False)

print("数据已成功导出到index.xlsx")

http://www.kler.cn/a/473217.html

相关文章:

  • 基于单片机的速度里程表设计(论文+源码)
  • 基于V2X的无人机与特种车辆战地智能通信:技术融合与实战应用
  • vue3的计算属性computed传参问题
  • Nginx:Stream模块
  • 【Python运维】利用Python实现高效的持续集成与部署(CI/CD)流程
  • 优化提示词改善答疑机器人回答质量
  • Docker 使用Dockerfile创建镜像
  • 解读若依框架中的 @Xss 注解
  • [读书日志]从零开始学习Chisel 第七篇:Scala的包和导入(敏捷硬件开发语言Chisel与数字系统设计)
  • Linux运维中常用的命令总结
  • 一文学会基于 Redis 的分布式锁实现
  • fnm教程
  • docker中使用Dockerfile设置Volume挂载点
  • 手写@MapperScan
  • 【Linux系列】如何使用 nohup 命令在后台运行脚本
  • PostgreSQL学习笔记(二):PostgreSQL基本操作
  • 算法5--位运算
  • 网络安全-kail linux 网络配置(基础篇)
  • NRF24L01模块STM32通信-发送端
  • OA系统如何做好DDOS防护