当前位置: 首页 > article >正文

Python爬虫:获取国家货币编码、货币名称

使用场景:

需要获取货币编码,并初始化到数据库。

解决方案:

import requests
from bs4 import BeautifulSoup
import pandas as pd

# 目标网页URL
url = 'http://www.cnhuilv.com/currency/'

# 发送HTTP请求获取网页内容
response = requests.get(url)
# 根据网页的编码调整
response.encoding = 'utf-8'
# 使用BeautifulSoup解析HTML
soup = BeautifulSoup(response.text, 'html.parser')
# 获取div标签数据,需要指定class名称
tbodyData = soup.find('div', class_='table-responsive rb1')
# 初始化数据列表
data = []
# 提取表格中的数据
for row in tbodyData.find_all('tr')[1:]:  # 跳过表头
    columns = row.find_all('td')
    if len(columns) > 1:
        if columns[3].text.strip() != '':
            country_name = columns[3].text.strip()
            numerical_code = columns[1].text.strip()
            currency_code = columns[0].text.strip()
            currency_name = columns[2].text.strip()

            data.append({
                '国家名称': country_name,
                '数字代码': numerical_code,
                '货币代码': currency_code,
                '货币名称': currency_name
            })
# 打印提取的数据
for item in data:
    print(item)

# 将数据转换为DataFrame
df = pd.DataFrame(data)
# 导出到Excel文件
output_path = 'C:\\Users\\Administrator\\Desktop\\货币1.xlsx'
df.to_excel(output_path, index=False)

技巧:将html文件保存到本地,使用VScode打开,可以更清晰分析数据所在的标签。


http://www.kler.cn/a/390609.html

相关文章:

  • 网页版五子棋——对战模块(服务器端开发②)
  • 简述 synchronized 和 java.util.concurrent.locks.Lock 的异同?
  • vue3+vite 前端打包不缓存配置
  • Ue5 umg学习(一)
  • Linux手动安装nginx
  • 什么是两化融合
  • 泷羽sec学习打卡-shodan扫描7
  • 多模态AI:开启人工智能的新纪元
  • 分布式技术缓存技术
  • 若依笔记(八):Docker容器化并部署到公网
  • AI 大模型重塑软件开发流程的现状与未来展望
  • 商淘云连锁企业管理五大功能 收银系统助力门店进销存同步
  • 游戏引擎学习第五天
  • Ubuntu笔记-auto remove
  • app webView调试工具
  • leetcode61. Rotate List
  • 哔哩哔哩TV1.6.6 | 基于1.6.6优化,简洁好用,支持弹幕
  • 手机屏幕上进行OCR识别方案
  • uniapp—android原生插件开发(4uniapp引用aar插件)
  • 219页华为供应链管理:市场预测SOP计划、销售预测与存货管理精要
  • tensorflow案例5--基于改进VGG16模型的马铃薯识别,准确率提升0.6%,计算量降低78.07%
  • C++ 面试问题集合
  • 2024年11月杂记
  • OceanBase 4.3.3 功能解析:列存副本
  • Docker实践与应用举例:从入门到进阶
  • 黑马Java API应用文档下载,中文版!!!!!