当前位置: 首页 > article >正文

Pandas 2-读取文件

1. 读取CSV文件

CSV(Comma-Separated Values)是一种常见的文件格式,用于存储表格数据。Pandas提供了read_csv方法来读取CSV文件。

import pandas as pd  
  
# 读取CSV文件  
df = pd.read_csv('input.csv')  
print(df)  

2. 读取Excel文件

Excel文件是一种广泛使用的电子表格文件格式。Pandas提供了read_excel方法来读取Excel文件。需要注意的是,读取Excel文件需要安装openpyxlxlrd库。

pip install openpyxl  
# 读取Excel文件  
df = pd.read_excel('input.xlsx', engine='openpyxl')  
print(df)  

3. 读取JSON文件

JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。Pandas提供了read_json方法来读取JSON文件。

# 读取JSON文件  
df = pd.read_json('input.json')  
print(df)  

4. 读取SQL数据库

如果需要从SQL数据库中读取数据,Pandas提供了read_sql方法。需要安装sqlalchemy库,并确保数据库连接正常。

pip install sqlalchemy  
from sqlalchemy import create_engine  
  
# 创建数据库连接  
engine = create_engine('sqlite:///mydatabase.db')  
  
# 读取SQL数据库  
query = 'SELECT * FROM my_table'  
df = pd.read_sql(query, engine)  
print(df)  

5. 读取HTML文件

HTML文件可以用于网页展示数据。Pandas提供了read_html方法来读取HTML文件中的表格数据。

# 读取HTML文件  
dfs = pd.read_html('input.html')  
print(dfs[0])  # 假设HTML文件中只有一个表格  

http://www.kler.cn/a/289082.html

相关文章:

  • 基于java的航空机票预定管理系统
  • llama factory lora 微调 qwen2.5 7B Instruct模型
  • 机器学习【激活函数】
  • 基于 Python Django 的二手房间可视化系统分析
  • 【LeetCode】【算法】581. 最短无序连续子数组
  • react 中 useContext Hook 作用
  • CSRF 概念及防护机制
  • 3D幻想空间:Scratch中探索虚拟世界的奥秘
  • 【量化分析】Python、JavaScript(Node.js)、Java、C#和Ruby五种主流语言的实例代码给大家演示一下如何获取股票实时交易数据
  • 深入理解MySQL慢查询优化(2) -- SQL的执行流程
  • OCI编程高级篇(十八) OCI连接池概念
  • 如何打造一个成功的直播矩阵
  • 【科研新人必看】什么是期刊等级,SCI、核心期刊、省刊
  • qt6 socket 不使用代理 socket error: The proxy type is invalid for this operation
  • 8.29 C++
  • 常用Pandas操作(笔记整理)
  • 前端学习笔记-Web APIs篇-02
  • 基于机器学习的工业制造缺陷分析预测系统
  • 运动多线激光三维重建
  • 解决bug: RuntimeError: Address already in use,一个linux下pytorch多卡训练tcp端口占用的bug
  • SpringCloudGateway网关技术
  • 笔记整理—uboot番外(2)find_cmd函数
  • Selenium+Python自动化测试环境搭建
  • SAP自动化操作
  • L1-084 拯救外星人
  • Python 数据分析— Pandas 基本操作(上)