Pandas 1- 创建文件
1. 创建DataFrame
首先,需要创建一个DataFrame。DataFrame是Pandas中最常用的数据结构,类似于一个二维表格或SQL表。
import pandas as pd
# 创建一个简单的DataFrame
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David'],
'Age': [24, 27, 22, 32],
'City': ['New York', 'Los Angeles', 'Chicago', 'Houston']
}
df = pd.DataFrame(data)
print(df)
输出:
Name Age City
0 Alice 24 New York
1 Bob 27 Los Angeles
2 Charlie 22 Chicago
3 David 32 Houston
2. 保存DataFrame为CSV文件
CSV(Comma-Separated Values)是一种常见的文件格式,用于存储表格数据。Pandas提供了to_csv
方法来将DataFrame保存为CSV文件。
# 保存为CSV文件
df.to_csv('output.csv', index=False)
3. 保存DataFrame为Excel文件
Excel文件是一种广泛使用的电子表格文件格式。Pandas提供了to_excel
方法来将DataFrame保存为Excel文件。需要注意的是,保存为Excel文件需要安装openpyxl
或xlsxwriter
库。
pip install openpyxl
# 保存为Excel文件
df.to_excel('output.xlsx', index=False, engine='openpyxl')
4. 保存DataFrame为JSON文件
JSON(JavaScript Object Notation)是一种轻量级的数据交换格式。Pandas提供了to_json
方法来将DataFrame保存为JSON文件。
# 保存为JSON文件
df.to_json('output.json', orient='records')
5. 保存DataFrame为HTML文件
HTML文件可以用于网页展示数据。Pandas提供了to_html
方法来将DataFrame保存为HTML文件。
# 保存为HTML文件
df.to_html('output.html', index=False)
6. 保存DataFrame为SQL数据库
如果需要将数据保存到SQL数据库中,Pandas提供了to_sql
方法。需要安装sqlalchemy
库,并确保数据库连接正常。
pip install sqlalchemy
from sqlalchemy import create_engine
# 创建数据库连接
engine = create_engine('sqlite:///mydatabase.db')
# 保存为SQL数据库
df.to_sql('my_table', engine, if_exists='replace', index=False)