Excel表头/字段一致的表格拼接【python语言】
需求
现有三张表格data1.csv、data2.csv和data3.csv,要求将这三张表格进行按行拼接整理成一张result.csv的表格。表格内容如下。
data1.csv
字段A | 字段B | 字段C | 字段D | 字段E |
A1 | 1 | 1 | 是 | 我 |
A2 | 2 | 0 | 否 | 是 |
A3 | 3 | 1 | 是 | 第 |
A4 | 4 | 0 | 否 | 一 |
A5 | 5 | 1 | 是 |
data2.csv
字段A | 字段B | 字段C | 字段D | 字段E |
B1 | 1 | 1 | 是 | 你 |
B2 | 2 | 0 | 否 | 是 |
B3 | 3 | 1 | 是 | 第 |
B4 | 4 | 0 | 否 | 二 |
B5 | 5 | 1 | 是 | 个 |
data3.csv
字段A | 字段B | 字段C | 字段D | 字段E |
C1 | 1 | 1 | 是 | 他 |
C2 | 2 | 0 | 否 | 是 |
C3 | 3 | 1 | 是 | 第 |
C4 | 4 | 0 | 否 | 三 |
C5 | 5 | 1 | 是 | 个 |
result.csv
字段A | 字段B | 字段C | 字段D | 字段E |
A1 | 1 | 1 | 是 | 我 |
A2 | 2 | 0 | 否 | 是 |
A3 | 3 | 1 | 是 | 第 |
A4 | 4 | 0 | 否 | 一 |
A5 | 5 | 1 | 是 | 个 |
B1 | 1 | 1 | 是 | 你 |
B2 | 2 | 0 | 否 | 是 |
B3 | 3 | 1 | 是 | 第 |
B4 | 4 | 0 | 否 | 二 |
B5 | 5 | 1 | 是 | 个 |
C1 | 1 | 1 | 是 | 他 |
C2 | 2 | 0 | 否 | 是 |
C3 | 3 | 1 | 是 | 第 |
C4 | 4 | 0 | 否 | 三 |
C5 | 5 | 1 | 是 | 个 |
准备工作
三张表格data1.csv、data2.csv和data3.csv
代码
import pandas as pd
# 读取CSV文件,指定GBK编码格式解决中文会遇到的utf-8的问题
data1 = pd.read_csv('data1.csv', encoding='GBK')
data2 = pd.read_csv('data2.csv', encoding='GBK')
data3 = pd.read_csv('data3.csv', encoding='GBK')
# 拼接表格
result = pd.concat([data1, data2.iloc[0:], data3.iloc[0:]], ignore_index=True)
# 保存结果到新的CSV文件
result.to_csv('result.csv', index=False)
# 打印结果
print("result结果输出如下:\n",result)