当前位置: 首页 > article >正文

python 利用pandas实现从CSV导出并格式化后写入.jsonl文件

你可以使用 pandas 库来读取 CSV 文件,然后通过一些格式化操作将数据转换为 JSONL 格式并写入文件。JSONL(JSON Lines)格式是一种每行一个 JSON 对象的文件格式。

下面是一个示例,演示了如何使用 pandas 读取 CSV 文件,处理数据并将其导出到 JSONL 文件中:

示例代码:

import pandas as pd
import json

# 读取CSV文件
df = pd.read_csv('data.csv')

# 打开JSONL文件,逐行写入格式化后的数据
with open('data.jsonl', 'w', encoding='utf-8') as jsonl_file:
    for index, row in df.iterrows():
        # 将每一行转换为字典
        row_dict = row.to_dict()
        # 将字典格式化为JSON字符串并写入文件
        json.dump(row_dict, jsonl_file, ensure_ascii=False)
        # 写入换行符,以便每个JSON对象占一行
        jsonl_file.write('\n')

说明:

  1. pd.read_csv():用来加载 CSV 文件到 DataFrame 中。
  2. df.iterrows():遍历 DataFrame 的每一行。iterrows() 返回的是一个包含行索引和行数据的元组。
  3. row.to_dict():将每一行数据转换为字典格式。
  4. json.dump():将字典写入文件,使用 ensure_ascii=False 来避免中文乱码。
  5. 每写入一个 JSON 对象后,通过 jsonl_file.write('\n') 添加换行符,确保每个 JSON 对象占一行。

CSV 示例:

假设你的 data.csv 文件内容如下:

name,age,city
张三,25,北京
李四,30,上海
王五,28,广州

JSONL 输出:

{"name": "张三", "age": 25, "city": "北京"}
{"name": "李四", "age": 30, "city": "上海"}
{"name": "王五", "age": 28, "city": "广州"}

这样,CSV 文件的数据就成功转换为 JSONL 格式并写入了 data.jsonl 文件中。


http://www.kler.cn/a/508751.html

相关文章:

  • AI 大爆发时代,音视频未来路在何方?
  • dockerhub上一些镜像
  • 【MySQL】复合查询+表的内外连接
  • 某讯一面,感觉问Redis的难度不是很大
  • 关于高级工程师的想法
  • 金融项目实战 05|Python实现接口自动化——登录接口
  • Redis Cluster 集群
  • 【Javascript Day8】计算机存储方式、方法定义方式、作用域、预解析、对象
  • linux手动安装mysql5.7
  • 浅谈安科瑞电能质量监测和治理产品在分布式光伏电站的应用-安科瑞 蒋静
  • element-ui制作多颜色选择器
  • Vue3响应式原理: Proxy实现解析
  • BERT详解
  • linux解压命令(可整理到CSDN)
  • 【gin】模型绑定、参数验证及文件上传go案例演示
  • w163美食推荐商城
  • unity2022以上导出到AndroidStudio后更新步骤
  • 智能学习环境(Intelligent Learning Environment,ILE)
  • 如何发现架构中的耦合(5大场景)?(第36讲)
  • G1原理—10.如何优化G1中的FGC
  • 几种矩阵内积的定义和计算
  • git使用-合并代码查看是否冲突解决冲突
  • 基于springboot+vue.js+uniapp技术开发的一套大型企业MES生产管理系统源码,支持多端管理
  • 麒麟V10系统上安装Oracle
  • Golang:报错no required module provides package github.com/xx的解决方法
  • Oracle连接数满问题解决及排查 ORA-00020:maximumnumber of processes