当前位置: 首页 > article >正文

使用Python和Neo4j驱动程序来实现小规模数据的CSV导入

要将CSV数据导入到Neo4j数据库中,你可以使用Neo4j提供的工具,比如neo4j-admin import命令(适用于大规模数据导入),或者使用Python的Neo4j驱动程序通过Cypher查询逐行插入数据(适用于小规模数据导入)。

下面我将介绍如何使用Python和Neo4j驱动程序来实现小规模数据的CSV导入。

步骤1:安装Neo4j驱动程序

首先,你需要安装Neo4j的Python驱动程序。你可以使用pip来安装:

pip install neo4j

步骤2:准备CSV文件

假设你有一个名为data.csv的CSV文件,内容如下:

id,name,age,friend_id
1,Alice,30,2
2,Bob,25,1
3,Charlie,35,4
4,David,28,3

步骤3:编写Python脚本

以下是一个Python脚本示例,它将读取CSV文件并将数据导入到Neo4j数据库中:

import csv
from neo4j import GraphDatabase

# Neo4j连接配置
uri = "bolt://localhost:7687"  # Neo4j数据库地址
user = "neo4j"                 # Neo4j用户名
password = "your_password"     # Neo4j密码

# 创建Neo4j驱动程序实例
driver = GraphDatabase.driver(uri, auth=(user, password))

# 读取CSV文件并创建节点和关系
def import_csv(file_path):
    with open(file_path, mode='r', newline='', encoding='utf-8') as csvfile:
        csvreader = csv.DictReader(csvfile)
        with driver.session() as session:
            for row in csvreader:
                person_id = row['id']
                person_name = row['name']
                person_age = row['age']
                friend_id = row['friend_id']
                
                # 创建Person节点
                create_person_query = (
                    "MERGE (p:Person {id: $person_id}) "
                    "SET p.name = $person_name, p.age = $person_age"
                )
                session.run(create_person_query, person_id=person_id, person_name=person_name, person_age=person_age)
                
                # 创建Friend关系
                if friend_id:
                    create_friend_query = (
                        "MATCH (p:Person {id: $person_id}), (f:Person {id: $friend_id}) "
                        "MERGE (p)-[:FRIEND]->(f)"
                    )
                    session.run(create_friend_query, person_id=person_id, friend_id=friend_id)

# 调用函数导入CSV数据
import_csv('data.csv')

# 关闭驱动程序
driver.close()

解释

  1. 连接到Neo4j数据库:使用GraphDatabase.driver创建Neo4j驱动程序实例,并提供数据库地址和认证信息。
  2. 读取CSV文件:使用Python内置的csv模块读取CSV文件。
  3. 创建节点和关系
    • 使用MERGE命令确保节点唯一性。如果节点不存在,则创建它;如果存在,则更新其属性。
    • 使用MATCHMERGE命令创建关系。如果关系不存在,则创建它。
  4. 关闭驱动程序:完成数据导入后,关闭驱动程序以释放资源。

注意事项

  • 确保Neo4j数据库正在运行,并且可以通过提供的URI访问。
  • 根据你的CSV文件内容和需求调整Cypher查询。
  • 对于大规模数据导入,建议使用neo4j-admin import工具,因为它比逐行插入更高效。

这样,你就可以使用Python脚本将CSV数据导入到Neo4j数据库中了。


http://www.kler.cn/a/500823.html

相关文章:

  • 2025年第三届“华数杯”国际赛A题解题思路与代码(Python版)
  • Linux 内核中的 netif_start_queue 函数:启动网络接口发送队列的关键
  • [程序设计]—代理模式
  • 深入Android架构(从线程到AIDL)_22 IPC的Proxy-Stub设计模式04
  • GPT大模型下,如何实现网络自主防御
  • Python对接GitHub:详细操作指南
  • Docker与微服务实战2-基础篇
  • 【人工智能语音识别】——深入详解人工智能语音信号处理:理解语音信号的特征提取与表示
  • hive3后创建表默认是外部表问题
  • Spring整合SpringMVC
  • 电商项目-基于ElasticSearch实现商品搜索功能(四)
  • Kotlin 协程基础三 —— 结构化并发(二)
  • 国产3D CAD将逐步取代国外软件
  • Excel中身份证号码都变成E+乱码显示如何处理?
  • 2024 Java若依(RuoYi)框架视频教程(课件+示例代码+视频)
  • 【DevOps】Jenkins使用Pipline发布Web项目
  • WEB前端-3.1
  • 抖音矩阵是什么
  • 探索 Cloudflare Workers:高效边缘计算的新选择
  • 浅谈云计算02 | 云计算模式的演进
  • Flutter中Get.snackbar避免重复显示的实现
  • Gitlab-Runner配置
  • ModbusTCP转CCLINKIE在机器人中的革命性应用!