当前位置: 首页 > article >正文

SQLAlchemy系列教程:批量插入数据

高效地批量插入数据对于应用程序的性能至关重要。SQLAlchemy为批处理操作提供了几种机制,可以最大限度地减少开销并加快数据库事务时间。在本指南中,我们将探讨如何使用SQLAlchemy执行批量插入,包括从基础技术到高级技术。

在这里插入图片描述

搭建环境

在开始之前,请确保已经安装了Python和SQLAlchemy。如果您还没有安装SQLAlchemy,请使用pip Install SQLAlchemy。你还需要与数据库进行交互;在本指南中,我们将使用SQLite,因为它不需要额外的设置。

from sqlalchemy import create_engine, Column, Integer, String, MetaData, Table
from sqlalchemy.orm import sessionmaker

# Create an engine that stores data in the local directory's
# sqlalchemy_example.db file.
engine = create_engine('sqlite:///sqlalchemy_example.db')

# Define a table
metadata = MetaData()
users_table = Table('users', metadata,
    Column('id', Integer, primary_key=True),
    Column('name', String),
    Column('age', Integer))

# Create the table
metadata.create_all(engine)

# Create a Session class
Session = sessionmaker(bind=engine)

基本批量插入

要执行基本的批量插入,可以使用Session.bulk_insert_mappings()方法。此方法允许您一次插入许多对象,而无需实例化模型实例。

session = Session()

users = [
    {'name': 'John Doe', 'age': 28},
    {'name': 'Jane Doe', 'age': 25},
    # ... more user dicts
]

# Bulk insert mappings
session.bulk_insert_mappings(users_table, users)
session.commit()

使用插入构造函数处理大型批处理

对于更大的数据集,通过 SQLAlchemy 核心提供的 SQL 插入构造函数可能更高效。以下是使用方法:

insert_stmt = users_table.insert().values(
    [{'name': 'Alice', 'age': 30}, {'name': 'Bob', 'age': 22}]  # list of dicts
)

conn = engine.connect()
conn.execute(insert_stmt)
conn.close()

在批量插入期间处理重复项

通过使用数据库机制(如PostgreSQL的ON CONFLICT)来处理批量插入操作中的重复项。下面是一个使用SQLAlchemy核心的例子:

insert_stmt = users_table.insert().values(
    [{'name': 'Charlie', 'age': 35}, {'name': 'Dana', 'age': 19}]
).on_conflict_do_update(
    index_elements=['name'],
    set_=dict(age=users_table.c.age + 1)
)

conn = engine.connect()
conn.execute(insert_stmt)
conn.close()

性能考虑

在执行批量操作时,可以遵循以下最佳实践以获得更好的性能:

  • 在批量操作期间禁用ORM的自动刷新,以防止不必要的刷新。
  • 只有在所有数据插入后才使用事务并提交。
  • 了解数据库的批量插入功能和限制。

高级批处理操作

SQLAlchemy version 1.3引入了bulk_save_objects()函数,用于可能涉及主键和外键处理的复杂批量操作。这里有一个简单的例子:

session = Session()

users = [
    {'name': 'Eva', 'age': 28},
    # ... more user dicts
]

# Handle bulk save objects
session.bulk_save_objects([
    users_table(**data) for data in users
])
session.commit()

使用SQLAlchemy ORM进行批量插入

如果需要ORM的特性来进行批量插入,例如,触发事件或处理关系,你可以使用session.add_all()方法:

session = Session()

class User(Base):
    __tablename__ = 'users'
    id = Column(Integer, primary_key=True)
    name = Column(String)
    age = Column(Integer)

# Define some user instances
users = [User(name='Frank', age=45), User(name='Grace', age=30)]

# Use add_all for bulk insertion
session.add_all(users)
session.commit()

最后总结

使用SQLAlchemy进行批量插入可以通过减少事务时间和资源使用来提高应用程序的性能。无论是处理基本的批量插入还是管理具有重复值或级联操作的更复杂场景,SQLAlchemy都提供了合适的工具。


http://www.kler.cn/a/586374.html

相关文章:

  • 卷积神经网络 - 一维卷积、二维卷积
  • 适合企业内训的AI工具实操培训教程(37页PPT)(文末有下载方式)
  • 基于6自由度搬运机器人完成单关节伺服控制实现的详细步骤及示例代码
  • opencv-显示图片
  • Mybatis语法bug
  • DeepSeek linux服务器(CentOS)部署命令笔记
  • React面试(二)
  • C语言基础知识04
  • 人工智能与人的智能,改变一生的思维模型分享【4】决策树
  • 有效的括号 力扣20
  • fprintf() 函数:C语言中的文件格式化输出利器
  • 机器学习_交叉验证
  • 大语言模型基础之‘显存优化‘
  • 【2025】Electron Git Desktop 实战一(上)(架构及首页设计开发)
  • 网络华为HCIA+HCIP数据链路层协议-以太网协议
  • uv命令介绍(高性能Python包管理工具,旨在替代pip、pip-tools和virtualenv等传统工具)
  • 设计一个高性能的分布式限流系统
  • ArcGIS Pro将有文字标注底图切换为无标注底图(在线地图图源)
  • PostgreSQL的学习心得和知识总结(一百七十一)|深入理解PostgreSQL数据库之 外连接消除 的使用和实现
  • 日本IT|AWS工作内容及未来性、以及转职的所需资质和技能