当前位置: 首页 > article >正文

SQLAlchemy 介绍与实践

postgresql 实践
pydantic 实践

1. SQLAlchemy 介绍

SQLAlchemy 是一个 ORM 框架。SQLAlchemy 是一个用于 Python 的 SQL 工具和对象关系映射(ORM)库。它允许你通过 Python 代码来与关系型数据库交互,而不必直接编写SQL语句。
简单介绍一下对象关系映射吧,对象关系映射(英语:Object Relational Mapping,简称 ORM,或O/RM,或O/R mapping),是一种程序设计技术, 用于实现面向对象编程语言里不同类型系统的数据之间的转换。 从效果上说,它其实是创建了一个可在编程语言里使用的“虚拟对象数据库”。大白话:对象模型与数据库表的映射。

1.1. SQLAlchemy 使用场景

SQLAlchemy 是一个强大的 Python ORM 框架,主要应用于以下场景:
数据库访问和操作: SQLAlchemy 提供了高层抽象来操作数据库,可以避免写原生 SQL 语句。支持多种数据库后端(MySQL、MongoDB、SQLite、PostgreSQL)。
ORM映射: 建立 Python 类与数据库表的映射关系,简化数据模型的操作,支持声明式操作。
复杂查询: SQLAlchemy 提供丰富的查询方式,如过滤、分组、联结等,可以构建复杂查询。
异步查询: 基于Greenlet 等实现异步查询,提高查询效率。
事务控制: 通过 Session 管理数据库会话和事务。
工具集成: 如数据迁移工具 Alembic,可以实现 Schema 版本控制和迁移。
大数据集查询: 基于 Pagination 实现数据分页,避免大量数据查询内存溢出。
多数据库支持: 支持 Postgres、MySQL、Oracle 等主流数据库。
Web框架集成: 框架如 Flask 可以集成 SQLAlchemy,便于 Web 应用开发。

2. SQLAlchemy 基本用法

参考:
https://www.jb51.net/python/325524ud6.htm
https://blog.51cto.com/u_13019/12307379

2.1. 安装 SQLAlchemy

在使用 SQLAlchemy 之前,首先需要安装它。可以使用以下命令使用 pip 安装:

pip install sqlalchemy 
pip install pymysql		# 安装 MySQL

2.2. 连接数据库

使用 SQLAlchemy 连接到数据库,需要提供数据库的连接字符串,其中包含有关数据库类型、用户名、密码、主机和数据库名称的信息。

from sqlalchemy import create_engine

# 例如,连接到 SQLite 数据库
engine = create_engine('sqlite:///example.db')

# 例如,连接到 MySQL 数据库
username = 'your_mysql_username'
password = 'your_mysql_password'
host = 'your_mysql_host'  # 例如:'localhost' 或 '127.0.0.1'
port = 'your_mysql_port'  # 通常是 3306
database = 'your_database_name'
# 创建连接引擎
engine = create_engine(f'mysql+pymysql://{username}:{password}@{host}:{port}/{database}')

2.3. 定义数据模型

使用 SQLAlchemy 的 ORM 功能,可以定义 Python 类来映射数据库中的表。每个类对应数据库中的一张表,类的属性对应表中的列。

# 导入必要的模块
from sqlalchemy import Column, Integer, String, Sequence
from sqlalchemy.ext.declarative import declarative_base
 
# 创建一个基类,用于定义数据模型的基本结构
Base = declarative_base()
 
# 定义一个数据模型类,对应数据库中的 'users' 表
class User(Base):
    # 定义表名
    __tablename__ = 'users'
 
    # 定义列:id,是整数类型,主键(primary_key=True),并使用 Sequence 生成唯一标识
    id = Column(Integer, Sequence('user_id_seq'), primary_key=True)
 
    # 定义列:name,是字符串类型,最大长度为50
    name = Column(String(50))
 
    # 定义列:age,是整数类型
    age = Column(Integer)

2.4. 创建表

通过在代码中调用 create_all 方法,可以根据定义的模型创建数据库表。

Base.metadata.create_all(engine)

2.5. 插入数据

使用 SQLAlchemy 进行插入数据的操作,首先需要创建一个会话(Session)对象,然后使用该对象添加数据并提交。

# 导入创建会话的模块
from sqlalchemy.orm import sessionmaker
 
# 使用 sessionmaker 创建一个会话类 Session,并绑定到数据库引擎(bind=engine)
Session = sessionmaker(bind=engine)
 
# 创建一个实例化的会话对象 session
session = Session()
 
# 创建一个新的 User 实例,即要插入到数据库中的新用户
new_user = User(name='John Doe', age=30)
 
# 将新用户添加到会话中,即将其添加到数据库操作队列中
session.add(new_user)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()

2.6. 使用事务添加数据

如果添加过程中发生任何错误,我们将回滚事务,确保数据库的一致性。

try:
    # 开始一个新的事务
    session.begin()
    # 创建新用户对象
    user1 = User(name='Alice', email='alice@example.com')
    user2 = User(name='Bob', email='bob@example.com')
    # 添加到会话中
    session.add(user1)
    session.add(user2)
    # 提交事务,将所有更改保存到数据库
    session.commit()
    print("Users added successfully.")
except Exception as e:
    # 如果在添加用户过程中发生错误,则回滚事务
    session.rollback()
    print(f"An error occurred: {e}")
finally:
    # 关闭会话
    session.close()

在这个示例中,我们使用 session.begin() 显式地开始了一个新的事务。然后,我们尝试添加两个新用户到会话中。如果在这个过程中没有发生任何错误,我们使用 session.commit() 提交事务,将所有更改保存到数据库中。但是,如果在添加用户的过程中发生了任何异常(例如,由于重复的电子邮件地址或数据库连接问题),我们将使用 session.rollback() 回滚事务,确保数据库的一致性。

2.7. 查询数据

使用 SQLAlchemy 进行查询数据的操作,可以通过查询语句或使用 ORM 查询接口。

# 使用查询语句
result = engine.execute('SELECT * FROM users')
 
# 使用 ORM 查询接口
users = session.query(User).all()

3. 复杂查询条件

3.1. 连接查询(Join)

假设我们有两个模型, User 和 Order ,并且一个用户可以有多个订单。

from sqlalchemy import Column, Integer, String, ForeignKey
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import relationship
Base = declarative_base()
class TUsers(Base):
    __tablename__ = 'users'
    id      = Column(Integer, primary_key=True, autoincrement=True)
    name    = Column(String(32))
    orders  = relationship("TOrders", back_populates="user")		# 必须关联

class TOrders(Base):
    __tablename__ = 'orders'
    id          = Column(Integer, primary_key=True, autoincrement=True)
    user_id     = Column(Integer, ForeignKey('users.id'))			# 必须使用外键
    product     = Column(String(32))
    quantity    = Column(Integer)
    user        = relationship("TUsers", back_populates="orders")	# 必须关联

现在,如果我们想要查询所有下过订单的用户及其订单信息,我们可以进行连接查询:

from sqlalchemy.orm import joinedload
# 加载所有用户的订单信息
users_with_orders = session.query(TUsers).options(joinedload(TUsers.orders)).all()
for user in users_with_orders:
	print(f"User: {user.name}")
	for order in user.orders:
		print(f"Order: {order.product}, Quantity: {order.quantity}, Id: {order.id}")

3.1.1. 双向关系(relationship)

更多:
https://blog.csdn.net/JKQ8525350/article/details/139568447

3.2. 分组和聚合(Grouping and Aggregation)

假设我们想要统计每个用户下的订单总数。

from sqlalchemy import func
# 按用户分组,并计算每个用户的订单数量
order_count_by_user = session.query(User.id, User.name, func.count(Order.id).label('order_count')).\
    join(Order).group_by(User.id, User.name).all()
for user_id, user_name, order_count in order_count_by_user:
    print(f"User ID: {user_id}, Name: {user_name}, Order Count: {order_count}")

3.3. 子查询(Subquery)

如果我们想要找出订单数量超过平均订单数量的用户,我们可以使用子查询。

from sqlalchemy import func, select
# 计算平均订单数量作为子查询
avg_order_quantity = select([func.avg(Order.quantity).label('avg_quantity')]).select_from(Order).alias()
# 查询订单数量超过平均值的用户及其订单信息
users_above_avg = session.query(User, Order.product, Order.quantity).\
    join(Order).filter(Order.quantity > avg_order_quantity.c.avg_quantity).all()
for user, product, quantity in users_above_avg:
    print(f"User: {user.name}, Product: {product}, Quantity: {quantity}")

3.4. 复杂筛选条件(Complex Filtering)

假设我们想要找到名字以 “A” 开头的用户,并且他们的订单中包含 “apple” 这个产品。

# 查询名字以“A”开头的用户,且订单中包含“apple”产品的用户信息
users_with_apple = session.query(User).join(Order).\
    filter(User.name.startswith('A')).\
    filter(Order.product.contains('apple')).\
    distinct().all()  # 使用distinct() 确保结果中的用户不重复
for user in users_with_apple:
    print(f"User: {user.name}")

3.5. 分页查询

3.5.1. limit

from sqlalchemy.orm import sessionmaker
from sqlalchemy import create_engine
 
# 假设已经有了一个定义好的模型和数据库引擎
engine = create_engine('sqlite:///example.db')
Session = sessionmaker(bind=engine)
session = Session()
 
# 分页查询函数
def paginate_query(page, page_size):
    # 计算跳过的记录数
    offset = (page - 1) * page_size
    # 执行分页查询
    results = session.query(YourModel).order_by(YourModel.id).offset(offset).limit(page_size).all()
    return results
 
# 使用分页查询
page = 1
page_size = 10
records = paginate_query(page, page_size)

3.5.2. slice

total = session.query(YourModel).with_entities(func.count(YourModel.id)).scalar()
db_query = session.query(YourModel).slice(page_start, page_end)

4. SQLAlchemy 实践1

4.1. 定义数据模型类

我们定义三个数据模型类:User(用户)、Post(文章)和Comment(评论)。这些类之间通过外键和关系进行关联。

# 导入 SQLAlchemy 中所需的模块
from sqlalchemy import create_engine, Column, Integer, String, Text, ForeignKey
from sqlalchemy.orm import declarative_base, relationship
 
# 创建一个基类,用于定义数据模型的基本结构
Base = declarative_base()
 
# 定义数据模型类 User,对应数据库中的 'users' 表
class User(Base):
    __tablename__ = 'users'
    
    # 定义列:id,是整数类型,作为主键
    id = Column(Integer, primary_key=True)
    
    # 定义列:username,是字符串类型,最大长度为50,唯一且不可为空
    username = Column(String(50), unique=True, nullable=False)
    
    # 定义列:email,是字符串类型,最大长度为100,唯一且不可为空
    email = Column(String(100), unique=True, nullable=False)
    
    # 定义关系,与 Post 类的关系为一对多关系,通过 back_populates 指定反向关系属性名
    posts = relationship('Post', back_populates='author')
 
# 定义数据模型类 Post,对应数据库中的 'posts' 表
class Post(Base):
    __tablename__ = 'posts'
    
    # 定义列:id,是整数类型,作为主键
    id = Column(Integer, primary_key=True)
    
    # 定义列:title,是字符串类型,最大长度为100,不可为空
    title = Column(String(100), nullable=False)
    
    # 定义列:content,是文本类型,不可为空
    content = Column(Text, nullable=False)
    
    # 定义列:user_id,是整数类型,外键关联到 'users' 表的 id 列
    user_id = Column(Integer, ForeignKey('users.id'))
    
    # 定义关系,与 User 类的关系为多对一关系,通过 back_populates 指定反向关系属性名
    author = relationship('User', back_populates='posts')
    
    # 定义关系,与 Comment 类的关系为一对多关系,通过 back_populates 指定反向关系属性名
    comments = relationship('Comment', back_populates='post')
 
# 定义数据模型类 Comment,对应数据库中的 'comments' 表
class Comment(Base):
    __tablename__ = 'comments'
    
    # 定义列:id,是整数类型,作为主键
    id = Column(Integer, primary_key=True)
    
    # 定义列:text,是文本类型,不可为空
    text = Column(Text, nullable=False)
    
    # 定义列:user_id,是整数类型,外键关联到 'users' 表的 id 列
    user_id = Column(Integer, ForeignKey('users.id'))
    
    # 定义列:post_id,是整数类型,外键关联到 'posts' 表的 id 列
    post_id = Column(Integer, ForeignKey('posts.id'))
    
    # 定义关系,与 User 类的关系为多对一关系
    author = relationship('User')
    
    # 定义关系,与 Post 类的关系为多对一关系,通过 back_populates 指定反向关系属性名
    post = relationship('Post', back_populates='comments')

4.2. 创建数据库引擎和会话

这里我们选择了 SQLite 数据库,并使用 create_all 创建相应的表。

# 导入 SQLAlchemy 中所需的模块
from sqlalchemy import create_engine
from sqlalchemy.orm import sessionmaker
 
# 创建一个 SQLite 数据库引擎,连接到名为 'blog.db' 的数据库文件
engine = create_engine('sqlite:///blog.db')
 
# 使用 Base 对象的 metadata 属性,创建数据库中定义的所有表
Base.metadata.create_all(engine)
 
# 使用 sessionmaker 创建一个会话类 Session,并将其绑定到上面创建的数据库引擎
Session = sessionmaker(bind=engine)
 
# 创建一个实例化的会话对象 session,用于进行数据库操作
session = Session()

4.3. 进行数据库操作

这段代码演示了如何使用 SQLAlchemy 对数据库进行插入和查询操作。首先,创建了一个用户、一篇文章和一条评论,然后通过查询用户的方式,打印出该用户的所有文章及评论。

# 创建一个新用户对象并设置其属性
user1 = User(username='john_doe', email='john@example.com')
 
# 将新用户对象添加到会话,表示要进行数据库插入操作
session.add(user1)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()
 
# 创建一篇新文章对象并设置其属性
post1 = Post(title='Introduction to SQLAlchemy', content='SQLAlchemy is a powerful ORM for Python.')
 
# 将文章的作者关联到之前创建的用户
post1.author = user1
 
# 将新文章对象添加到会话,表示要进行数据库插入操作
session.add(post1)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()
 
# 创建一条新评论对象并设置其属性
comment1 = Comment(text='Great article!', author=user1, post=post1)
 
# 将评论对象添加到会话,表示要进行数据库插入操作
session.add(comment1)
 
# 提交会话,将所有在此会话中的数据库操作提交到数据库
session.commit()
 
# 查询用户名为 'john_doe' 的用户,并打印其所有文章及评论
user = session.query(User).filter_by(username='john_doe').first()
print(f"User: {user.username}")
 
# 遍历用户的所有文章
for post in user.posts:
    print(f"Post: {post.title}")
 
    # 遍历文章的所有评论
    for comment in post.comments:
        print(f"Comment: {comment.text}")

5. SQLAlchemy 实践2 数据库初始化操作

入口 main.py

from sqlalchemy import create_engine
from sqlalchemy_utils import create_database, database_exists

from database import Base
from schemas import UserBase, OrderBase

def is_db_exist(db_url: str):
    engine = create_engine(
        db_url, max_overflow=0, pool_size=16, pool_timeout=5, pool_recycle=-1
    )
    
    if not database_exists(engine.url):
        create_database(engine.url)
        return False
    else:    
        return True
    
def init_database(db_url: str):
    # 设置连接池的大小
    engine = create_engine(
        db_url, 
        max_overflow=0,         # 超过连接池大小外最多创建的连接
        pool_size=16,           # 连接池大小
        pool_timeout=5,         # 池中没有线程最多等待的时间,否则报错
        pool_recycle=-1         # 多久之后对线程池中的线程进行一次连接的回收(重置)
    )
    # 创建数据库
    Base.metadata.create_all(engine)

if __name__ == '__main__':
    # 数据库参考
    db_host = "127.0.0.1"
    db_user = "root"
    db_password = "lianap"
    db_url = '%s%s:%s@%s/%s' % ("mysql+pymysql://", db_user, db_password, db_host, "local_db")
    if not is_db_exist(db_url):
        init_database(db_url)

    from alchemy import AlchemyTool
    alchemytool = AlchemyTool(db_url=db_url)
    db_user = alchemytool.create_user("test_user")
    alchemytool.create_order(db_user.id)
    alchemytool.select()

数据表结构 database.py

from sqlalchemy import Column, Integer, String, DateTime, Text, ForeignKey
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import relationship

# sqlalchemy
Base = declarative_base()

class TUsers(Base):
    __tablename__ = 'users'
    id      = Column(Integer, primary_key=True, autoincrement=True)
    name    = Column(String(32))
    orders  = relationship("TOrders", back_populates="user")        # 必须使用

class TOrders(Base):
    __tablename__ = 'orders'
    id          = Column(Integer, primary_key=True, autoincrement=True)
    user_id     = Column(Integer, ForeignKey('users.id'))           # 必须使用外键
    product     = Column(String(32))
    quantity    = Column(Integer)
    user        = relationship("TUsers", back_populates="orders")   # 必须使用

数据结构体 schemas.py

from pydantic import BaseModel, Field
from typing import Union, Optional, Literal, List, Dict

## 任务基础结构体
class OrderBase(BaseModel):
    id: int
    user_id: int
    product: str
    quantity: int

    class Config:
        from_attributes=True

class UserBase(BaseModel):
    id: int     
    name: str
    orders: List[OrderBase]

    class Config:
        from_attributes=True

数据库操作 alchemy.py

from sqlalchemy import create_engine, and_, or_, func
from sqlalchemy.exc import SQLAlchemyError
from sqlalchemy.orm import sessionmaker, joinedload
from sqlalchemy.pool import SingletonThreadPool

from database import Base
from database import TUsers, TOrders
from schemas import UserBase, OrderBase

class AlchemyTool(object):
    def __init__(self, db_url: str):
        print("AlchemyTool init")

        # 设置连接池的大小
        db_config = {
            "pool_size": 10
        }
        #engine = create_engine(SQLALCHEMY_DATABASE_URL, **db_config)
        # engine = create_engine(db_url, 
        #         #poolclass = SingletonThreadPool,
        #         connect_args = {'check_same_thread': False}
        #     )
        engine = create_engine(
            db_url, max_overflow=0, pool_size=16, pool_timeout=5, pool_recycle=-1
        )
        # # 创建数据库
        # Base.metadata.create_all(engine)
        # 创建数据库连接
        self.__session = sessionmaker(autocommit=False, autoflush=False, bind=engine)()
    
    # ############################### User ###############################
    def create_user(self, name:str):
        db_location = None
        try:
            db_location = TUsers(name=name)
            self.__session.add(db_location)
            self.__session.commit()
        except SQLAlchemyError as e:
            print(f"Error.AlchemyTool.create_user SQLAlchemyError:{str(e)}")
            self.__session.rollback()
        finally:
            pass
        return db_location

    def create_order(self, user_id: int=1):
        db_location = None
        try:
            # self.__session.begin()
            for index in range(5):
                db_location = TOrders(user_id=user_id, product=f"product{index}", quantity=index)
                self.__session.add(db_location)
            self.__session.commit()
        except SQLAlchemyError as e:
            print(f"Error.AlchemyTool.create_order SQLAlchemyError:{str(e)}")
            self.__session.rollback()
        finally:
            pass
        return db_location

    def select(self):
        users_with_orders = self.__session.query(TUsers).options(joinedload(TUsers.orders)).all()
        for user in users_with_orders:
            user_base = UserBase.from_orm(user)		# 一次性转换成 UserBase(包含List[OrderBase])
            print(f"UserBase: {user_base}")
            for order in user.orders:
                # print(f"Order: {order.product}, Quantity: {order.quantity}, Id: {order.id}")
                pass

运行结果

> python.exe .\main.py
AlchemyTool init
UserBase: id=1 name='test_user' orders=[OrderBase(id=1, user_id=1, product='product0', quantity=0), OrderBase(id=2, user_id=1, product='product1', quantity=1), OrderBase(id=3, user_id=1, product='product2', quantity=2), OrderBase(id=4, user_id=1, product='product3', quantity=3), OrderBase(id=5, user_id=1, product='product4', quantity=4)]

http://www.kler.cn/a/387343.html

相关文章:

  • 前端常见的设计模式之【单例模式】
  • UML系列之Rational Rose笔记九:组件图
  • nvm 管理nodejs,安装pnpm后报错,出现:pnpm不是内部或外部命令,也不是可运行的程序或批处理文件。
  • Flask表单处理与验证
  • 青少年编程与数学 02-006 前端开发框架VUE 22课题、状态管理
  • FPGA的 基本结构(Xilinx 公司Virtex-II 系列FPGA )
  • 【软件测试】需求的概念和常见模型(瀑布、螺旋、增量、迭代)
  • 使用SpringBoot构建可扩展的在线教育平台
  • 力扣17-电话号码的数字组合
  • 【前端】Svelte:Store 状态管理
  • 编程语言之战:AI 之后的 Kotlin 与 Java
  • 【DM系列】DM 集成 JDBC 开发指南
  • 杂谈:业务说的场景金融是什么?
  • k8s集群安装(kubeadm)
  • Android打包流程图
  • 5G网卡network connection: disconnected
  • 小程序开发进阶之路-AI编程助手
  • 配置多公钥在多平台使用Git
  • FOFA使用教程之从零到精通
  • javascript实现国密hash(sm3)算法(支持微信小程序),可分多次计算
  • 【论文复现】MSA+抑郁症模型总结(三)
  • 使用 Flask 和 ONLYOFFICE 实现文档在线编辑功能
  • 浏览器发起 HTTP 请求的典型场景
  • lua入门教程:pairs
  • 力扣 多数元素
  • Debezium系列之:Debezium3版本增量快照和只读增量快照应用的变化