当前位置：首页 > article >正文

并发、串行与同步、异步

article 2025/1/16 21:08:17

怎么理解“一个程序并发执行，数据库连接对象只有一个时，只能同步”？

理解这个说法需要考虑并发执行和数据库连接对象的特性。

在一个面向对象程序中，并发执行通常意味着多个线程或进程同时执行程序的不同部分。数据库连接对象是用于与数据库进行交互的对象，通常有状态并且可能涉及到共享资源，比如数据库连接池。

如果一个程序在并发执行时，使用的数据库连接对象只有一个，这可能会引发一些问题。数据库连接对象通常不是线程安全的，因为它们可能包含状态信息，例如当前事务的状态等。在多线程或多进程并发执行的情况下，多个线程或进程同时操作同一个数据库连接对象可能导致状态混乱、数据不一致等问题。

因此，为了确保在并发执行时数据库连接的安全使用，可能需要采用同步机制。同步机制可以确保在某一时刻只有一个线程或进程能够访问数据库连接对象，从而避免并发问题。

以下是一个简单的示例，演示了一个程序并发执行时，使用单一数据库连接对象可能导致的问题：

import threading
import sqlite3

class DatabaseManager:
    def __init__(self, database_path):
        self.connection = sqlite3.connect(database_path)
        self.cursor = self.connection.cursor()

    def execute_query(self, query):
        self.cursor.execute(query)
        return self.cursor.fetchall()

# 使用单一数据库连接对象的程序
def concurrent_program(database_manager):
    results = database_manager.execute_query("SELECT * FROM my_table")
    print(f"Results: {results}")

# 创建数据库连接对象
db_manager = DatabaseManager("my_database.db")

# 启动多个线程并发执行程序
threads = []
for _ in range(5):
    thread = threading.Thread(target=concurrent_program, args=(db_manager,))
    threads.append(thread)
    thread.start()

# 等待所有线程结束
for thread in threads:
    thread.join()

# 关闭数据库连接
db_manager.connection.close()

这个例子中，多个线程共享同一个DatabaseManager实例，它包含一个数据库连接对象。这可能导致在并发执行时数据库操作发生混乱，需要通过同步机制来避免。在实际应用中，可以使用数据库连接池等机制来更好地处理并发问题。

异步回调机制的原理

在爬虫中，回调机制通常用于处理异步的网络请求。以下是一个简单的爬虫代码示例，使用回调机制处理异步请求：

import requests
from concurrent.futures import ThreadPoolExecutor

def fetch_url(url, callback):
    # 模拟异步操作，这里使用requests库作为例子
    response = requests.get(url)
    # 获取响应后调用回调函数，并传递响应内容
    callback(response.text)

def process_response(content):
    # 处理响应的回调函数
    print(f"Received response with length: {len(content)}")

# 要抓取的网页列表
urls = ['https://www.example.com', 'https://www.example.org', 'https://www.example.net']

# 使用线程池进行并发操作
with ThreadPoolExecutor() as executor:
    # 遍历网页列表，每个网页使用一个线程进行异步请求
    for url in urls:
        # 提交任务到线程池，将回调函数一并传递
        executor.submit(fetch_url, url, process_response)