当前位置：首页 > article >正文

python的异步日志处理

article 2025/2/26 5:22:35

原本日志相关的处理方式：

class Logger:
    def __init__(self, log_dir='logs'):
        self.log_dir = log_dir
        self.create_log_directory()
        self.log_path = None
        self.logger = None
        self.setup_logger()

    def create_log_directory(self):
        """创建日志目录"""
        if not os.path.exists(self.log_dir):
            os.makedirs(self.log_dir)

    def setup_logger(self):
        """设置日志记录器"""
        timestamp = datetime.datetime.now().strftime('%Y%m%d_%H%M%S')
        log_filename = f"log_{timestamp}.log"
        self.log_path = os.path.join(self.log_dir, log_filename)
        # 创建日志记录器
        self.logger = logging.getLogger(__name__)
        self.logger.setLevel(logging.DEBUG)
        # 创建文件处理器
        file_handler = logging.FileHandler(self.log_path)
        file_handler.setLevel(logging.DEBUG)

        # # 创建终端处理器
        # stream_handler = logging.StreamHandler()
        # stream_handler.setLevel(logging.DEBUG)

        # 设置日志格式
        formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
        file_handler.setFormatter(formatter)
        # stream_handler.setFormatter(formatter)

        # 添加处理器到记录器
        self.logger.addHandler(file_handler)
        # self.logger.addHandler(stream_handler)

    def info(self, message):
        """记录 info 级别的日志"""
        self.logger.info(message)

    def warning(self, message):
        """记录 warning 级别的日志"""
        self.logger.warning(message)

    def error(self, message):
        """记录 error 级别的日志"""
        self.logger.error(message)

以下是修改后的异步日志记录实现，使用Python标准库的logging.handlers.QueueHandler和logging.handlers.QueueListener实现非阻塞日志记录：

import os
import datetime
import logging
import queue
from logging.handlers import QueueHandler, QueueListener

class AsyncLogger:
    def __init__(self, log_dir='logs'):
        self.log_dir = log_dir
        self.create_log_directory()
        self.log_path = None
        self.logger = None
        self.log_queue = None
        self.listener = None
        self.setup_logger()

    def create_log_directory(self):
        """创建日志目录"""
        if not os.path.exists(self.log_dir):
            os.makedirs(self.log_dir)

    def setup_logger(self):
        """设置异步日志记录器"""
        # 生成日志文件名
        timestamp = datetime.datetime.now().strftime('%Y%m%d_%H%M%S')
        log_filename = f"log_{timestamp}.log"
        self.log_path = os.path.join(self.log_dir, log_filename)

        # 初始化核心logger
        self.logger = logging.getLogger(__name__)
        self.logger.setLevel(logging.DEBUG)

        # 创建同步处理器（文件+控制台）
        file_handler = logging.FileHandler(self.log_path)
        stream_handler = logging.StreamHandler()
        formatter = logging.Formatter('%(asctime)s - %(levelname)s - %(message)s')
        
        # 设置处理器级别和格式
        for handler in [file_handler, stream_handler]:
            handler.setLevel(logging.DEBUG)
            handler.setFormatter(formatter)

        # 创建异步队列和处理器
        self.log_queue = queue.Queue(maxsize=1000)  # 限制队列大小防止内存溢出
        queue_handler = QueueHandler(self.log_queue)
        self.logger.addHandler(queue_handler)

        # 创建监听器并启动后台线程
        self.listener = QueueListener(
            self.log_queue,
            file_handler,
            stream_handler,
            respect_handler_level=True  # 遵守处理器的日志级别
        )
        self.listener.start()

    def info(self, message):
        """异步记录info级别日志"""
        self.logger.info(message)

    def warning(self, message):
        """异步记录warning级别日志"""
        self.logger.warning(message)

    def error(self, message):
        """异步记录error级别日志"""
        self.logger.error(message)

    def close(self):
        """安全关闭日志监听器"""
        if self.listener:
            self.listener.stop()
            # 可选：等待队列清空（根据需求调整超时时间）
            # self.log_queue.join()

    def __del__(self):
        """析构时自动关闭"""
        self.close()

# 使用示例
if __name__ == "__main__":
    logger = AsyncLogger()
    
    try:
        # 模拟高并发日志写入
        for i in range(1000):
            logger.info(f"Processing task {i}")
            logger.warning(f"Warning event {i}")
        
        # 模拟错误
        logger.error("Simulated critical error")
    finally:
        logger.close()  # 确保关闭监听器

主要改进说明

异步架构设计
- 使用QueueHandler将日志事件推送到内存队列
- 独立的QueueListener后台线程处理实际I/O操作
- 主线程与日志I/O操作完全解耦
线程安全控制
- 内置队列queue.Queue保证线程安全
- 设置队列容量（maxsize=1000）防止内存溢出
- 通过respect_handler_level参数控制日志级别过滤
资源管理优化
- 显式提供close()方法确保优雅关闭
- 析构函数自动调用关闭逻辑
- 可选的队列清空等待（注释部分可按需启用）
性能增强特性
- 日志格式化操作仍在主线程完成（避免后台线程CPU竞争）
- 控制台和文件写入在同一个后台线程处理（减少上下文切换）
- 队列容量限制提供背压机制（防止生产者过快）

使用注意事项

队列容量选择
```
self.log_queue = queue.Queue(maxsize=1000)  # 根据内存大小调整
```
- 建议值：maxsize = 预估峰值日志量 × 单条日志平均大小 / 系统可用内存

异常处理增强（可选）

def error(self, message):
    try:
        self.logger.error(message)
    except queue.Full:
        # 处理队列满的情况（如降级到同步写入）
        logging.error(f"Queue full! Sync write: {message}")

性能监控建议

@property
def queue_size(self):
    return self.log_queue.qsize()

分布式扩展方案

可将队列替换为Redis/Kafka等中间件实现跨进程日志收集
示例替换为Kafka生产者：

from kafka import KafkaProducer
class KafkaQueueHandler(QueueHandler):
    def __init__(self, topic):
        self.producer = KafkaProducer(bootstrap_servers='localhost:9092')
        super().__init__(queue.Queue())
        self.topic = topic

    def enqueue(self, record):
        msg = self.format(record).encode('utf-8')
        self.producer.send(self.topic, msg)