当前位置：首页 > article >正文

OpenAI流式解析

article 2025/3/29 14:52:28

OpenAI 流式的代码：

首选一般请使用os.getenv 去读环境变量的内容

注意使用pip install python-dotenv 的安装方法

load_dotenv 是这个库提供的一个函数，用于读取 .env 文件并将其中定义的键值对设置为系统的环境变量。

默认情况下，load_dotenv() 会自动查找当前目录下的 .env 文件。如果文件不在默认路径，可以通过参数指定，例如 load_dotenv(‘/path/to/.env’)。

为什么代码里用 dotenv 而不是 python_dotenv？

在 Python 中，导入模块时使用的是库的模块名，而不是 PyPI 上的包名。python-dotenv 这个包安装后，提供了一个名为 dotenv 的模块供导入。这是由库开发者决定的命名约定。例如：

PyPI 包名：python-dotenv
导入时的模块名：dotenv

流式代码类（一键运行）

from openai import  AsyncOpenAI
from dotenv import load_dotenv
import os

load_dotenv()

class AsyncOpenAIOut:
    def __init__(self):
        self.api_key = os.getenv("OPENAI_API_KEY")
        self.base_url = os.getenv("OPENAI_BASE_URL")
        self.oai_client = AsyncOpenAI(api_key=self.api_key, base_url=self.base_url)
        self.model = os.getenv("OPENAI_MODEL")
    async def gpt_stream(self, user_message: str,model: str = os.getenv("OPENAI_MODEL"),history: list[dict] = [],system_prompt: str = "") :
        messages = []
        if history:
            messages.extend(history)
        
        if system_prompt:
            messages.extend([{"role": "system", "content": system_prompt}])
        
        messages.append({"role": "user", "content": user_message})
        response = await self.oai_client.chat.completions.create(
            model=model,
            messages=messages,
            stream=True
        )
        
        async for chunk in response:
            if chunk.choices[0].delta.content:
                yield chunk.choices[0].delta.content

async_openai_out = AsyncOpenAIOut()

if __name__ == "__main__":
    async def test_gpt_stream():
        async for chunk in async_openai_out.gpt_stream(user_message="写300字作文",system_prompt="You are a helpful assistant."):
            print(chunk)

    import asyncio
    
    asyncio.run(test_gpt_stream())

这里面有几点需要注意：

简短回答：print(chunk) 是 同步操作，会在当前事件循环中执行完毕后才继续，但它不是 I/O 密集型操作，所以不会造成实际的“阻塞”问题，特别是在异步函数中逐步输出内容的场景下，它是可接受的。

想确保异步非阻塞输出:

        async for chunk in async_openai_out.gpt_stream(user_message="写300字作文",system_prompt="You are a helpful assistant."):
            # print(chunk)
            await asyncio.to_thread(print, chunk)  # 在后台线程执行 print

异步生成器（Async Generator） 的用法，结合了 Python 的异步编程（async for）和生成器（yield）机制。

在异步迭代 response 中的每个 chunk，如果它有内容，就通过 yield 一块一块地“流式返回”。

async for chunk in response:
    if chunk.choices[0].delta.content:
        yield chunk.choices[0].delta.content

对比for ：普通for是同步迭代

async for是异步迭代,比如网络流、WebSocket、OpenAI 的 Stream 响应等。

yield 是生成器的关键，它不是“返回”值，而是“产出”值（可以被迭代一次）。

查看全文

http://www.kler.cn/a/601510.html

计算机网络入门：物理层与数据链路层详解

HTTP 核心知识点整理

云端陷阱：当免费午餐变成付费订阅，智能家居用户如何破局？

Idea中诡异的文件编码问题：设置fileCodeing为UTF8但不生效

【Linux-驱动开发-设备树 DTS】

计算机组网实例

什么是CAP理论

【专业测评】STONE 80A-L 电调：轻量化革命下的工业级动力心脏 ——112g 机身承载 80A 持续输出，重新定义无人机动力系统标杆

windows剪切板的内容无法拷贝到虚拟机virtualbox里的Rocky Linux中 --Draft

effective Java 学习笔记（第二弹）

【报错】 /root/anaconda3/conda.exe: cannot execute binary file: Exec format error

[leetcode]map的用法

【HCIA-网工探长】04：ARP笔记

电机控制常见面面试问题（十九）

Spring Boot 的自动装配

3.25-1 postman执行+弱网测试

如何选择免费国产类 Postman 软件？

Docker-Volume数据卷详讲

Springboot整合elasticsearch详解封装模版仓库方法如何在linux里安装elasticsearch

从零开始实现 C++ TinyWebServer 构建响应 HttpResponse类详解

相关文章：