当前位置: 首页 > article >正文

微信小程序接入DeepSeek模型(火山方舟),并在视图中流式输出

引言:

DeepSeek,作为一款先进的自然语言处理模型,以其强大的文本理解和生成能力著称。它能够处理复杂的文本信息,进行深度推理,并快速给出准确的回应。DeepSeek模型支持流式处理,这意味着它可以边计算边输出,而不必等待整个生成过程结束后再输出结果,大大缩短了用户的等待时间。通过流式输出,DeepSeek模型可以在处理过程中实时地将结果发送给小程序,小程序前端则能够立即接收到这些数据,并在视图中动态展示出来。这样,用户就可以边等待边看到已经接收到的结果,大大提升了用户体验。

本文中的DeepSeek模型为火山方舟(字节跳动火山引擎)中的DeepSeek大模型,当前可以免费使用。

一、注册火山引擎账号,创建API Key和model(接入点ID)

请参考之前的文章:微信小程序调用火山方舟(字节跳动火山引擎)中的DeepSeek大模型

二、小程序调用API,并流式输出

const requestTask=wx.request({
	method: 'POST',
	url: 'https://ark.cn-beijing.volces.com/api/v3/chat/completions',
	header: {
		'Content-Type': 'application/json', 
		'Authorization': 'Bearer API Key'  //Authorization值为“Bearer API Key”
	},
	data: {
		"model": "xxx",	//model值为接入点ID(model)
		"messages": [{
			"role": "user",
			"content": "你是DeepSeek模型吗?",
		}],
        stream: true,   //是否以流的形式输出生成的内容
	},
    enableChunked: true    //开启transfer-encoding chunked
});

requestTask.onChunkReceived(res => {
    //在微信开发者工具和真机上接收到的对象格式是不同的,以下代码是针对不同格式进行解码处理
	let type=Object.prototype.toString.call(res.data);
	let text;
	if(type ==="[object Uint8Array]")
		text=decodeURIComponent(escape(String.fromCharCode(...res.data)))
	if(type ==="[object ArrayBuffer]"){
		let uint8Array = new Uint8Array(res.data);
		text=decodeURIComponent(escape(String.fromCharCode(...uint8Array)))
	}
    //将解码后的文本分割成字符串数组,数组中的每个元素就是即时接收到的流式文本
	let list = text.split('\n');
	for (var i = 0; i < list.length; i++) {
		if (list[i]) {
			if (list[i].trim().search(/^data.*\}$/) > -1) {    //过滤掉空行和其他不规则数据行
				let delta = JSON.parse(list[i].substring(6)).choices[0].delta;
                //如果开启了“深度思考”,返回的对象中delta.reasoning_content为深度思考内容,
                //delta.content为主体应答内容
				let content = delta.reasoning_content ? delta.reasoning_content : delta.content;
				console.log(content);
			}
			if (list[i] == 'data: [DONE]') {
				requestTask.abort();
			}
		}
	}
});


http://www.kler.cn/a/569964.html

相关文章:

  • PostgreSQL全页写机制深度解析:如何平衡WAL性能与数据可靠性
  • IDEA Tab 页设置多行显示
  • Docker + Vue2 热重载:为什么需要 CHOKIDAR_USEPOLLING=true?
  • 23种设计模式之工厂方法模式(Factory Method Pattern)【设计模式】
  • 频谱泄露与加窗
  • 代码规范和简化标准
  • Java零基础入门笔记:(6)面向对象
  • Cherno C++ P60 为什么不用using namespace std
  • react 19版中路由react-router-dom v7版的使用
  • MySQL学习笔记(2)并发问题与事务隔离级别
  • kettle插件-git/svn版本管理插件
  • 实战 Elasticsearch:快速上手与深度实践-2.2.2线程池配置与写入限流
  • 乡村研学旅行小程序(论文源码调试讲解)
  • 【JavaScript】《JavaScript高级程序设计 (第4版) 》笔记-附录A-ES2018 和 ES2019
  • 芯麦GC1272与茂达APX9172驱动芯片技术对比及替代方案解析 ——以电脑散热风扇、工业风机及智能设备场景为例
  • Kaldi环境配置与Aishell训练
  • 解决:org.springframework.web.multipart.support.MissingServletRequestPartException
  • Windows下git疑难:有文件无法被跟踪
  • 【MySQL】窗口函数详解(概念+练习+实战)
  • 网络安全六层模型