当前位置: 首页 > article >正文

ModelArts Standard的WebSocket在线服务全流程开发

背景说明

WebSocket是一种网络传输协议,可在单个TCP连接上进行全双工通信,位于OSI模型的应用层。WebSocket协议在2011年由IETF标准化为RFC 6455,后由RFC 7936补充规范。Web IDL中的WebSocket API由W3C标准化。

WebSocket使得客户端和服务器之间的数据交换变得更加简单,允许服务端主动向客户端推送数据。在WebSocket API中,浏览器和服务器只需要完成一次握手,两者之间就可以建立持久性的连接,并进行双向数据传输。

前提条件
  • 用户需有一定的Java开发经验,熟悉jar打包流程。
  • 用户需了解WebSocket协议的基本概念及调用方法。
  • 用户需熟悉Docker制作镜像的方法。
约束与限制
  • WebSocket协议只支持部署在线服务。
  • 只支持自定义镜像导入AI应用部署的在线服务。
准备工作

ModelArts使用WebSocket完成推理需要用户自己准备自定义镜像,该自定义镜像需要在单机环境下能够提供完整的WebSocket服务,如完成WebSocket的握手,client向server发送数据,server向client发送数据等。模型的推理过程在自定义镜像中完成,如下载模型,加载模型,执行预处理,完成推理,拼装响应体等。

操作步骤

WebSocket在线服务开发操作步骤如下:

  • 上传镜像至容器镜像服务
  • 使用镜像创建AI应用
  • 使用AI应用部署在线服务
  • WebSocket在线服务调用

上传镜像至容器镜像服务

将准备好的本地镜像上传到容器镜像服务(SWR)。

使用镜像创建AI应用
  1. 登录ModelArts管理控制台,进入“ AI应用”页面,单击“创建”,跳转至创建AI应用页面。
  2. 完成AI应用配置,部分配置如下:
    • 元模型来源:选择“从容器镜像中选择”。
    • 容器镜像所在的路径:选择上传镜像至容器镜像服务上传的路径。
    • 容器调用接口:根据实际情况配置容器调用接口。
    • 健康检查:保持默认。如果镜像中配置了健康检查则按实际情况配置健康检查。

      图1 AI应用配置参数

  3. 单击“立即创建”,进入AI应用列表页,等AI应用状态变为“正常”,表示AI应用创建成功。

使用AI应用部署在线服务
  1. 登录ModelArts管理控制台,进入“模型部署 >在线服务”页面,单击“部署”,跳转至在线服务部署页面。
  2. 完成服务的配置,部分配置如下:
    • 选择AI应用及版本:选择使用镜像创建AI应用创建完成的AI应用及版本
    • 升级为WebSocket:打开开关

      图2 升级为WebSocket

  3. 单击“下一步”,确认配置后“提交”,完成在线服务的部署。返回在线服务列表页,查看服务状态变为“运行中”,表示服务部署成功。

WebSocket在线服务调用

WebSocket协议本身不提供额外的认证方式。不管自定义镜像里面是ws还是wss,经过ModelArts平台出去的WebSocket协议都是wss的。同时wss只支持客户端对服务端的单向认证,不支持服务端对客户端的双向认证。

可以使用ModelArts提供的以下认证方式:

  • token认证
  • AK/SK
  • APP认证

WebSocket服务调用步骤如下(以图形界面的软件Postman进行预测,token认证为例):

  1. WebSocket连接的建立
  2. WebSocket客户端和服务端双向传输数据
  1. WebSocket连接的建立

    1. 打开Postman(需选择8.5 以上版本,以10.12.0为例)工具,单击左上角

      ,选择“File>New”,弹出新建对话框,选择“WebSocket Request”(当前为beta版本)功能:

      图3 选择WebSocket Request功能

    2. 在新建的窗口中填入WebSocket连接信息:

      左上角选择Raw,不要选择Socket.IO(一种WebSocket实现,要求客户端跟服务端都要基于Socket.IO),地址栏中填入从服务详情页“调用指南”页签中获取“API接口调用公网地址”后面的地址。如果自定义镜像中有更细粒度的地址,则在地址后面追加该URL。如果有queryString,那么在params栏中添加参数。在header中添加认证信息(不同认证方式有不同header,跟https的推理服务相同)。选择单击右上的connect按钮,建立WebSocket连接。

      图4 获取API接口调用公网地址

      明:
      • 如果信息正确,右下角连接状态处会显示:CONNECTED;
      • 如果无法建立连接,如果是401状态码,检查认证信息;
      • 如果显示WRONG_VERSION_NUMBER等关键字,检查自定义镜像的端口和ws跟wss的配置是否正确。

      连接成功后结果如下:

      图5 连接成功

      须知:

      优先验证自定义镜像提供的websocket服务的情况,不同的工具实现的websocket服务会有不同,可能出现连接建立后维持不住,可能出现请求一次后连接就中断需要重新连接的情况,ModelArts平台只保证,未上ModelArts前自定义镜像的websocket的形态跟上了ModelArts平台后的websocket形态相同(除了地址跟认证方式不同)。

  2. WebSocket客户端和服务端双向传输数据

    连接建立后,WebSocket使用TCP完成全双工通信。WebSocket的客户端可以往服务端发送数据,客户端有不同的实现,同一种语言也存在不同的lib包的实现,这里不考虑实现的不同种类。

    客户端发送的内容在协议的角度不限定格式,Postman支持Text/Json/XML/HTML/Binary,以text为例,在输入框中输入要发送的文本,单击右侧中部的Send按钮即可将请求发往服务端,当文本内容过长,可能会导致postman工具卡住。

    图6 发送数据


http://www.kler.cn/a/428677.html

相关文章:

  • 【Pandas】pandas Series groupby
  • 整数的分离与合成
  • 数据库管理-第285期 Oracle 23ai:深入浅出向量索引(20250117)
  • 【设计模式】 单例模式(单例模式哪几种实现,如何保证线程安全,反射破坏单例模式)
  • go语言zero框架通过chromedp实现网页在线截图的设计与功能实现
  • 【2024年华为OD机试】(C卷,100分)- 悄悄话 (Java JS PythonC/C++)
  • [Java]项目入门
  • 梧桐数据库半结构化json数据入库及解析
  • 深度学习中注意力机制介绍及seq2seq案例
  • Matlab自学笔记四十四:使用dateshift函数生成日期时间型序列数据
  • 58 基于 单片机的温湿度、光照、电压、电流检测
  • 解决跨域问题方案
  • 高级java每日一道面试题-2024年12月05日-JVM篇-什么是空闲列表?
  • vue中this指针获取不到函数或数据
  • Vue 鼠标滚轮缩放图片的实现
  • Kubernetes 常用操作大全:全面掌握 K8s 基础与进阶命令
  • 基于 Spring Boot + Vue 的宠物领养系统设计与实现
  • Java 初学者的第一个 SpringBoot 登录系统
  • CT中的2D、MPR、VR渲染、高级临床功能
  • 鸿蒙技术分享:❓❓[鸿蒙应用开发]怎么更好的管理模块生命周期?
  • 论文研读|信息科技风险管理模型的主要内容、定位、目标企业、风险管理机制, 以及相应的风险评估流程和风险应对策略
  • Spring Boot中实现JPA多数据源配置指南
  • 再谈多重签名与 MPC
  • sed流编辑器
  • 渤海证券基于互联网环境的漏洞主动防护方案探索与实践
  • 3. React Hooks:为什么你应该使用它们?