当前位置: 首页 > article >正文

免费在腾讯云Cloud Studio部署DeepSeek-R1大模型

2024年2月2日,腾讯云宣布DeepSeek-R1大模型正式支持一键部署至腾讯云HAI(高性能应用服务)。开发者仅需3分钟即可完成部署并调用模型,大幅简化了传统部署流程中买卡、装驱动、配网络、配存储、装环境、装框架、下载模型等繁琐步骤。通过腾讯云HAI,开发者只需两步即可轻松调用DeepSeek-R1大模型,显著提升了开发效率。

fb3f4304d620250208232304

国内云端AI算力平台对比

在国内云端AI算力平台中,百度飞桨AI Studio仅支持部署运行PaddlePaddle深度学习框架,而腾讯Cloud Studio则没有这一限制,且每月免费提供10000分钟的使用时长,支持随用随开、即时关闭,成为轻量化部署DeepSeek-R1的理想平台。此外,有传闻称腾讯可能是DeepSeek背后的重要股东,进一步凸显了双方合作的深度。

主流云端算力平台免费配额对比

目前,提供免费配额的主流云端算力平台包括Google Colab、Amazon SageMaker Studio Lab、Kaggle、Gradient、阿里云天池、百度AI Studio和腾讯Cloud Studio等。以下是各平台的主要特点:

  1. Google Colab:无总计使用时间限制,单次连续使用时间不超过12小时,提供多种GPU选项。

  2. Amazon SageMaker Studio Lab:提供Tesla T4 GPU(16GB显存),持久化存储空间15GB,每天运行时间不超过8小时,单次使用限制4小时。

  3. Kaggle:提供16GB显存的P100 GPU,每周总运行时间不超过40小时,单次限制6小时,持久化存储空间20GB。

  4. Gradient:提供8vCPU、30GB RAM和Quadro M4000 GPU(8GB显存),持久化存储空间仅5GB。

  5. Azure 100/Student:Microsoft Azure学生账户提供100美元赠金,可用于购买GPU算力资源,支持16GB或更大显存的Tesla T4 GPU及50GB持久化存储空间。

  6. 阿里云天池:提供总计60小时GPU使用时间,显存16GB,单次连续使用时间不超过8小时。

  7. 百度AI Studio:提供多种GPU选项,但仅支持PaddlePaddle框架,吸引力有限。

腾讯Cloud Studio的优势

腾讯Cloud Studio在免费配额方面表现尤为突出,按月赠送体验时长(配额),非常良心。Cloud Studio提供两类工作空间:

  1. 通用工作空间:免费版规格为1核处理器、2G存储(突发可使用内存)、4G系统空间,不消耗配额。额外资源使用月度3000分钟体验时长兑换。

  2. 高性能工作空间(HAI):每月赠送10000分钟体验时长,可兑换免费基础型高性能工作空间的使用(T4 16GB显存、32GB内存)。多个空间同时运行会叠加计时,体验时长用完后自动关机。

DeepSeek-R1:14B模型部署实战

腾讯 Cloud Studio 免费基础型使用 HAI 基础型高性能工作空间,默认免费搭配 80GB 云硬盘,包括 30GB 系统盘和 不到 50GB 的数据盘,结合免费的 HAI 基础型 GPU 资源 16GB 的显存,最高可以部署、运行 deepseek-R1 14B,相比本地部署一般都是 7B、8B 的版本,性能、体验更好,10000 分钟/月体验时长可以完成不少零碎的推理任务。

1. 登录腾讯Cloud Studio

访问 腾讯Cloud Studio官网并登录您的账号。

进入控制台,选择高性能工作空间(HAI),创建一个新的实例,选择 DeepSeek R1,就可以直接 部署好完整的 deepseek r1:7b。如果需要部署 14b,则可删除已有的 7b,加载运行 14b 模型即可。这里示例选择 olama,默认预置的 llama3 可在部署完成后删除。

fe245c62cb20250208233328

等待实例启动,部署完成之后显示“运行中”的提示。部署失败(显示“失效”)的原因多由于资源有限, 过于火爆导致缺少库存,可以删除后再重新部署,一般多尝试几次都可以部署成功。

356b7f188620250208233754

2. 删除预置模型(可选)

腾讯Cloud Studio默认预置了一些模型(如deepseek-r1:1.5b,deepseek-r1:7b),如果您不需要这些模型,可以通过以下命令删除:

ollama list # 查看已安装的模型

deepseek-r1:1.5b # 删除1.5b模型

deepseek-r1:1.5b # 删除7b模型

326562389720250208234345

3. 下载并运行DeepSeek-R1:14B模型

打开 终端(快捷键 Ctrl+~),输入以下命令下载并运行DeepSeek-R1:14B模型: 

ollama run deepseek-r1:14b

53fc6b409320250208234028

1b0901136f20250208234028

9286de80ab20250208234705

等待模 型下载完成。下载速度取决于网络带宽,腾讯Cloud Studio提供最高100Mbps的带宽,通常可以在几分钟内完成。

54106914e820250208234738

下载完成后,模型 会自动运行,并进入交互式对话模式。

6dde04e5d320250209005538

4. 常用命令

以下是一些常用的命令,帮助您更好地管理模型和会话:

  • 退出对话
    /bye
  • 清除上下文
    /clear
  • 查看GPU信息
    nvidia-smi
  • 查看存储空间
    df -h
  • 查看内存使用情况
    free -m
5. 内网穿透与WebUI接入

腾讯Cloud Studio不支持Docker,且未配置公网IP,需通过内网穿透工具(如Cloudflared)将DeepSeek发布至公网,以便接入WebUI。以下是具体步骤:

安装内网 穿透工具:使用Cloudflared或其他内网穿透工具(如Ngrok),本次使用Cloudflared,因为超级简单,缺点就是网速有点慢,但是不影响使用。

 安装Cloudflared,执行命令:

## 下载安装包

wget https://ghfast.top/https://github.com/cloudflare/cloudflared/releases/latest/download/cloudflared-linux-amd64.deb

## 安装

dpkg -i cloudflared-linux-amd64.deb

## 查看是否安装成功

cloudflared -v

6a161591d520250209003607

75076ed9ca20250209003607

查看 ollama  的端口号:

netstat -ntlp

 如果出现-bash: netstat: command not found错误时,需要安装netstat工 具:

sudo apt update # 更新软件包列表

sudo apt install net-tools # 安装 net-tools 工具包

d8b2dfd63020250209001901

65fd4e60e320250209002031

内网穿透:

cloudflared tunnel --url http://127.0.0.1:8434

58c7904b0820250209003942

439233694620250209003959

配置WebUI:将生 成的公网URL配置到WebUI中,即可通过浏览器访问DeepSeek-R1。

 9b50d2017e20250209005347

58d7402c8320250209005347

6. 注意事项
  • 实例创建失败:由于DeepSeek-R1模型火爆,腾讯的计算资源可能有限。如果创建实例失败,建议多次尝试或更换时间重新部署。

  • 存储空间管理:腾讯Cloud Studio提供80GB持久化存储空间(包括30GB系统盘和50GB数据盘),请定期清理不必要的文件以避免超额收费。

  • 网络流量:每月免费提供500GB公网流量,超出部分按0.8元/GB计费,请合理使用。


7. 性能优化
  • 多GPU支持:如果您有更高配置的硬件,可以尝试部署70B模型,以获得更强的性能。

  • 批量任务处理:通过脚本自动化调用DeepSeek-R1,提高任务处理效率。

  • 上下文管理:使用/clear命令定期清除上下文,避免模型输出偏差。


总结

腾讯Cloud Studio凭借其免费配额、高性能工作空间和极简部署流程,成为国内云端AI算力平台的佼佼者。对于开发者而言,腾讯云HAI与DeepSeek-R1的结合不仅降低了部署门槛,还显著提升了开发效率,是轻量化AI模型部署的理想选择。


http://www.kler.cn/a/542885.html

相关文章:

  • 【DuodooBMS】开源软件:利他也能赚钱,开源MES就是好例子
  • (一)Axure制作移动端登录页面
  • 基础入门-HTTP数据包红蓝队研判自定义构造请求方法请求头修改状态码判断
  • 网络安全溯源 思路 网络安全原理
  • Linux磁盘空间使用率100%(解决删除文件后还是显示100%)
  • C++ ——从C到C++
  • encodeURI(),encodeURIComponent()区别
  • AF3 gdt函数解读
  • nginx安装并部署前端项目【包括Linux与Windows系统】
  • 前端性能分析常见内容
  • C语言蓝桥杯1003: [编程入门]密码破译
  • 香港中文大学 Adobe 推出 MotionCanvas:开启用户掌控的电影级图像视频创意之旅。
  • 基于Springboot(Maven项目)——分页
  • 在 debian 12 上安装 mysqlclient 报错
  • 代码随想录--977有序数组的平方
  • Java Stream 全面解析
  • 使用EVE-NG-锐捷实现三层数据通信
  • 曝苹果2026年秋季推首款折叠iPhone
  • Git 安全与权限管理
  • 深入探索现代CSS:从基础到未来趋势
  • 128,【1】buuctf [极客大挑战 2019]PHP
  • 浅谈自己对RPC的理解
  • AspectJ 下 Advisor 的排序过程
  • untiy3d 触发和碰撞区别
  • innovus如何分步长func和dft时钟
  • MacBook Pro M2安装deepseek