当前位置: 首页 > article >正文

昇思25天学习打卡营第33天|共赴算力时代

在这里插入图片描述

文章目录

    • 一、平台简介
    • 二、深度学习模型
      • 2.1 处理数据集
      • 2.2 模型训练
      • 2.3 加载模型
    • 三、共赴算力时代

一、平台简介

昇思大模型平台,就像是AI学习者和开发者的超级基地,这里不仅提供丰富的项目、模型和大模型体验,还有一大堆经典数据集任你挑。

AI学习有时候就像找不到高质量数据集的捉迷藏游戏,而且本地跑大数据集训练模型简直是个折磨,昇思大模型平台不仅帮助解决这些难题,还能支持各种业务场景,让你的开发轻松 更加顺畅和高效 。

在这里插入图片描述

二、深度学习模型

2.1 处理数据集

MindSpore有一个基于Pipeline的数据引擎,能够通过数据集(Dataset)和数据转换(Transforms)高效地预处理数据。

MindSpore的dataset使用数据处理流水线,需要指定一些操作,比如mapbatchshuffle等。在例子中,使用map来对图像数据和标签进行变换处理,然后把处理好的数据集打包成大小为64的一组(batch)。

在这里插入图片描述

2.2 模型训练

在模型训练时,一般要经历三个关键步骤:

  1. 正向计算,就像烤蛋糕一样,模型预测结果(logits)并与正确标签(label)比较,求出预测损失(loss)。
  2. 反向传播,这就像魔术师的把戏,利用MindSpore的自动微分机制,神奇地求出模型参数(parameters)对损失(loss)的梯度(gradients)。
  3. 参数优化,就像更新软件一样,把梯度应用到参数上,让模型变得更聪明。

训练过程需要多次迭代数据集,每次完整的迭代称为一轮(epoch)。每一轮中,你会遍历训练集进行训练,然后用测试集来预测。打印每一轮的损失值和准确率(Accuracy),可以清楚地看到损失在逐步减少,准确率在不断提高。

在这里插入图片描述

2.3 加载模型

加载保存的权重有点像穿衣服 ,重新实例化模型对象 ,就像给模型穿上新衣服一样,把模型给建构起来 ,需要加载模型参数,把保存的“衣服”穿到模型身上。一旦加载完毕,这个模型就可以直接投入战斗,进行预测和推理了。

在这里插入图片描述

三、共赴算力时代

在这次深切的体验中,我真切感受到了算力的力量和影响。算力不仅仅是提速和效率的象征,它是一种解放,让我们从过去的技术瓶颈中解脱出来。可以更快速地进行模型训练和推理,不再受限于硬件性能的局限。在算力时代,看到了技术发展的前沿。每一次的技术进步,每一次新技术的应用都为我们的工作和生活带来了新的可能性。

作为一个从事技术工作的程序员,体验到了这种变革带来的深远影响,不仅仅在追赶技术的进步,更是在引领未来的发展方向。算力不仅是我们工作的工具,更是我们探索未知、创造新事物的动力源泉。

在这个充满挑战和机遇的时代,我期待着能够与时俱进,不断学习和应用最新的技术,为创新和发展贡献自己的力量。

凡事皆有极困难之时,打得通,便是好汉


http://www.kler.cn/a/289093.html

相关文章:

  • 开源模型应用落地-qwen模型小试-Qwen2.5-7B-Instruct-tool usage入门-集成心知天气(二)
  • 实现 MVC 模式
  • ubuntu中apt-get的默认安装路径。安装、卸载以及查看的方法总结
  • GxtWaitCursor:Qt下基于RAII的鼠标等待光标类
  • Sigrity SPEED2000 Power Ground Noise Simulation模式如何查看PDS系统的自阻抗操作指导
  • 【C++】C++11特性(上)
  • 双指针(1)_数组分块_移动零问题
  • 0903,LIST(merge,splice,sort,unique),SET(insert,erase)
  • Codeforces Round (Div.3) C.Sort (前缀和的应用)
  • uniapp上传文件时用到的api是什么?格式是什么?
  • 如何从 Mac 上清空的垃圾箱中恢复误删除的文件
  • linux find 之 文件、时间、权限、深度、删除
  • Android在子线程中更新UI
  • Java导出图片到excel
  • 【算法】贪心算法解析:基本概念、策略证明与代码例题演示
  • ARM汇编指令
  • Pandas 2-读取文件
  • CSRF 概念及防护机制
  • 3D幻想空间:Scratch中探索虚拟世界的奥秘
  • 【量化分析】Python、JavaScript(Node.js)、Java、C#和Ruby五种主流语言的实例代码给大家演示一下如何获取股票实时交易数据
  • 深入理解MySQL慢查询优化(2) -- SQL的执行流程
  • OCI编程高级篇(十八) OCI连接池概念
  • 如何打造一个成功的直播矩阵
  • 【科研新人必看】什么是期刊等级,SCI、核心期刊、省刊
  • qt6 socket 不使用代理 socket error: The proxy type is invalid for this operation
  • 8.29 C++