当前位置: 首页 > article >正文

AI-ANNE:探索型神经网络——将深度学习模型转移到微控制器和嵌入式系统

论文标题

  • 英文:AI-ANNE: (A) (N)eural (N)et for (E)xploration - Transferring Deep Learning Models onto Microcontrollers and Embedded Systems
  • 中文:AI-ANNE:探索型神经网络——将深度学习模型转移到微控制器和嵌入式系统

作者信息

Dennis Klinkhammer

论文出处

arXiv:2501.03256v1 [cs.LG] 1 Jan 2025

摘要

本文探讨了将神经网络集成到资源受限的嵌入式系统,如树莓派Pico / 树莓派Pico 2。通过TinyML方法,将神经网络直接转移到这些微控制器上,实现实时、低延迟、节能的推理,同时保护数据隐私。文章介绍了AI-ANNE:探索型神经网络,它有助于将预训练模型从高性能平台(如TensorFlow和Keras)转移到微控制器,使用轻量级编程语言MicroPython。该方法展示了如何在MicroPython中实现神经网络架构,包括神经元、层、密度和激活函数,以应对嵌入式系统的计算限制。基于树莓派Pico / 树莓派Pico 2,文章展示了两个不同的微控制器上的神经网络,用于数据分类示例。此外,这种微控制器还可用于状态监测,根据传感器数据触发即时纠正措施。总体而言,本文提供了一种在节能设备(如微控制器)上使用神经网络的易于实施的方法,使AI-ANNE不仅适用于实际应用,还作为了解神经网络运作的教育工具。

1. 引言

随着机器学习和深度学习在各个领域的创新推动,TinyML趋势将这些能力推向数据源附近,尤其在微控制器和物联网设备中表现突出。TinyML相较于基于云端的人工智能,具有数据隐私更好、处理延迟更低、能源效率更高和对连接依赖性更低等优势。TinyML的关键应用之一是在状态监测中,神经网络可用于在传感器内直接检测异常,以便自动采取即时纠正措施。然而,许多高性能框架(如TensorFlow和Keras)是为强大硬件(如GPU)设计的,不适合计算资源有限的嵌入式系统。因此,需要用轻量级编程语言(如MicroPython)重构神经网络架构,以便将训练好的神经网络转移到资源受限的设备(如微控制器)上,同时实现相同的输出和结果。直接在嵌入式系统上训练或开发神经网络仍然是一个复杂挑战,AIfES(面向嵌入式系统的AI)在这方面已取得初步成功。

2. 需求

树莓派Pico / 树莓派Pico 2

树莓派Pico由RP2040微控制器驱动,具有双核ARM Cortex-M0+处理器,运行频率133MHz,拥有264KB片上SRAM和2MB板载闪存。它提供多种连接选项,包括USB供电和数据传输,多达两个I2C、SPI和UART接口用于通信,以及16个PWM通道用于精确控制外部设备。该板还包含三个12位ADC通道用于模拟输入,并支持多种外围设备。2024年推出的树莓派Pico 2由RP2350微控制器驱动,具有双核ARM Cortex-M33处理器,运行频率150MHz,拥有520KB片上SRAM和4MB板载闪存。两者均可运行MicroPython,建议在实际应用中使用树莓派Pico 2,而树莓派Pico可能足以用于教育目的。

MicroPython

MicroPython是针对微控制器和资源受限的嵌入式系统的Python编程语言的高效、轻量级实现。它针对小型设备的内存和处理限制进行了优化,提供了简化版的解释器和Python标准库的子集。MicroPython保留了Python的大部分高级语法和易用性,适合在资源有限的嵌入式平台上快速原型设计、开发和部署机器学习和神经网络模型。

Thonny

Thonny是一个简单易用的程序,可在所有主要计算机系统上运行。它便于与树莓派Pico / 树莓派Pico 2连接和编程。Thonny使用户能够快速编写和测试代码,管理文件,并借助有用工具修复错误。它是刚开始在微控制器和嵌入式系统上使用MicroPython的用户的工具。通过Thonny,可以轻松地将AI-ANNE刷入微控制器。

3. 基础知识

神经网络架构

神经网络是受生物神经系统处理信息方式启发的计算模型。它由相互连接的节点层(神经元)组成,通过一系列数学运算将输入数据转换为输出预测。在MicroPython中实现神经网络时,架构必须设计为在嵌入式系统的资源限制内运行。尽管存在这些限制,但神经网络的基本组成部分——神经元、层、密度和激活函数——仍然可以有效建模。

a) 神经元

神经网络中的神经元是计算单元,接收输入,对每个输入应用权重,对加权输入求和,并将结果通过激活函数传递以产生输出。在MicroPython中,每个神经元可以表示为涉及输入和权重的数学运算,输出通过简单的矩阵运算计算。

b) 层

典型的神经网络架构由一系列层组成,每层包含多个神经元。主要有三种类型的层:

  • 输入层:网络的第一层,接收原始输入数据。输入层的每个神经元对应输入数据的一个特征。
  • 隐藏层:输入层和输出层之间可能包含一个或多个隐藏层。这些层负责学习输入数据的复杂表示。
  • 输出层:网络的最后一层,产生预测或分类结果。输出层的结构取决于所解决的问题。

MicroPython可以将层表示为神经元的列表(或数组),其中每个元素存储相应层的神经元的权重、偏置和输出。

c) 密度

层的密度指的是该层中的神经元数量。在全连接(密集)层中,当前层的每个神经元都连接到前一层的所有神经元。这是神经网络中最常见的配置。例如,在一个有5个神经元的密集层中,该层的每个神经元都从前一层的所有神经元接收输入,并且该层将包含5组权重和偏置,这些将在训练过程中学习。MicroPython可以使用矩阵乘法高效地实现密集层。

d) 激活函数

激活函数决定神经元是否应该激活,以便将神经元的输出传递到下一层。激活函数引入了网络的非线性,使其能够学习数据中的复杂模式。常见的激活函数包括:

  • Sigmoid:输出值在0和1之间,常用于二分类任务。
  • ReLU(修正线性单元):如果输入为正,则直接输出输入;否则输出零。它因其简单性和防止梯度消失的效率而在隐藏层中广泛使用。
  • Leaky ReLU:Leaky ReLU激活函数是传统ReLU激活函数的变体,解决了“死亡ReLU”问题。当输入为负时,输出是一个小的负值,参数alpha控制这个负区域的斜率。
  • Tanh:双曲正切函数Tanh输出值在-1和1之间。它与Sigmoid类似,但输出范围更广,适用于需要网络模拟正负值的应用。
  • Softmax:通常用于分类网络的输出层,Softmax函数将输出标准化,以产生多个类别的概率分布。

在MicroPython中,这些激活函数可以作为简单函数实现,利用MicroPython的内置数学库。鉴于嵌入式设备的计算限制,选择轻量级激活函数(如ReLU)很重要,以避免Sigmoid或Tanh中使用的更昂贵的指数运算。AI-ANNE通过层传递数据,每个神经元的输出基于输入和权重计算。在MicroPython环境中,由于处理能力和内存有限,可能更倾向于较小的网络,具有较少的层和神经元,并且可以在部署到嵌入式设备之前在更强大的系统上进行训练。

e) 权重和偏置

在神经网络中,权重和偏置是模型在训练过程中学习的关键参数,以做出准确预测。权重是调整输入值的参数,它们决定了相邻层神经元之间连接的强度。每个连接都有自己的权重,该权重的值影响前一层的输入对当前层输出的影响程度。从数学上讲,如果一个神经元接收到输入x,其对应的权重是w,那么该输入对神经元输出的贡献是w * x。权重在训练过程中通过优化技术(如梯度下降)进行调整,以最小化模型的预测误差。偏置则允许模型独立于输入的加权和移动输出。它们在通过激活函数之前被添加到加权和中。这使得网络能够更好地模拟数据中的复杂关系,通过移动激活函数的阈值。例如,如果一个神经元的输入加权和表示为z = w * x + b,偏置项b移动输出,使模型能够更有效地学习。像权重一样,偏置也在训练过程中学习。

混淆矩阵

混淆矩阵就像一个记分牌,显示神经网络在

做出预测方面的表现如何。它特别适用于分类问题,目标是将项目分配到类别中。对于二分类问题,混淆矩阵可以是一个两行两列的表格。每个单元格都告诉模型的预测与实际结果相比的一些情况,可以解释为:

  • 真正例(TP):模型正确预测了正类。
  • 真负例(TN):模型正确预测了负类。
  • 假正例(FP):模型错误地预测了正类(I型错误)。
  • 假负例(FN):模型错误地预测了负类(II型错误)。

可以根据此计算神经网络预测的准确率。准确率作为一个百分比指标,提供了模型总体正确率的信息。下面是一个混淆矩阵的例子(表1),实际值在行中,预测值在列中:

实际/预测预测正例预测负例
实际正例9.001.00
实际负例0.0010.00

在这个二分类中,正类中有9.00个被正确分类,1.00个被错误分类(II型错误)。相应地,负类中有10.00个被正确分类,0.00个被错误分类。这导致准确率为95%(19.00 / 20.00 = 0.95),基于下面介绍的具有6个神经元的神经网络的第二个应用示例。除了这个指标外,还有其他用于评估神经网络的指标,例如精确度、召回率和F1分数。对于这个示例和作为AI-ANNE:探索型神经网络的基本介绍,关注准确率就足够了。

4. 应用示例

二分类

IRIS数据集是统计学、机器学习和深度学习中广泛认可的数据集,常用于分类问题。由英国生物学家和统计学家罗纳德·A·费舍尔于1936年引入,包含150个鸢尾花实例,每个实例都有四个属性描述其物理特征。这些属性包括萼片长度、萼片宽度、花瓣长度和花瓣宽度,均以厘米为单位测量。

基于这四个属性,数据集的目标是将每朵花分类为三个物种之一:Setosa、Versicolor和Virginica。IRIS数据集作为演示和测试机器学习算法和神经网络(深度学习模型)的理想示例,尤其是在分类任务中。其易于管理的大小、类别之间的清晰区分和简单的性质使其成为探索分类技术的流行选择。然而,由于Versicolor和Virginica的特征重叠,对某些机器学习算法和神经网络(深度学习模型)来说,对这些物种进行分类可能具有挑战性,使任务更加复杂。

在预安装的示例中,AI-ANNE:探索型神经网络被委托对Versicolor和Virginica进行分类。结果将呈现为之前作为准确率的百分比。

8个神经元的解决方案

首先,必须将TensorFlow和Keras预训练的权重和偏置转移到微控制器上。具有8个神经元的神经网络的权重和偏置需要以特定顺序用MicroPython编码(表2)。第一层,即输入层,包含两个神经元,处理IRIS数据集的四个自变量的输入。权重w1相应地用两列四行在MicroPython中编码。两个神经元相应地被赋予两个偏置b1。其他层的神经元数量的权重和偏置也相应编码:第一隐藏层有三个神经元,第二隐藏层有两个神经元,输出层有一个神经元。

在TensorFlow和Keras的预训练中,输入层使用ReLU激活函数,第一隐藏层使用Tanh,第二隐藏层使用Softmax,输出层使用Sigmoid。在MicroPython中(表3),用户可以选择更改神经元数量、层数以及使用的激活函数,相应的代码如下:

6个神经元的解决方案

接下来的神经网络在神经元数量、层数和使用的激活函数上有所不同。这次输入层有三个神经元(表4)。相应地,神经元的权重w1用三列四行编码,这来自IRIS数据集的四个自变量。这次需要添加三个偏置b1。隐藏层和输出层的代码也相应编写,因此输出层再次有一个神经元用于二分类。

这次,在TensorFlow和Keras的预训练中,输入层使用ReLU激活函数,隐藏层和输出层使用Sigmoid激活函数。这导致了以下MicroPython中的代码(表5):

这导致准确率为95%,这里也可以进行灵活调整。两个示例的不同准确率展示了神经元和层数以及使用的激活函数的重要性。在这种情况下,更简单的神经网络似乎更合适。

5. 总结

本文探讨了使用TinyML方法将神经网络集成到资源受限的微控制器和嵌入式系统(如树莓派Pico和树莓派Pico 2)上。这种方法使得神经网络能够直接部署到微控制器上,提供实时、低延迟、节能的推理,同时确保数据隐私。为此,介绍了AI-ANNE:探索型神经网络,这是一个开源框架,有助于将预训练模型从高性能平台(如TensorFlow和Keras)转移到微控制器,使用MicroPython作为轻量级和透明的编程语言。该方法展示了如何在MicroPython中实现关键神经网络组件,如神经元、层、密度和激活函数,以应对微控制器和嵌入式系统的计算限制。文章展示了两个神经网络示例,一个有8个神经元分布在4层,另一个有6个神经元分布在3层。

总体而言,本文提供了一种在节能设备(如微控制器)上部署神经网络的简单实用方法,以及它们如何用于实际应用或作为教育工具,深入了解深度学习模型的底层技术和编程技巧。AI-ANNE:探索型神经网络是一个开源项目。

附录

A) MicroPython中的数学基础

这些数学基础使矩阵乘法和其他对神经网络架构重要的操作成为可能。因此,代码(表A)不需要在MicroPython中进行调整!

B) MicroPython中的激活函数

以下代码(表B)演示了如何在MicroPython中编程Sigmoid、ReLU、Leaky ReLU、Tanh和Softmax激活函数。在TensorFlow和Keras中,这些已经预先编程好了,在MicroPython中需要手动编程。可以相应地添加其他激活函数。

C) MicroPython中的神经元

预定义的激活函数Sigmoid、ReLU、Leaky ReLU、Tanh和Softmax已经为MicroPython中的每个神经元预先编程(表C)。独立添加的激活函数必须相应添加。

D) 德国免费软件许可证

AI-ANNE:探索型神经网络和KI-ENNA:探索型神经网络可以根据德国免费软件许可证的条款由任何人使用。德国免费软件许可证(Deutsche Freie Software Lizenz)是一种开源性质的许可证,与GNU GPL具有相同的风味,但受德国法律管辖。这使得该许可证容易被德国当局接受。D-FSL有德语和英语版本,两者具有同等约束力,可在以下网址获取:Digital Trend


http://www.kler.cn/a/503868.html

相关文章:

  • Golang 设计模式
  • 学英语学Elasticsearch:04 Elastic integrations 工具箱实现对第三方数据源的采集、存储、可视化,开箱即用
  • Android 对接口的封装使用
  • Qiskit快速编程探索(进阶篇)
  • ClickHouse大数据准实时更新
  • 《探索鸿蒙Next上开发人工智能游戏应用的技术难点》
  • 【网络云SRE运维开发】2025第2周-每日【2025/01/11】小测-【第11章NAT理论和实操考试】解析和参考
  • 中国地面气候资料日值数据集(V3.0)格式和下载说明
  • 【深度学习】核心概念-数据驱动(Data-Driven)
  • 详解C#的文件写入和读取:从基础到高级应用
  • 初识JAVA-面向对象的三大特征之多态
  • DS1302模块学习笔记
  • 【gin】http方法了解,以及RESTful API与版本控制
  • [IGP]ospf ip frr 快速重路由技术
  • 认识微服务
  • 文本在屏幕上自由游动
  • 求矩阵不靠边元素之和(PTA)C语言
  • 用 Python 处理 CSV 和 Excel 文件
  • 构建云原生后端服务——以Spring Boot + Kubernetes为例
  • 《语言模型的新型推理范式:基于链式思考与强化学习的突破》
  • 量子计算:从薛定谔的猫到你的生活
  • hive知识体系
  • ubuntu22.04安装注意点
  • 力扣 全排列
  • ros2笔记-6.5 使用ros2_control驱动机器人
  • iOS 逆向学习 - Inter-Process Communication:进程间通信