面向可信和节能的雾计算医疗决策支持系统的优化微型机器学习与可解释人工智能
这篇论文的标题为《Optimized Tiny Machine Learning and Explainable AI for Trustable and Energy-Efficient Fog-Enabled Healthcare Decision Support System》,发表在《International Journal of Computational Intelligence Systems》2024年第17卷,由 R. Arthi 和 S. Krishnaveni 两位作者撰写。以下是论文的主要内容概述:
摘要:
- 论文讨论了基于物联网(IoT)的医疗决策支持系统在现代医学中的重要性,尤其是在慢性病和老年人口增加的背景下。
- 当前医疗决策支持系统因实时医疗数据有限和计算资源效率不高而难以及时准确地做出决策。
- 论文提出了一个优化的微型机器学习(TinyML)和可解释人工智能(XAI)二分类模型,用于在雾计算环境中实现可信和节能的医疗决策支持系统。
- 该模型利用雾计算优化性能,提高了响应时间和带宽利用率,减少了延迟和数据包丢失。
- 通过实施TinyML算法,系统在健康异常检测中表现出色,F1得分达到0.93,强调了其鲁棒性和有效性。
关键词:
- 医疗保健
- 雾计算
- 物联网
- TinyML
- 可解释人工智能
1. 引言:
- 论文介绍了基于IoT的医疗决策支持系统的重要性,并讨论了雾计算和云计算的集成如何提供有效的框架来管理和分析大量医疗数据。
2. 相关工作:
- 论文回顾了当前基于IoT的医疗监控系统的研究,并讨论了TinyML在这些系统中的应用。
3. 提出的方法:
论文中提出的方法是构建一个基于雾计算的医疗决策支持系统,该系统利用优化的微型机器学习(TinyML)和可解释人工智能(XAI)技术,以实现对患者健康状况的实时监控和及时响应。以下是该方法的详细步骤:
3.1 数据收集
在边缘层,提出了一个基于硬件的人类健康决策支持系统,包括以下组件:
- MAX30102传感器:用于非侵入式地监测脉搏率和血氧水平。
- DHT11传感器:测量患者房间的湿度和温度。
- MQ-135气体传感器:检测患者周围的有毒气体,如一氧化碳、甲烷、硫化氢等,并测量室内空气质量。
所有传感器都连接到Arduino Uno R3微控制器,该控制器负责采集传感器数据,并通过Wi-Fi模块与雾和云层通信。系统功耗在100-200毫瓦之间,最大内存使用量为15kb。
3.2 雾基础决策支持系统
数据从微控制器传输到云存储,通过雾层传输。研究中使用Raspberry Pi 3来设置边缘和云层之间的雾节点。当患者的健康数据偏离预设阈值时,Raspberry Pi 3节点会通过移动应用程序向患者的五个密切联系人发送通知。Raspberry Pi 3处理器提供高数据处理和通信能力,非常适合用作虚拟雾层中的雾节点。
3.3 数据存储和分析
来自边缘层的数据被传输到云存储,以便可视化数据并分析与预设阈值的偏差。使用ESP8266 Node MCU Wi-Fi模块将IoT云平台与所提出的硬件连接。数据通过Thing Speak IoT云平台进行存储和可视化。
3.4 优化的TinyML算法实施
- 数据采集:在Edge Impulse Web界面中创建项目,设置数据类型和项目详细信息。
- 数据预处理:使用数字信号处理(DSP)技术对传感器数据进行滤波,以去除噪声和伪影。应用了包括带通、低通、高通和陷波滤波器。
- 特征提取:使用傅里叶变换、统计矩、小波变换和时域信号分析等技术,将原始传感器数据转换为模型可以有效学习的特征。
- 降维和分割:使用主成分分析(PCA)减少数据的维度,同时保留关键信息。此外,使用窗口和分割技术将长序列划分为更易于管理的片段。
- 模型训练和优化:使用TensorFlow Lite定义并训练随机森林模型,然后将训练好的模型转换为TensorFlow Lite格式,以确保与边缘设备的兼容性和优化。
- 模型验证和性能:使用径向基函数(RBF)核验证TensorFlow Lite模型的预测,确保模型在实际场景中的鲁棒性和可信度。
论文提出的系统通过上述方法,实现了在雾计算环境中对患者健康状况的实时监控和及时响应,提高了医疗决策支持系统的效率和可靠性。
4. 优化的TinyML算法实现:
论文中提出的优化的TinyML算法实现是整个研究的核心部分,旨在通过在资源受限的IoT设备上部署高效的机器学习模型来提高医疗决策支持系统的准确性和响应速度。以下是该算法实现的详细步骤和方法:
4.1 数据采集
- 在Edge Impulse平台中创建项目,定义数据类型和项目细节。
- 数据采集不使用实时分类,而是从云端以CSV格式上传预先存储的数据。
- 配置分类模式为学习块,原始数据为处理块,设置频率为1 Hz,窗口大小为1000毫秒。
4.2 数据预处理
- 利用Edge Impulse内置的数字信号处理(DSP)功能对信号进行滤波,以去除噪声和伪影。
- 应用带通、低通、高通和陷波滤波器来增强感兴趣的信号并消除不需要的频率。
- 进行归一化处理,使用可配置的缩放设置、z分数归一化和最小-最大缩放技术,将不同传感器数据范围缩放到一个共同的尺度。
4.3 特征提取
- 利用傅里叶变换、统计矩、小波变换和时域信号分析等方法,从原始传感器数据中提取特征。
- 这些技术捕捉数据的重要特征,通过关注相关特征来提高模型的性能。
4.4 降维和分割
- 为了解决高维传感器数据带来的挑战(如过拟合和计算复杂性增加),采用主成分分析(PCA)来降低数据的维度,同时保留关键信息。
- PCA通过计算协方差矩阵的特征向量和特征值,将数据投影到保留最大方差的较低维子空间。
- 使用窗口技术和分割技术将长序列划分为更易管理的片段,帮助模型捕捉局部模式和数据中的依赖性。
4.5 模型训练和优化
- 训练优化的TinyML模型,使用TensorFlow Lite进行特征选择和模型训练。
- 定义并训练随机森林模型,然后将模型转换为TensorFlow Lite格式,进行系列步骤确保模型兼容并优化以部署在边缘设备上。
- 使用TensorFlow Lite的默认优化设置进行模型优化,并加载解释器来运行模型。
4.6 模型验证和性能
- 验证TensorFlow Lite模型的预测,使用径向基函数(RBF)核来验证模型的鲁棒性和可信度。
- 通过模型的输出数据验证,确保模型在实际应用场景中的有效性。
4.7 数学基础
- 利用神经网络架构和密集层进行TinyML模型的训练,采用反向传播、梯度下降、ReLU激活函数和主成分分析(PCA)等方法。
- 预处理步骤包括滤波和归一化,这些是信号处理中的基本操作,确保输入到神经网络的数据是清洁和标准化的。
4.8 特征提取的数学公式
- 信号滤波:应用数字信号处理(DSP)技术来去除传感器数据中的噪声和伪影。
- 归一化:将数据缩放到一个共同的范围,例如使用z分数归一化。
- 特征提取方法:如傅里叶变换和统计矩,从原始传感器数据中导出有意义的表示形式。
通过上述步骤,论文提出的TinyML算法能够在资源受限的IoT设备上实现高效的健康监测和异常检测,为医疗决策支持系统提供了一个可靠和节能的解决方案。
5. 结果和讨论:
- 论文评估了所提出的医疗系统,包括硬件设置性能分析、带宽分析、响应时间分析以及与标准机器学习模型的性能比较。
6. 所提出模型的可信度分析:
- 论文通过模型特异性和敏感性、统计分析、SHAP XAI特征重要性分析以及特征Wasserstein距离计算等方法来检查所提出模型的可靠性。
7. 结论:
- 论文总结了研究的主要发现,提出了优化的TinyML和XAI模型在雾计算环境中用于医疗决策支持系统的潜力,并指出了未来研究的方向。
作者贡献、资金支持、数据可用性、利益冲突声明、伦理批准、开放获取声明和参考文献:
- 论文最后包含了作者贡献声明、资金支持信息、数据可用性声明、利益冲突声明、伦理批准声明、开放获取声明和参考文献列表。
这篇论文的主要贡献在于提出了一个结合了TinyML和XAI的医疗决策支持系统,该系统在雾计算环境中运行,旨在提高医疗保健服务的效率和可靠性。论文还对模型的可信度进行了深入分析,以确保其在实际医疗场景中的有效性和准确性。