老年认知衰弱分类模型在临床即时检测系统中的应用
论文标题:Cognitive Frailty Classification Models for Older Adults in a Point-of-Care System(老年认知衰弱分类模型在临床即时检测系统中的应用)
作者信息:
- Lei Cao, Yang Wei Lim, Maw Pin Tan, Fakhrul Zaman Rokhani
-
- 计算机与通信系统工程系,工程学部,马来西亚博特拉大学,雪兰莪,马来西亚
-
- 医学系,医学学部,马来亚大学,吉隆坡,马来西亚
- 电子邮件:gs65400@student.upm.edu.my, limyangwei@upm.edu.my, mptan@ummc.edu.my, fzr@upm.edu.my
论文出处:2024 IEEE Asia Pacific Conference on Circuits and Systems (APCCAS)
主要内容:
摘要: 认知衰弱(Cognitive Frailty, CF)是老年人中普遍存在的一种状况,它结合了身体衰弱和认知障碍,并增加了不良健康结果的风险。目前对CF的诊断过程通常基于医院,并不适用于所有患者,导致及时有效诊断的缺口。为了解决这一问题,本文提出了一个利用芯片实验室(Lab-on-a-Chip, LOC)技术和安卓设备上的微型机器学习(TinyML)能力的临床即时检测(Point-of-Care, POC)系统,用于自动收集血液和尿液样本以及实时CF评估。本文还提出了一种基于机器学习(ML)的CF分类的特征选择技术,通过使用多种统计测试方法来提高ML模型的准确性。结果表明,通过先进的机器学习模型显著提高了CF分类的准确性,关键模型如线性判别分析(Linear Discriminant Analysis, LDA)、高斯朴素贝叶斯(Gaussian Naive Bayes, GNB)和支持向量机(Support Vector Machines, SVM)的准确率超过70%。这一创新系统提高了在远程或资源有限环境中诊断CF的可及性和效率。
引言: 老年人更容易受到环境和生活方式因素影响的健康问题。认知衰弱(CF)包括身体衰弱和认知障碍,与共病和不良结果的风险增加有关。目前对老年人CF的诊断通常在医院环境中进行,依赖于耗时且并不总是适用于所有患者的医院程序。转向POC系统,为CF提供现场诊断和管理,具有增强的诊断能力,对资源配置有重要影响。这些系统通过在患者所在地直接提供医疗保健来提高可及性和效率。系统还应包含更智能和更快的诊断CF的方法,使用ML方法。
POC系统用于CF分类: 本文描述的POC系统包括三个组成部分:数据收集系统、数据计算和CF的ML模型。这些组件集成在一起,以促进老年人自我收集、传输和分析临床数据。该系统的实施利用先进技术在各种环境中提供可靠的诊断,特别是对远程或资源有限环境中的人群有益。
数据收集系统: 数据收集系统负责老年人自动收集血液和尿液样本。这些样本使用LOC设备进行分析,以获得MELoR研究所需的各种参数。多个LOC设备被用来获取必要的参数。例如,基于聚吡咯纳米管的阻抗生物传感器可以测量血清叶酸水平,HemoCue WBC DIFF提供中性粒细胞计数和淋巴细胞计数数据,i-STAT用于测量钠、钾、pH和氯,Fraunhofer维生素D LOC用于快速检测25-羟基维生素D,CardioChek Plus Analyzer用于实时参考和复杂的生物分子测定,包括同型半胱氨酸分析,HemoCue Hb 201系统用于快速测量C反应蛋白水平,HemoCue系统还提供即时血红蛋白测量,这也可以用来估算与压积(PCV)密切相关的红细胞压积值。
数据计算: 数据计算包括处理收集到的数据的各种方法,包括云服务、边缘计算(如在智能手机上运行ML模型)和专用计算机。LOC设备的数据可以通过WiFi、蓝牙、USB连接或云数据上传传输到数据计算组件。在边缘计算设备(即智能手机)上,接收到的数据可以使用TinyML模型进行本地处理。为了在智能手机上使用TinyML执行ML模型,模型首先被训练并转换为轻量级格式,如ONNX。然后,使用移动优化的推理引擎(如ONNX Runtime或Core ML for iOS)将模型部署到智能手机上。推理代码使用Android NDK或iOS的Core ML框架等框架在移动应用中实现,确保在资源受限的设备上高效执行。
ML模型用于CF分类: 在这项研究中,使用不同的ML模型进行了七项实验,以优化CF的分类准确性。通过交叉验证和评估指标确定最佳模型,然后将该模型部署在TinyML上,以便在边缘设备上进行实时分析,提高诊断过程的效率和准确性。
ML模型开发: A. 数据清理和标记:本研究的数据来源是马来西亚老年人纵向研究(MELoR)项目,这是一个由马来亚大学开展的社区研究项目。MELoR研究探讨了马来西亚老年人的健康、身体、环境、社会、法律、经济、教育和心理问题。本文关注MELoR研究中收集的血液和尿液数据。将老年参与者的健康状况分为CF谱系中的六个类别:健壮、仅前衰弱、仅衰弱、仅轻度认知障碍(MCI)、前衰弱+MCI和衰弱+MCI。数据集清理了一些缺失值(或NaN),根据[5]中的工作,通过删除缺失值的样本来处理。实验中,类别进一步分为两类:“健壮”和“非健壮”健康状况。将表明不健康的五个类别(仅前衰弱、仅衰弱、仅MCI、前衰弱+MCI和衰弱+MCI)合并到“非健壮”类别下。 B. 特征选择:为了提高与[5]中先前方法相比的ML模型的准确性,本文提出了使用统计测试方法的特征选择技术,以选择与CF分类相关的临床指标。首先进行单变量分析,然后进行二元逻辑回归分析,以从血液和尿液样本中识别影响健壮CF状态的临床指标。使用SPSS 25.0版执行统计分析。然后,将二元逻辑回归分析的结果离散化为多个级别,以提高模型准确性。
- 单变量分析:在单变量分析中,Kolmogorov-Smirnov(K-S)测试评估连续变量的正态性,而卡方(χ2)测试分析分类变量。对于K-S测试分析,正态分布的变量进一步使用独立样本t检验进行分析。相比之下,对于非正态分布的变量使用Wilcoxon秩和检验。
- 二元逻辑回归分析:对单变量分析中显著的连续变量进行二元逻辑回归分析。七个临床指标(叶酸、中性粒细胞计数、钾、氯、C反应蛋白、尿液pH和年龄)被纳入分类模型,P < 0.05。低血清叶酸水平与增加的CF风险和降低的认知表现有关。中性粒细胞功能障碍也与CF有关,但很少有研究考虑总中性粒细胞计数,这是一个更容易测量的参数,中性粒细胞计数被发现与衰弱有关。钾失衡与更高的衰弱评分相关,表明电解质失衡在衰弱中的作用。氯缺乏与认知障碍和衰弱有关。C反应蛋白(CRP)水平升高表明全身炎症,这两者在认知衰退和衰弱中都已被令人信服地证明。高尿液pH水平与认知衰弱有关,表明全身碱中毒对认知衰退的影响。年龄较大的人由于生理和神经衰退而与增加的认知衰弱有关。 C. 机器学习算法:本研究中用于机器学习模型的变量来自三个不同的来源。首先,七个指标(血清叶酸、CRP、钾、氯、总外周血中性粒细胞计数、尿液pH和年龄)是连续的,具有小数点的值。其次,来自表III的指标被离散化为0和正整数的值。第三,来自表IV的指标被离散化为0、1和-1的值。这些不同格式的变量被集体用作七个分类机器学习模型的输入:逻辑回归、线性判别分析(LDA)、k最近邻(kNN)、分类和回归树(CART)、高斯朴素贝叶斯(GNB)、支持向量机(SVM)和随机森林分类器(RFC)。
结果与讨论: 本研究的原始数据和二元分类任务与Idris等人[5]的论文中的任务相似。在实施统计方法进行输入变量选择后,与[5]相比,机器学习模型的性能有所提高。本研究的结果表明,在POC系统中使用机器学习模型对老年人的认知衰弱(CF)进行分类取得了显著进展。 实验涉及343名健壮组个体和672名非健壮组个体。为确保类别间的样本平衡,非健壮组数据被随机子采样至343个样本,从最初的672名老年参与者中随机选择这一子集进行实验。数据被分为60%用于训练,40%用于测试。 Idris[5]使用了47个医疗指标的数据集,没有事先进行统计选择输入变量。这种方法导致七个机器学习模型的分类准确率约为60%。相比之下,我们的研究实施了严格的统计方法来识别七个重要的医疗指标,包括具有小数点的连续变量和被离散化为0、正
整数以及不同的0、1和-1整数值的变量。这种选择过程提高了机器学习模型的性能。 表V展示了本研究中机器学习模型的性能与[5]的比较。准确度和其他指标的提高强调了使用统计选择的医疗指标的有效性。我们的结果表明,在多个模型中,准确度、精确度、召回率和F-measure都有显著提高。特别是,线性判别分析(LDA)、高斯朴素贝叶斯(GNB)和支持向量机(SVM)模型的准确度都超过了70%,比[5]中报告的准确度高出约10%。逻辑回归模型也显示出显著改进,准确度为68.7%,而先前研究中为60.4%。 本研究中提高的性能指标可以归因于对重要临床指标的严格选择。这种方法与[5]中的方法形成对比,后者在没有事先统计过滤的情况下使用了所有连续数据。LDA、GNB和SVM模型中提高的准确度和精确度反映了我们的方法在对老年人进行CF分类方面的稳健性。 鉴于这些结果,表现出最佳性能指标的GNB模型被选为在Android手机上的TinyML应用中实现。它进一步证明了我们的POC系统在没有云依赖的情况下进行实时分析的实际适用性。这一能力在远程或资源有限的环境中特别有益,确保了可靠和及时的诊断。
结论: 本研究介绍了在POC系统中对老年人认知衰弱分类模型的改进方法。本研究的主要成就包括成功改进了将CF谱系中的非健壮个体分类的机器学习模型。本文的贡献在于利用上述先进的统计技术识别关键的临床指标,显著提高了分类模型的准确性。实验结果表明,线性判别分析(LDA)、高斯朴素贝叶斯(GNB)和支持向量机(SVM)等模型的分类准确度超过了70%,优于该领域的先前研究。未来的研究应在更大、更多样化的人群中验证这些发现,并探索其他先进技术以进一步完善POC系统的诊断。关于17种商业化POC测试的研究指出,商业医疗POC系统的机器学习模型通常需要准确度超过85%,精确度、召回率和敏感性超过85%以确保可靠的性能。如果GNB或kNN模型未能达到预期性能,后续步骤可能包括特征工程或模型优化技术。测试额外的模型,如梯度提升,可能提高性能。增加数据集大小可以提高泛化能力,同时改进特征选择方法可以专注于最相关的医疗指标。采用先进的统计方法或集成学习可以进一步提高准确度、精确度和召回率。此外,使用外部数据集验证模型[41]或应用严格的交叉验证技术可以提高稳健性和可靠性[42]。