当前位置: 首页 > article >正文

最新7+非肿瘤生信,机器学习筛选关键基因+样本验证。目前机器学习已经替代WGCNA成为筛选关键基因方法。非肿瘤生信分析欢迎咨询!

影响因子:7.31

关于非肿瘤生信,我们也解读过很多

目前非肿瘤中结合热点基因集,免疫浸润,机器学习,分型的分析是比较先进的。有需要的分析的朋友欢迎交流!!

研究概述:

心房颤动(AF)是缺血性卒中的主要危险因素,而仅凭临床特征和神经影像学表现都不能可靠地分类心源性栓塞性卒中(CE)。本研究旨在确定在心房颤动相关心源性栓塞性卒中(AF-CE)患者中具有诊断价值的新型潜在生物标志物,区分AF-CE与其他类型缺血性卒中。

研究者对AF和CE的共同的DEGs进行综合分析后,使用LASSO和SVM-RFE两种机器学习算法确定了三个诊断标志物C1QC、VSIG4 和 CFD。然后采用RT-qPCR分析了3种诊断标志物的表达水平,发现水平高低可用于区分AF-CE患者与正常对照组,并可有效区分AF-CE和LAA卒中。之后使用临床样本验证结果,并使用ROC曲线分析确定这些特征标志基因的诊断价值。最终得出C1QC、VSIG4 和 CFD 可作为 AF-CE 的独立因素和诊断标准。最后建立了列线图模型、开发了在线预测工具。

研究结果:

一、差异表达基因的鉴定

1. 在与CE相关的GSE58294 (GPL570)数据集中,与对照组相比,在中风后三个时间点(<3 h(图1a)、5 h(图1b)和24 h(图1c)分别筛选DEGs。同时,从GSE41177中获得13962个AF相关的DEGs (图1d)。

2. GSE58294数据集中不同时间点的DEGs结果的交集有418个DEGs (图1e)。该交集中的DEGs交叉得到316个AF-CE基因(图1f)。

3. 将GSE58294和GSE41177数据集合并为训练集,移除批处理效果后使用limma包获得13个AF-CE相关的DEGs基因(AP000525.9、POM121L9P、TIMM8A、MCEMP1、C1QC、LOC100996760、BCL2A1、S100A12、VSIG4、OLAH、ANKRD22、BMX、CFD),其中9个基因上调,4个基因下调(图1g)。

二、功能相关分析

1. 使用Metascape在线工具进行功能标注。结果表明:AF-CE相关的DEGs标志性富集于氧化应激诱导的衰老、氧化应激反应的调控、氧化应激反应的调控、细胞程序性死亡、上皮细胞增殖的调控、VEGFA-VEGFR2信号通路、补体和凝血级联、雌激素信号通路、snRNA 3’端加工、MHC II类蛋白复合物组装、细胞对生长因子刺激反应的调控、肌肉结构发育、白细胞介素-12的产生、癌症中的蛋白多糖、水杨酸与甘氨酸的偶联以及附肢形态发生(图2a)。

2. DO富集分析结果显示,AF-CE相关的DEGs主要与免疫介导的炎症性疾病(肝炎、乙肝、丙肝)和女性生殖系统疾病(女性生殖器官癌、卵巢上皮性癌、卵巢表面恶性上皮间质肿瘤、卵巢癌、泌尿系统癌)相关(图2B)。

三、利用LASSO和SVM-RFE算法选择诊断标记

1. 使用两种不同的算法(LASSO和SVM-RFE)从组合训练集(GSE58294和GSE41177)中筛选特征基因。SVM-RFE算法结果表明,当特征数为13,包含前文所述13个AF-CE相关的DEGs时分类器误差最小(图3a、 b)。

2. LASSO算法经过十倍交叉验证,选取10个基因,分别为AP000525.9、TIMM8A、S100A12、LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX、CFD(图3c、 d)。

3. 最终选择LASSO和SVM-RFE算法之间共有的7个特征基因(LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX和CFD)进一步分析(图3e)。7个特征基因的ROC分析AUC值均大于0.8,提示这7个基因可作为AF-CE患者的诊断标志物(图3f)。

4. 为进一步验证这7个候选诊断基因的可靠性和可重复性,作者合并了两个数据集(GSE115574和GSE14975)作为验证集。结果显示,CFD (P < 0.05)、VSIG4 (P < 0.01)和C1QC (P < 0.05)在AF和SR之间存在差异(图4a、b)。

5. 图4c 的ROC分析显示,三基因组合模型(C1QC+VSIG4+CFD)的AUC为0.794,高于单个基因的AUC:C1QC(0.672),VSIG4 (0.688),CFD( 0.671),组合模型具有较高的诊断价值。

6. 而动脉粥样硬化数据集GSE20129中C1QC、VSIG4和CFD的表达无明显差异(图4d -f)。从上述结果来看,特征生物标志物VSIG4、C1QC和CFD具有较高的诊断准确性。

四、特征生物标志物的通路分析

为确定VSIG4,C1QC和CFD的生物学相关性,作者从PathCards数据库进行富集分析。

结果表明,候选特征生物标志物主要富集于免疫应答凝集素诱导补体通路、纤维蛋白凝块形成(凝血级联反应)、C4和C2激活剂的产生、先天免疫系统、补体通路、补体和凝血级联、对血小板胞质Ca升高的反应2+和脂肪生成(图5a)。

故认为VSIG4,C1QC和CFD可能与AF-CE的调节细胞免疫反应有关,而细胞免疫反应又反过来影响AF-CE的风险。


五、免疫细胞浸润

1. 作者计算了GSE58294数据集中患者样本、脑卒中后<3、5和24h患者样本与对照样本之间免疫细胞浸润分布的差异。

①与对照组相比,AF-CE组在脑卒中后<3、5、24 h中性粒细胞升高;5 h 呈现M0、M2巨噬细胞升高;24 h 呈现T细胞γ δ和M2巨噬细胞升高。静息树突状细胞在脑卒中后3 h和5 h显著降低。

②幼稚CD4 T细胞在脑卒中后3h较低,嗜酸性粒细胞在脑卒中后5h较低,CD8 T细胞和静息NK细胞在脑卒中后24小时较低。(P 均< 0.05)

2. 对三个特征生物标志物,发现CFD(图5b)与中性粒细胞呈正相关,与幼稚B细胞、幼稚CD4 T细胞和静息NK细胞呈负相关。C1QC(图5c)与中性粒细胞和静息肥大细胞呈正相关,与静息树突状细胞呈负相关。VSIG4(图5d)与中性粒细胞呈正相关,与中性粒细胞、 T滤泡辅助细胞、静息树突状细胞和嗜酸性粒细胞呈负相关。这些结果与通路分析的结果一致。

六、临床样本中诊断基因的表达

为进一步证实,作者收集53份临床血样(20例LAA患者,20例CE患者和13例对照)进行qRT-PCR分析,检测C1QC、VSIG4和CFD的表达。如图6a-c所示,与健康对照相比,CE组和LAA组C1QC和VSIG4表达明显升高,而CFD表达降低。

七、C1QC、VSIG4 和 CFD 作为潜在AF-CE 生物标志物的评估

1. 构建ROC曲线以评价候选诊断基因的诊断准确性。(AUC越接近于1,真实性越高)

对照组CT与CE患者比较结果:(95%可信区间和p值见于图片,下同)

C1QC(图6d)的AUC为0.7885,VSIG4(图6e)的AUC为0.8769,CFD(图6f)的AUC为0.8250。

2. 对照组与LAA患者比较结果:C1QC(图6g)的AUC为0.8632,VSIG4 (图6h)的AUC为0.8423,CFD(图6i)的AUC为0.9219。

3. CE患者与LAA患者比较结果:C1QC(图6j)的AUC为0.7350,VSIG4(图6k)的AUC为0.9675,CFD(图6l)的AUC为0.7575。

4. 这些结果表明,C1QC、VSIG4和CFD表达在区分对照组、CE和LAA患者方面具有很大的价值,且对所分析的两种脑卒中亚型具有特异性。因此C1QC、VSIG4和CFD可能是AF-CE的诊断生物标志物。

八、AF-CE诊断列线图和在线预测工具的构建和评估

1. 基于3个诊断基因(C1QC、CFD和VSIG4),使用“RMS”包构建诊断AF-CE的列线图(图7a)。为更直观地评估列线图模型的临床效果,基于决策曲线分析(DCA)生成的曲线计算了临床影响曲线。AF-CE列线图(图7b)具有良好的区分效果,曲线下面积AUC为0.969(95%CI:0.940-0.991)。红色表示的高风险曲线与蓝色表示的真阳性患者曲线非常接近。这表明列线图模型能够且可以接受准确预测区别(图7c)。

2. DCA表明,C1QC+CFD+VSIG4曲线远高于灰线,这解释了列线图模型的高精度(图7d)。此外,还构建了校准曲线以确定列线图模型的预测能力。AF-CE的实际风险和预测风险之间几乎没有差异,表明预测AF-CE的准确性很高(图7e)。

3. 此外作者开发了一种在线预测工具用于临床应用,基于构建的列线图预测AF-CE的风险。将候选诊断基因(C1QC,CFD和VSIG4)的表达水平输入在线预测工具,结果表明所有AF-CE患者测试样本得分接近100%,而健康对照接近0%,这表明预测软件具有较高的描绘精度。

九、临床病理参数(包括年龄、性别、TIA、心源性疾病、心悸、呼吸困难、高血压、吸烟、左心房直径和糖尿病)与候选疾病生物标志物之间的相关性

1. C1QC表达与年龄>60岁、糖尿病史、高血压史、以及当前或近期吸烟呈正相关,而与患者其他临床病理参数无相关性(P > 0.05)。

2. 对于CFD的表达,在上述临床病理特征均有显著差异:糖尿病史与较低的CFD表达相关,女性表达低于男性,高血压史者表达较低。(P < 0.05)

3. VSIG4表达明显增高在高血压史、心源性疾病史、心悸史、吸烟者、年龄> 60岁、女性。(P < 0.05)

研究总结:

本研究首次探索了特定的基于血液的生物标志物C1QC、VSIG4 和 CFD,可通过机器学习快速诊断AF-CE患者,这可能有助于支持治疗计划和二级预防计划。此外,这些生物标志物主要富集在免疫系统和补体通路中,可能为进一步研究奠定基础。



喜欢的朋友记得点赞、收藏、关注哦!!!


http://www.kler.cn/a/391571.html

相关文章:

  • 假期增设:福祉与负担并存,寻求生活经济平衡之道
  • 【计算机网络】【网络层】【习题】
  • 基于非时空的离身与反身智能
  • 阿里巴巴通义灵码推出Lingma SWE-GPT:开源模型的性能新标杆
  • AtomicInteger 和 AtomicIntegerFieldUpdater的区别
  • 红日靶机(七)笔记
  • 期权懂|期权市场的发展对于投资者有什么影响?
  • AI写作(二)NLP:开启自然语言处理的奇妙之旅(2/10)
  • Ab测试与灰度发布
  • 生成 Django 中文文档 PDF 版
  • 【ESP32】ESP-IDF开发 | 低功耗管理+RTC唤醒和按键唤醒例程
  • 开发工具 IntelliJ IDEA 使用技巧、快捷键、插件分享
  • Flink转换算子
  • CSM32RV20:RISC-V核的低功耗MCU芯片,常用在智能门锁上
  • C++中级学习笔记
  • TortoiseSVN提示服务器凭证检核错误:站点名称不符
  • windows下QT5.12.11使用MSVC编译器编译mysql驱动并使用详解
  • STM32学习笔记------GPIO介绍
  • SpringCloudAlibabaSidecar整合异构微服务
  • ES6模块、CommonJS、AMD等不同的模块化实现。
  • npm i 的时候报错: npm ERR! Error: EPERM: operation not permitted, rename
  • 已解决:spark代码中sqlContext.createDataframe空指针异常
  • 优化Mac的鼠标使用体验超简单方法
  • C++零基础趣味学信息学奥赛系列课程简介
  • 科技云报到:数字化转型,从不确定性到确定性的关键路径
  • Java的六大排序