【Diffusion分割】CorrDiff:用于脑肿瘤分割的校正扩散模型
CorrDiff: Corrective Diffusion Model for Accurate MRI Brain Tumor Segmentation
要进行精确的临床诊断和治疗,必须对核磁共振成像图像中的脑肿瘤进行准确分割。然而,现有的医学图像分割方法存在误差,可分为随机误差和系统误差两类。随机误差产生于各种不可预测的影响,给检测和纠正带来了挑战。相反,系统误差可归因于系统效应,可通过机器学习技术有效解决。在本文中,我们提出了一种校正扩散模型,通过校正系统误差实现精确的 MRI 脑肿瘤分割。这标志着扩散模型首次应用于纠正系统性分割误差。此外,我们还引入了矢量量化变异自动编码器(VQ-VAE),将原始数据压缩成离散编码码本。这不仅降低了训练数据的维度,还增强了校正扩散模型的稳定性。此外,我们还提出了多融合注意机制,它能有效提高脑肿瘤图像的分割性能,并增强校正扩散模型的灵活性和可靠性。我们的模型在 BRATS2019、BRATS2020 和 Jun Cheng 数据集上进行了评估。实验结果表明,在脑肿瘤分割方面,我们的模型比最先进的方法更有效。
INTRODUCTION
分割误差分为两种:随机误差和系统误差 [6]。随机误差源于随机效应,如图像噪声或不可预测的伪影。整合通过独立分割生成的多个信息标签有助于减少这些错误。由于随机误差的不可预测性,检测或纠正这些误差具有挑战性[7]。系统误差源于系统模式,指的是系统开发人员用于训练分割模型的标准分割定义与手动分割协议之间的差异。由于系统误差与特定的模型相关,因此它们会在特定的模型条件下持续出现。因此,可以有效利用机器学习技术来纠正特定模型的系统误差[7]。
最近,扩散过程 [8] 已成为计算机视觉领域最流行的模型之一。该模型是一个参数化的马尔可夫链,它有效地模拟了在图像中逐渐添加噪声,然后学习反向添加的过程。具体来说,扩散过程包括正向扩散过程和反向扩散过程。在正向扩散过程中,模型会在每个时间步骤系统地生成图像,在图像中引入前一时间步骤的噪声,直到图像转化为高斯噪声图像。相反,在反向扩散过程中,从高斯噪声图像开始,模型在每个时间步通过去噪逐步恢复原始图像。扩散过程在图像生成[9]、图像编辑[10]、图像超分辨率[11]和图像分割[12]等多个领域都表现出卓越的性能,从而凸显了其广泛的适用性和可靠性。
在本文中,提出了一种用于精确核磁共振成像脑肿瘤分割的校正扩散模型,如图 1 所示。据我们所知,这标志着首次应用扩散过程通过校正系统误差来精确核磁共振成像脑肿瘤分割。我们的贡献如下:
-我们的纠正扩散模型受到纠正学习的启发。它通过扩散过程解决初始分割中的系统误差,从而提高分割结果的准确性
-引入了向量量化变异自动编码器(VQ-VAE),并将修正扩散模型应用于潜在自动编码器的潜空间。所提出的方法降低了训练数据的维度,增强了校正扩散模型的稳定性。
-在纠偏扩散模型中引入了多重融合注意机制,以增强其灵活性和可靠性。该机制有效结合了核磁共振脑肿瘤图像和系统误差图的信息,从而提高了模型的整体性能。
RELATED WORKS
Generative Model
生成模型首先学习特征向量 x 和标签 y 之间的联合分布,然后计算条件概率 P(y|x)。预测结果采用最大后验概率法。
可变自编码器(VAE)[23] 由编码器和解码器组成,通常用于学习潜在的数据表示[24]。在脑肿瘤分割领域,VAE 被用来学习如何从潜在空间生成原始数据,同时最大限度地保持数据的结构完整性。具体来说,在脑肿瘤分割领域,VAE 被用于特征学习和降维。通过将脑部图像输入编码器,VAEs 可以学习如何将图像表示为潜在特征向量。然后,这些特征可用于训练其他分割模型,帮助从大脑图像中提取有用的特征。Lyu 等人[25]提出了一种编码器-解码器网络结构,它结合了用于脑肿瘤分割的 VAE 和注意力门,通过整合多种模型提高了分割精度。Hamghalam 等人[26] 引入了基于高斯过程先验的变分自动编码器 MGPVAE,用于多模态脑肿瘤分割,通过整合缺失的模态信