新智元报道
编辑:英智
【新智元导读】医学变革风暴来袭!ECgMPL模型如同医学领域的超级侦探,从细胞和组织微观图像里精准揪出癌症踪迹,诊断子宫内膜癌准确率近100%,远超医生平均水平。
AI在医学领域越来越厉害啦!有一种新研发的AI,诊断癌症的本事比专业医生还牛。
包括澳大利亚Charles Darwin大学(CDU)在内的国际科研团队,搞出一个叫ECgMPL的模型。
ECgMPL专门分析细胞和组织的微观图像,用来查子宫内膜癌。子宫内膜癌是常见的生殖系统肿瘤之一,而这个AI模型的准确率高达99.26%!
研究人员还发现,这个模型经过调整,还能诊断很多其他疾病,如结直肠癌、口腔癌。
CDU的Asif Karim博士参与了这项研究,他表示,ECgMLP模型的准确率高达99.26%,比现在用的那些诊断方法都强,计算速度还特别快。
通过消融研究、自注意力机制,再加上高效的训练,这个模型在很多组织病理学数据集上都能很好地发挥作用,是临床诊断子宫内膜癌的得力助手。
这个经过大量数据训练的AI模型,在查看微观扫描图像(也就是组织病理学图像)的时候,能把图像变得更清晰,这样就能发现癌症早期的症状。
有些微小变化医生用眼睛很难发现,但AI模型一下子就能找到。
现在,医生诊断的准确率大概在78.91%到80.93%之间。
子宫内膜癌如果能早点发现,是可以治疗的,患者的五年预后效果也不错。但要是癌细胞扩散到子宫外面,治疗起来就麻烦了。所以,及时诊断对挽救患者生命特别重要。
训练所用数据集的样本图像,展示了正常子宫内膜(NE)、子宫内膜息肉(EP)、子宫内膜增生(EH)和子宫内膜腺癌(EA)
现在,美国已经有超过60万人得过子宫内膜癌。科学家发现,ECgMLP的用途可不只是诊断子宫内膜癌。
澳大利亚ACU的副教授Niusha Shafiabady表示,用同样的办法,还能又快又准地查其他病,这样病人就能得到更好的治疗。
他们用这个模型测试了好多不同的组织病理学图像数据,发现它查结直肠癌的准确率能达到98.57%,查乳腺癌的准确率是98.20%,查口腔癌的准确率也有97.34%。
不过,这个AI模型可不是要抢医生的「饭碗」。
它是和癌症专家一起合作,帮医生更准确地诊断病情,还能看看治疗的效果好不好。
用这个模型诊断癌症,速度更快、容易实现,成本也更低。
Shafiabady补充道,这项研究的AI模型可以作为软件系统的大脑,协助医生进行癌症诊断的决策。
研究人员强调:「早点发现、准确诊断子宫内膜癌,对治疗和控制病情非常关键。用深度学习算法分析组织病理学图像,在诊断子宫内膜癌方面,不管是准确率还是处理速度,表现都特别好。」
构建ECgMLP
ECgMLP模型的构建离不开高质量的数据集。
研究团队收集了新鲜的子宫内膜标本,由三位具有十多年病理学实践经验的病理学家在光学显微镜下仔细检查组织学切片,一致选择具有诊断结果的代表性苏木精-伊红(H&E)切片。
这些切片通过Mixotic扫描仪数字化,以10倍或20倍放大倍数捕获为高分辨率图像,再用Olympus ImageView从原始全切片图像中提取病变或健康组织的组织病理学区域。
最终形成的数据集包含3302张jpeg格式的图像,分为子宫内膜腺癌、子宫内膜增生、子宫内膜息肉和正常子宫内膜4类,每类又包含不同数量的图像和亚型。
这个数据集为模型的训练和优化提供了坚实的基础。
图像预处理
图像预处理是 ECgMLP 模型的重要环节,它直接影响到后续分析的准确性。
研究采用了多种预处理技术,包括归一化、α-β变换和非局部均值(NLM)去噪算法。
归一化通过将图像的像素值缩放到0到1之间,使不同图像具有可比性,便于从不同光照条件下捕获的图像中一致地提取特征。
其公式为
,这种标准化为后续的分析提供了的基础。
α-β技术则通过调整像素值来优化视觉对比度。α参数控制图像的对比度,β参数控制亮度。
在本研究中,α值设为1.0,β值设为2,这一设置显著增强了组织和细胞结构边界的可见性,同时保持了可接受的信号质量,PSNR值始终高于33dB。
NLM去噪技术通过比较图像中的小像素块并找到相似块,用相似块的平均值替换噪声块,有效地去除了噪声,同时保留了关键的边缘信息和组织纹理。
其公式为
,这一技术为后续的准确分析提供了清晰的图像数据。
图像分割
图像分割是从图像中提取感兴趣区域(ROI)的关键技术,ECgMLP模型采用了基于分水岭算法的多步骤分割方法。
该过程从二值阈值化开始,通过最小化前景和背景两类的类内方差确定阈值,将像素分为前景和背景。
接着进行形态学闭运算,使用2×2内核去除前景区域中的小孔和间隙;然后进行距离变换,获得每个像素到最近背景像素的距离图;再进行膨胀操作,扩展前景区域。
应用阈值处理,确定前景区域;通过从确定背景中减去确定前景得到未知区域;将原始图像和标记与分水岭算法结合,实现图像的精准分割。
光度增强
为了提高模型的泛化能力,研究对训练集和验证集应用了光度增强技术。
通过对图像进行亮度、对比度、色调、饱和度的变化以及模糊处理等多种修改,创建了具有不同视觉特征的原始图像的新版本。
总共应用了10种光度增强技术,例如调整亮度水平、改变对比度、利用CLAHE增强图像特征、调整色调和饱和度以及应用高斯模糊等。
这样增加了训练数据的多样性,提高了模型的泛化能力。
创新的ECgMLP架构
ECgMLP模型基于gMLP架构构建,gMLP架构结合了MLP和Transformer的优势。
每一层由一个MLP块和一个门控机制组成,门控机制调节信息流,使模型能够选择关注不同的输入组件,MLP块则负责提取高级特征。
ECgMLP模型在此基础上进行了针对性的优化。
形状为[64×64×3]的图像首先输入到输入层,经过数据增强层增加训练样本数量并减少过拟合,增强后的数据由形状为[128×128×3]的补丁组成。
补丁通过补丁层重塑为[256×192],再经过全连接层提取特征。
模型包含多个顺序的gMLP 层,gMLP层由多个子层组成,子层混合使用MLP和门控机制生成有信息的表示。
每个gMLP层的输出作为下一层的输入,经过层归一化和全局平均池化1D层处理后,最后通过具有4个输出单元的全连接层进行最终预测,对应子宫内膜癌的四个类别。
在训练过程中,使用AdamW优化器,包括权重衰减正则化,并采用稀疏分类交叉熵损失和准确率指标进行评估,还使用了学习率调度来提高收敛性。
此外,在gMLP层中使用ELU激活函数代替ReLU,提高了模型的稳定性。
ECgMLP的卓越性能
消融研究
通过改变网络的层架构、训练参数和超参数,如图像大小、权重衰减、批量大小、随机失活率等,深入研究不同因素对模型准确率的影响。
研究发现,6个ECgMLP模块实现了98.61%的最佳准确率,但出于实际原因选择4个模块,此时准确率为98.52%。全局最大池化的准确率达到98.74%,高于全局平均池化的98.52%。
AdamW作为优化器表现最为准确,准确率为98.52%;激活函数中ELU的准确率最高,达到99.26%;学习率为 0.003时选择准确率最高。
多指标评估
使用多种指标对ECgMLP模型的性能进行评估,结果显示该模型表现卓越。
学习曲线展示了模型训练过程中的良好表现,随着训练的进行,损失下降且准确率上升,表明模型有效地从数据中学习,没有过拟合的迹象,预测性能不断增强。
ROC曲线下面积(AUC)为完美的1.00,表明模型区分不同类别的能力极强,在不同的分类标准下都表现出色。
通过10折交叉验证,模型的准确率在不同的数据分割中保持在98.99%至99.26%之间,证明了模型的稳定性和泛化能力,在不同类型的数据上都能表现出持续的高性能。
泛化能力验证
为了评估ECgMLP模型的泛化能力,研究团队在多个涵盖不同癌症类型的外部组织病理学图像数据集上进行测试。
结果显示,模型在这些数据集上都实现了较高的准确率(>97%),证明了其对不同组织学图像分布具有可靠的泛化能力。
即使在原始领域之外,ECgMLP模型也具有先进的性能,这为其在更广泛的医学领域应用奠定了坚实的基础。
参考资料:
https://newatlas.com/cancer/ai-cancer-diagnostic/