当前位置: 首页 > article >正文

【论文阅读笔记】人工智能胃镜在盲区检测和自主采图中的应用

作者:李夏/吴练练/于红刚

小结

  盲区检测的意思,实际上在算法的需求定义上,就是部位识别
  胃肠镜检查中,按照不同的规范,有不同应该观察到的地方。当医生知道哪些部位比较容易出病灶的情况下,就容易忽视出病灶较少的部位,从而导致一个较为奇怪的现象:资质越长的医师,越容易漏检部位。比如胃癌多好发于胃窦,所以内镜医师在检查时会重点关注。
  自主图像采集,即在镜检的过程中对关键部位进行图像留底。作者也对此功能进行了与真人留底的对比,来验证必要性。

摘要

  数据来源;是武汉大学人民医院消化内镜中心数据库选取的 38522 38522 38522张胃镜图像,和 91 91 91个视频资料来训练胃镜精灵。

  对比目标;,是两位水平相当的胃镜医师,一位使用胃镜精灵,另一位不使用胃镜精灵。比较2位内镜医师使用胃镜精灵前后胃镜检查部位覆盖率。

  对比结果
  胃镜精灵的部位识别总准确度为 85.125 % 85.125\% 85.125%。盲区检测实验中内镜医生使用胃镜精灵后胃镜检查部位覆盖率分别( 87.325 ± 7.065 87.325\pm7.065 87.325±7.065)%,高于使用胃镜精灵前和对照组;
  采图实验中,机器采图的胃镜检查部位覆盖个数为( 20.956 ± 3.406 20.956\pm3.406 20.956±3.406)个,部位覆盖率为( 77.613 ± 12.613 77.613\pm12.613 77.613±12.613)%,明显高于人工采图。从后文看,这个总准确率的意思是 27 27 27个部位的准确率平均,实际有效指标应该是部位覆盖率。

内容

  数据都是白光/非放大模式下拍摄的,这样更具有普遍性。使用的胃镜是OLYMPUS公司的260和290系列以及FUJINON公司的580和590系列。 38522 38522 38522张胃镜图像中,有 14143 14143 14143张被作者认为是不合格的模糊图,剩余 24379 24379 24379张合格的胃镜图像。所谓的不合格模糊图,指的是内镜医师在镜身不稳拍摄的图像。

   24379 24379 24379张合格数据的分类标注,是由两名操作经验大于 5 5 5年的内镜医师进行标注、分类。

部位分类

  联合日本胃镜检查部位的 22 22 22分类和欧洲胃镜检查部位的 10 10 10分类,作者将图像分为食管(近端和远端)、贲门胃底(倒镜前壁、后壁、大弯、小弯侧)、胃体中上部(正镜前壁、后壁、大弯、小弯侧)、胃体中上部(倒镜前壁、后壁、小弯)、胃体下部(正镜前壁、后壁、小弯、大弯侧)、胃角(倒镜后壁、前壁、小弯侧)、胃窦(前壁、后壁、小弯、大弯侧)、十二指肠(球部和降部)等 27 27 27个部位。

算法

  算法模型本身没啥能说的,使用的是VGG16模型,说是使用了 38522 38522 38522张图像训练。

  算法模型指标是通过十折交叉验证得到的:将数据分为 10 10 10份,每个子样本验证 1 1 1次,将诊断准确率、敏感度、特异度和诊断时间作为模型评判标准,平均 10 10 10次的结果。

在这里插入图片描述

部位识别功能展示

  展示的效果,和下图中的文字是一样的,与图像不符。实际上,会有预设的一个食管、胃部类3D渲染图,当识别出来某个部位的时候, 就将渲染图对应的部位染色展示。
在这里插入图片描述

采图功能展示

  采图功能展示如下图所示,没有识别出来的部位,使用"?"展示,部位是按国际标准操作顺序进行排列的。
在这里插入图片描述

盲区检测功能提高内镜医师操作水平

  将 91 91 91个视频分为前后 45 45 45个视频,两个医师均对前后视频组进行检查。

  下表是两个医师使用内镜精灵前后的部位覆盖率。医生 1 1 1在后 45 45 45个视频中使用了内镜精灵,使用内镜精灵后提升了 10 % 10\% 10%以上覆盖率。

实验者实验前胃镜检查部位覆盖率(%)实验后胃镜检查部位覆盖率(%)
医生1 76.790 ± 8.848 76.790\pm8.848 76.790±8.848 87.325 ± 7.065 87.325\pm7.065 87.325±7.065
医生2 75.926 ± 11.565 75.926\pm11.565 75.926±11.565 75.253 ± 14.662 75.253\pm14.662 75.253±14.662

  下表是机器自主采图和人工采图覆盖率的对比。

采图部位覆盖个数部位覆盖率(%)
人工采图 15.467 ± 2.296 15.467\pm2.296 15.467±2.296 57.284 ± 8.503 57.284\pm8.503 57.284±8.503
机器采图 20.956 ± 3.406 20.956\pm3.406 20.956±3.406 77.613 ± 12.613 77.613\pm12.613 77.613±12.613

http://www.kler.cn/a/508589.html

相关文章:

  • PHP智慧小区物业管理小程序
  • 如何在Mac上使用Brew更新Cursor应用程序
  • 网站收录入口提交的方法有哪些(网站收录的方式都有哪些)
  • 【Rust自学】12.4. 重构 Pt.2:错误处理
  • PT8M2302 触控 A/D 型 8-Bit MCU
  • 基于 K-Means 聚类分析实现人脸照片的快速分类
  • 将 AzureBlob 的日志通过 Azure Event Hubs 发给 Elasticsearch(2 换掉付费的Event Hubs)
  • 关于AWS网络架构的思考
  • 深度学习入门-CNN
  • C语言中char *str[] 和char *str有什么区别
  • 利用EXCEL进行XXE攻击
  • 天天AI-20250116
  • NVIDIA 下 基于Ubuntun20.04下 使用脚本安装 ros2-foxy 和 使用docker安装 ros2-foxy
  • mongdb结构与mysql对比
  • 应用场景——教育培训类三、作文批改助手开发实战(对文章进行批改,生成批改建议报告)
  • 《提示工程的科学化探索与大语言模型交互革新》
  • (三)c#中const、static、readonly的区别
  • 5. 推荐算法的最基础和最直观的认识
  • 从 Android 进行永久删除照片恢复的 5 种方法
  • 在.NET用C#将Word文档转换为HTML格式
  • 【STM32 USB】USB描述符
  • ChatGPT如何创造收益?如何打造一个类似ChatGPT的智能助手?ChatGPT谈自身盈利策略与复制可能性
  • 26个开源Agent开发框架调研总结(一)
  • 代码随想录算法训练营第三十五天-动态规划-01背包(二维)
  • 多种 Docker 镜像拉取解决方案与实践
  • ZooKeeper 核心概念与机制深度解析