当前位置: 首页 > article >正文

细粒度生物医学多模态对比学习

一、前言

论文[1] 构建一个全新的生物医学多模态数据集 PMC-15M,其规模比现有的生物医学多模态数据集 MIMIC-CXR 大两个数量级,并涵盖了广泛类型的生物医学图像。PMC-15M包含来自440万篇科学文章中的1500万对生物医学图像-文本对。基于PMC-15M,论文[1] 预训练了BiomedCLIP,一个多模态基础模型,并针对生物医学视觉-语言处理进行了领域微调。并且在标准的生物医学成像任务上进行了广泛的实验和消融研究,这些任务从检索到分类再到视觉问答(VQA),BiomedCLIP在一系列标准数据集上取得了新的STOA 效果。

PMC-15M中大约有一半的图像是复合图。将这些复合图分割成子图可以实现更细粒度的建模,并可能学习到更好的视觉-语言表征。为此,论文[1] 粗略介绍构造细粒度图文对数据集 PMC-Fine-Grained-46M,流程如下:

  • 通过使用正则表达式和规则将复合图标题拆分成带有独立标签的子标题拆分标题;
  • OCR 技术检测图中的文本,将子标题的标签与OCR检测到的文本相匹配;
  • 将复合图像拆分为子图,并提取出来子图的标签,与子标题的标签相匹配。

但是,论文[1] 对PMC-Fine-Grained-46M的使用仅限于统计细粒度图像分布,计划在未来的工作中探索利用 PMC-Fine-Grained-46M 来增强 B


http://www.kler.cn/a/445383.html

相关文章:

  • dolphinscheduler服务RPC框架源码解析(八)RPC提供者服务整合Spring框架实现
  • cenos如何升级git到2以上版本
  • #渗透测试#漏洞挖掘#红蓝攻防#护网#sql注入介绍06-基于子查询的SQL注入(Subquery-Based SQL Injection)
  • IDEA中解决Edit Configurations中没有tomcat Server选项的问题
  • 力扣-图论-18【算法学习day.68】
  • CEF127 编译指南 MacOS 篇 - 编译 CEF(六)
  • OpenSSL 心脏滴血漏洞(CVE-2014-0160)
  • 番外篇 Git 的原理与使用
  • 【AIGC】结构化的力量:ChatGPT 如何实现高效信息管理
  • 【进阶编程】MVVM的物理架构目录
  • VarifocalLoss在Yolov8中的应用
  • SpringBoot 启动类 SpringApplication 一 构造器方法
  • ESP32物联网开发
  • ChatGPT等大语言模型与水文水资源、水环境领域的深度融合
  • Spring(一)---IOC(控制权反转)
  • Vue.js前端框架教程10:Vue生命周期钩子onBeforeMount 和onMounted
  • ctf文件包含
  • [创业之路-200]:什么是business(业务)?B2B, B2C, B2G业务, 什么是业务设计?
  • 任务一登录安全加固
  • 前端TypeScript学习day03-TS高级类型
  • 任务2 配置防火墙firewalld
  • MySQL——EXPLAIN
  • 深入理解 C++ 中 std::vector 和 std::set 容器的使用
  • 机器学习中做时间序列模型考虑把时间作为特征分析
  • Java 后端给前端返回的long精度缺失,导致数据不一致
  • 京东大数据治理探索与实践 | 京东零售技术实践