当前位置: 首页 > article >正文

AI与药学:大语言模型赋能药物推荐

电子病历(EMR)系统,作为医疗信息的宝库,蕴藏着巨大的价值。然而,如何高效利用这些数据,尤其是其中占比庞大的非结构化数据,一直是困扰业界的难题。传统的药物推荐模型,主要依赖于结构化的医疗编码(例如诊断代码、药物代码等)进行预测,而大量的临床记录、检查报告等非结构化或半结构化数据却被“束之高阁”,造成了巨大的资源浪费。

如何打破这一僵局?近年来,以 GPT 系列为代表的大语言模型(LLM)的崛起,为我们提供了新的思路。LLM 凭借其强大的语言理解和生成能力,在自然语言处理领域展现出惊人的实力,也为医疗数据的挖掘带来了新的希望。(关注“赛文AI药学”公众号,获取更多AI与药学的内容)

近期,一篇题为《Enhancing Medication Recommendation with LLM Text Representation》的论文,提出了一种创新性的方法:利用 LLM 强大的文本理解能力,提取临床记录的文本表示,并将其与医疗编码表示相结合,从而增强药物推荐模型的性能。 这项研究由 Yu-Tzu Lee 完成,为 EMR 数据利用,特别是药物推荐领域,开辟了新的道路。

该研究的核心思想在于,将临床记录这类非结构化数据,通过 LLM 转化为机器可理解的向量表示,然后将这种蕴含丰富语义信息的文本表示与传统的医疗编码表示进行融合,从而构建更全面、更精准的患者画像,为药物推荐模型提供更丰富的信息输入。

具体而言,该方法包含以下几个关键步骤:

  1. 文本表示提取: 面对冗长且复杂的临床记录,研究者巧妙地将其切分成多个较短的文本块 (chunk)。然后,利用开源的 Mistral-7B-Instruct-v0.2 模型,提取每个文本块的隐藏状态,并最终通过拼接和平均操作,得到整个临床记录的文本表示。这一过程巧妙地规避了计算资源的限制,并充分利用了 LLM 对长文本的理解能力。

  2. 组合表示构建: 以 GSVEMed 模型为例,研究者将提取的文本表示与诊断代码、程序代码等医疗编码表示进行融合。具体来说,医疗编码嵌入通过图卷积网络 (GCN) 进行学习,随后,文本表示与编码后的医疗代码表示通过 Transformer 编码器进一步处理,并进行降维和元素级相加,最终得到融合了结构化与非结构化信息的组合表示。

  3. 模型应用与验证: 研究者将该方法应用于 G-BERT、GAMENet、SafeDrug、COGNet 和 GSVEMed 等五个先进的药物推荐模型,并在 MIMIC-III 和 嘉义基督教医院 (CYCH) 两个真实医疗数据集上进行了验证。

实验结果:LLM 展现强大潜力

实验结果令人振奋,充分证明了 LLM 文本表示在药物推荐领域的巨大潜力:

  • 单独的文本表示展现出不俗的预测能力: 在 CYCH 数据集上,仅使用文本表示的 COGNet 和 GSVEMed 模型,甚至取得了与仅使用医疗编码表示相当甚至更好的预测性能。这表明,LLM 能够从临床记录中提取出对药物推荐极具价值的信息。

  • 组合表示显著提升模型性能: 在两个数据集上,G-BERT 模型在融合了文本表示后,性能均得到了显著提升。这证明了将结构化数据与非结构化数据相结合的有效性,也印证了 LLM 文本表示能够为药物推荐模型提供更全面的信息。

这项研究的意义,不仅仅在于提出了一种新的药物推荐方法,更在于它为医疗 AI 的发展指明了新的方向:

  • 打破数据壁垒,释放数据价值: LLM 的引入,为非结构化医疗数据的利用开辟了新的途径,有望打破长期以来困扰业界的“数据孤岛”问题,释放 EMR 数据的巨大价值。

  • 通用方法,广泛适用: 该研究提出的方法具有很强的通用性,可以应用于多种现有的药物推荐模型,并已经在不同数据集上得到了验证,具有广泛的应用前景。

  • 无需额外训练,高效便捷: 该方法直接利用现成的 LLM,无需进行额外的预训练或微调,大大降低了应用门槛,提高了效率。

尽管该研究取得了令人瞩目的成果,但仍存在一些局限性,例如:将长文本切分成块可能会损失部分上下文信息;针对不同模型架构,如何更好地融合文本表示和医疗编码表示仍需进一步探索。

未来,研究者可以进一步探索如何利用 LLM 处理其他类型的非结构化数据,例如入院记录、检查报告等,并探索更有效的表示融合方法,构建更强大的医疗 AI 模型。

往期内容荐读:

数智药学的崛起:人工智能赋能药学新未来

数智药师:AI时代药学服务的引领者

智能决策助力药物安全:大模型在临床处方审核中的突破

数字人技术在药学服务中的应用

药师必备:掌握AI,引领药学服务新时代

LEADER - 大模型蒸馏的药物推荐模型

李新刚:《医院药学的创新引擎:ChatGPT的应用与思考》

ChatGPT 在临床药学中的有效性以及人工智能在药物治疗管理中的作用

评估大语言模型在药物基因组学问答任务中的表现:PGxQA

DDI-GPT:使用知识图谱增强的大模型对药物相互作用进行可解释的预测

生成式AI:药学科普的新引擎

诺奖得主David Baker最新Science论文:药学+AI领域迎来新机遇!

AI与药学:ChatGPT与临床培训——药学博士(Pharm-D)学生的看法、担忧和实践

人工智能大模型在用药处方审核的应用潜力:一项跨 12 个临床专科的前瞻性研究

生成式人工智能在中医药学教育中的应用与挑战

PharmacyGPT: AI赋能精准ICU药物治疗

数智药学:信息药师向AI药师的进化

AI用于研究药物扩大适应症:大模型架起药物分子结构与适应症的桥梁

AI与药学:DrugGPT助力减少英国每年2.37亿次用药错误

AI时代下的家庭药师

AI与药学:用药咨询场景的检索增强AI大模型

AI与药学:生成式人工智能如何帮助构建患者药品说明书?

AI与药学:ChatGPT在抗感染治疗中的应用与挑战

AI与药学:生成式人工智能如何帮助构建患者药品说明书?

欢迎关注“赛文AI药学”!

赛文AI药学,致力于探索人工智能在药学场景中的创新与应用。


http://www.kler.cn/a/506755.html

相关文章:

  • 语音合成的预训练模型
  • 【物联网】ARM核介绍
  • [操作系统] 深入理解约翰·冯·诺伊曼体系
  • [手机Linux] ubuntu 错误解决
  • Docker的入门
  • Stein算法
  • 为什么我喜欢在 CSS 中使用 RegEx
  • npm发布组件(vue3+webpack)
  • Vue学习之旅:从生命周期到工程化开发与组件实践(生命周期+工程化开发)
  • @Query(org.springframework.data.jpa.repository.Query)
  • HTTP 到 HTTPS – 以下是操作步骤
  • 【Java设计模式-5】装饰模式:给咖啡加点“佐料”
  • 海太长江隧道:科技防水筑就跨江新通道
  • 卷积神经04-TensorFlow环境安装
  • Dexie.js 的批量操作与索引优化
  • 《深度学习神经网络训练:数据集下载资源列表》
  • 使用Eclipse将Springboot项目打jar包
  • GPU算力平台|在GPU算力平台部署轻量级中文OCR项目(chineseocr_lite)
  • 机器学习-学习算法
  • java实现word转html(支持docx及doc文件)
  • 常见的安全测试漏洞详解
  • VLANIF配置之区别(Differences in VLANIF Configuration)
  • 高德地图自定义点聚合样式
  • 数据结构-顺序表及链表结构分析
  • 【odbc】odbc连接kerberos认证的 hive和spark thriftserver
  • 矩阵Strassen 算法