AI能否颠覆转化医学研究?|行业前沿
小罗碎碎念
医学是一项“团队运动”,AI只是这个团队的新成员之一。
我们大多数人获取科学最新进展的方式,应该就是读文献了,但是文献的发表时间和作者投稿甚至开始这方面研究的时间往往相差一年以上,这就会导致我们即便知道这个方向不错,也无法抢占先机。
对于商业应用来说,更需要实时关注行业的一个发展动态,及时调整业务方向。对于从事科研工作的老师来说,提前选好方向,可以让自己的优势得到最大的体现,弯道超车也不是没有可能(尤其是现在国家对于人才队伍的年轻化改革,更需要我们这样做)。
除了实验研究,顶刊每天都会发表很多观点/评论类的文章,这些文章提到的方向,可以和已经正式发表的实验研究做一个补充,希望大家能从这个专栏中获取有价值的信息。
在2022年,一名居住在阿拉巴马州伯明翰的8岁女孩引起了其医生的困惑。该女孩被诊断为SHINE综合征,这是一种全球仅记录了130例的神经发育性疾病。她同时还出现了若干非典型症状,如在给图画线条间的空间上色时出现运动控制丧失。
鉴于SHINE综合征的罕见性,阿拉巴马大学伯明翰分校精准医学研究所的医生在寻找治疗方案时资源有限。因此,他们向位于马里兰州罗克维尔的美国国家转化科学促进中心(NCATS)的负责人乔尼·卢特及其团队寻求帮助。
NCATS一直在开发一种名为生物医学数据转换器(简称Translator)的工具。该诊断工具由人工智能(AI)驱动,能够利用患者的症状(表型)或特定基因,在庞大的数据库中进行搜索,以识别与个人档案相关的治疗方法。
数据库包含了蛋白质、基因和代谢物等数据集。将女孩的症状输入Translator后,该工具建议使用用于控制高血压的药物——胍法辛作为治疗选项。女孩服用该药物五个月后,其母亲报告称女儿的行为和运动技能有了可衡量的改善。
此类工作——创新技术迅速对病人健康产生影响的案例——在历史上较为罕见。但卢特表示,这种转化科学正处在一个十字路口。一项干预措施要从实验室走向病人的床边,首先必须经过一系列的动物实验和临床试验来测试其安全性和有效性。
说起来容易做起来难。十多年来,调查性药物的一期临床试验成功率——新药物在人体上的第一系列测试——仅维持在10%以上【8】。卢特表示,在研发流程的后续阶段,情况并没有太大改善。
她说:“多年来,我们在预测药物化合物的成功率上一直存在问题。百分之九十的时间里它们会失败——而且大多数失败发生在二期或三期临床试验。我们在这方面做得不够好。”
Translator只是人工智能开始影响转化科学的一个早期例子。尽管它还未完全准备好,但卢特认为,这个人工智能工具或类似工具承担更大角色的那一天只是时间问题。
她说:“这是一个充满希望的验证概念,展示了人工智能如何真正帮助塑造了这一领域。无论是否准备好,它都在发生。”
一、转化难题
根据2022年世界卫生组织(WHO)的报告,2021年全球仅有27种抗生素治疗方案处于开发中,较2017年的31种有所下降。截至2022年,现有抗生素类别通过试验并到达患者的成功率仅为约十五分之一。对于新型抗生素,这一成功率已降至三十分之一。
时任WHO结核病部门协调员的Haileyesus Getahun在2013年代表该组织的一次讲话中表示:“我们正在耗尽时间来领先抗微生物耐药性(AMR),创新的速度和成功率远远低于我们对抗新生儿败血症等古老但毁灭性疾病的现代医学成果所需。”
在药物开发中,从实验室到病床边的这一鸿沟被转化医学专家称为“死亡谷”,一直是研究人员在推进临床解决方案方面的持久障碍。美国国家转化科学促进中心(NCATS)药物开发合作项目办公室主任Christine Colvis表示,部分问题在于许多复杂药物化合物可能产生难以预测的效果。
Colvis说:“复杂性来自于药物有时会与除预定目标之外的‘靶点’相互作用。这可能导致未预见的副作用。”
对于华盛顿特区乔治华盛顿大学的神经学家Henry Kaminski来说,导致临床试验失败,特别是罕见疾病的另一个因素是缺乏标准化数据。
Kaminski说:“对于任何由人执行的操作测试,无论是医生的物理检查还是协调员指导患者如何执行患者报告的结果测量,都存在表现上的变异性。”
Kaminski指出,特定人群(如医学院的患者)收集的数据不一定能推广到临床试验的更大人群。同样,在动物模型中进行的前临床试验虽然通常有效,但并非完美,有时疾病根本无法在动物中建模。
例如,Kaminski说,啮齿动物的免疫系统与人类不同。因此,一些生物药物,如人源化抗体蛋白,无法成功测试。然而,仅研究人类细胞,并脱离动物生理学模型提供的复杂性,使得研究人员难以确定药物对人的影响。
Kaminski表示,除了科学障碍之外,转化医学还面临行政障碍。他说,在临床试验开始之前,必须经过一个多步骤的过程,其中包括试验管理人员与研究人员的合同签订、预算分析、利益冲突评估以及现场人员的培训。这些步骤虽然重要,但也是耗时的。
二、人工智能的介入
研究人员正在寻求如人工智能这样的技术来帮助转化医学度过这些成长中的痛苦。尽管人工智能已经与大型语言模型(LLMs)如ChatGPT的基础模型同义,但卢特表示,其他形式的人工智能,包括深度学习和机器学习,多年来一直在医学领域发挥作用。
例如,Translator利用机器学习筛选了数百个数据库,并建立了SHINE综合征与血压药物之间的联系,卢特说。
她对人工智能如何改善临床前和临床结果感到兴奋,例如通过学习过去临床试验中的错误并设计方法来改进它们,或者帮助识别用于临床试验招募的患者群体。
卢特说:“临床研究人员面临的一个经典问题是‘麻烦分析’,由于某些原因,这些分析总是显示出阳性反应。人工智能可以做到的是帮助在这些过程中进行模式识别……然后开始筛选出那些[假阳性],这样我们推动的化合物就更具预测性。”
在2024年的一次采访中,美国食品和药物管理局的Khair ElZarrad表达了同样的期望,他说机器学习工具可以在临床试验中用于改善患者监测和对研究方案的一致性遵循。在2021年发表在《Trials》1和《Nature》2上的论文也指出,人工智能可以在提高试验效率和评估患者资格方面发挥益处。
根据俄勒冈健康与科学大学波特兰分校的医学信息学和临床流行病学专家Bill Hersh的说法,人工智能还可以在医疗环境中发挥前线作用,他认为LLMs可以在医疗就诊期间作为聆听工具使用。
赫什说:“我们现在已经知道,为电子健康记录记录笔记会减慢医生的速度。新的LLM技术可以在医患接触时进行监听并生成笔记——加快这个过程。”
一个名为Epic的电子健康记录系统已经使用了这个系统,允许医生请求人工智能起草的笔记或个人健康记录的摘要。通过使用Epic等系统中包含的模板,卡明斯基说,可以更有效地标准化信息,这反过来又使得人工智能训练系统更容易处理。
卡明斯基说:“然后可以利用这批信息来教人工智能识别疾病模式。经过一段时间的研究和优化,可能会有系统提醒医生关于诊断的可能性。这对于常常需要数年才能识别的罕见疾病来说,尤其具有影响力。”
三、数据问题
尽管人工智能展现出巨大的潜力,但一些领域的专家强调需要谨慎。
Hongfang Liu是休斯顿德克萨斯大学健康科学中心的生物医学信息学专家,也是该学院转化人工智能卓越与医学应用中心的主要研究人员。她表示,尽管人工智能有潜力推进转化医学,但它遇到了同样一个问题是普遍减缓该领域发展的:缺乏高质量数据。
刘说:“现实世界的数据反映了我们面临的现实世界挑战。数据质量与健康的社会决定因素紧密相关,因此即使是一条数据记录也无法全面反映患者的情况。”
这意味着当人工智能模型在健康记录上训练时,它们经常会接收到关于未被充分服务患者的更少且质量较差的信息,刘说——从而加强模型对优势群体的偏见。
同样,使用像Epic这样的系统中的标准化模板可能会帮助人工智能更高效地处理数据。但是,据卢特所说,到目前为止,这导致人工智能模型更擅长理解这些明确划分的健康记录,而不是理解患者的实际陈述,这意味着它们在临床诊断的现实世界中的实用性较低。
卢特说:“我认为这为我们提供了一个关键机会,让我们思考如何伦理地使用人工智能,并确保我们满足不同患者和患者群体的需求。”
面对人工智能系统面临的数据稀缺问题,其他领域的研究人员已经找到了一种解决方法,即创建合成数据;换句话说,就是设计用来模拟现实世界数据输入的人工智能创建的数据。然而,科尔维斯表示,我们对疾病本身的理解仍然过于初步,无法有效地以合成形式重现。
刘说,这些问题的重要性在于研究数据的创建和质量,以识别影响数据收集的因素。
四、建立信任
除了数据问题之外,还有一个伴随人工智能——特别是大型语言模型(LLMs)——无论走到哪里都会出现的老问题。那就是它常常自信地犯错。最严重的错误发生在人工智能“幻觉”时,基本上是在概念之间建立了虚假或虚构的联系。如果人类用户没有注意到这一点,可能会导致研究人员走向危险和误导性的死胡同。
2021年发表在《Nature Machine Intelligence 》上的一篇论文发现,在尝试从胸部X光片中诊断COVID-19的多个AI工具中存在系统性的缺陷和偏见。在他们进行的文献综述中,研究人员发现,他们评估的320篇论文中有110篇至少未能满足三个用于确保结果可重复性和透明度的强制性标准(这些标准列在北美放射学会的人工智能医学成像清单中)。
根据赫什的说法,提高对这些错误认识的一种方法是设计一个能够解释其思考过程的AI。不幸的是,这说起来容易做起来难,因为AI的‘思考’通常是一个黑箱,这是由于其非线性和非象征性推理过程造成的。
赫什说:“自动化偏见是指我们过于依赖或者过于信任技术,以至于如果技术说我们应该这样做,那么我们就去做。这实际上是一个大问题。”
这可能意味着AI更适合于不那么‘吸引人’的工作,而不是替代医生,赫什说。例如,AI可以帮助优化医生的工作,给他们更多的时间与病人互动。
考虑到这一点,卡明斯基说,我们还应该记住,AI还处于起步阶段,错误和改进都是可以预料的。“即使是其他领域的专家,在学习初期也会犯错误,”他说。
最终,刘说,重要的是要记住医学是一项‘团队运动’,AI只是这个团队的新成员之一。为了确保这个工具被有效和道德地使用,她说,需要以人为中心的角度来运用它。
刘说:“我确实认为AI有潜力。但这一切都需要以人为中心。不要为了AI而做AI,而应该为了关怀而做AI。”