研究人员发现,AI聊天机器人显示出作为诊断伙伴的潜力

联系人:Sarah Finlaw, Sarah.finlaw@bilh.org 杰奎琳·米切尔著

2023年12月11日

Large Language Model Outperformed Physicians Under Certain 金博宝官网登录; Could Potentially Curb Over Treatment

波士顿 金博宝官网登录(金宝搏手机登录)的内科研究人员将聊天机器人的概率推理与人类临床医生的概率推理进行了比较. 研究结果发表在 JAMA网络开放, 提示人工智能可以作为医生有用的临床决策支持工具.

“人类很难进行概率推理, 基于计算赔率来做决定的做法,该研究的通讯作者亚当·罗德曼说, MD, 内科医生和内科医生 调查员金宝搏手机登录医学系工作. “概率推理是做出诊断的几个组成部分之一, 这是一个非常复杂的过程,需要使用各种不同的认知策略. 我们选择孤立地评估概率推理,因为这是一个众所周知的人类可以使用支持的领域.”

他们的研究基于先前发表的一项全国调查,调查了550多名从业人员对5个医疗案例进行概率推理, 罗德曼及其同事提供了公开可用的大型语言模型(LLM), 聊天GPT-4, 同样的一系列案例,并运行相同的提示100次,以生成一系列响应.

聊天机器人——就像他们之前的医生一样——的任务是根据病人的陈述来估计给定诊断的可能性. 然后, 考虑到肺炎的胸部x光检查结果, 乳房x光检查乳腺癌, 冠状动脉疾病的压力测试和尿路感染的尿液培养, 聊天机器人程序更新了它的估计.

当检测结果呈阳性时, it was something of a draw; the chatbot was more accurate in making diagnoses than the humans in two cases, 在两种情况下同样准确,在一种情况下不太准确. 但化验结果呈阴性, 聊天机器人闪闪发光, 在所有五种情况下的诊断都比人类更准确.

“在检测结果为阴性后,人们有时会觉得风险比实际更高, 哪些会导致过度治疗, 更多的检查和太多的药物,罗德曼说.

但罗德曼对聊天机器人和人类面对面的表现不太感兴趣,他更感兴趣的是,在诊所里使用这些新的辅助技术后,高技能的医生的表现可能会发生怎样的变化, 添加罗德曼. 他和同事们正在对此进行调查.

“法学硕士无法接触外部世界——他们不像流行病学家那样计算概率, 甚至是扑克玩家, do. 它们所做的事情与人类如何做出现场概率决策有更多的共同点,他说. “但这就是令人兴奋的地方. 即使不完美, 它们的易用性和集成到临床工作流程中的能力理论上可以使人类做出更好的决策,他说. “未来对人类集体智能和人工智能的研究是非常必要的.”

共同作者包括Thomas A. Buckley, University of Massachusetts Amherst; Arun K. Manrai, PhD, Harvard Medical School; Daniel J. 摩根,MD, MS,马里兰大学医学院.

罗德曼报告说,他接受了戈登和贝蒂·摩尔基金会的资助. 据报道,摩根收到了退伍军人事务部的拨款, 医疗保健研究和质量局, 疾病控制和预防中心, 以及美国国立卫生研究院, 并接受美国传染病学会的旅费报销, 美国卫生保健流行病学协会. 美国内科医师学会和世界心脏卫生组织外提交了这份工作. 没有其他披露的报道.

关于金博宝官网登录

金博宝官网登录是一个领先的学术医疗中心, 在那里,高质量的教育和研究支持了非凡的护理. 金宝搏手机登录是哈佛医学院的教学附属机构, 并且在美国国立卫生研究院资助的独立医院中一直处于全国领先地位. 金宝搏手机登录是波士顿红袜队的官方医院.

金博宝官网登录是贝斯以色列勒希健康的一部分, 一个将学术医疗中心和教学医院结合在一起的卫生保健系统, 社区和专科医院, 4人以上,800名医生和38名,通过突破性的研究和教育,扩大获得优质护理的机会,推进医学科学和实践,这是我们的共同使命.