GoogleMIT:多智能体医疗决策框架MDAgents

|记昨日与国内某Top 1&2 医院科室老师及团队探讨技术、医学、信仰与责任而有感而发。

a6bace4f207e47e984f370e0b61c5c96.jpg

生成式基础大模型正在成为临床辅助甚至医学探索领域的宝贵工具。尽管我们在国内看到了很多企业或实验室联合医疗机构在如医疗记录生成、临床表型辅助诊疗、医疗知识问答交互、医院管理决策甚至于科研探索等方向进行了基于LLM的深入探索与场景落地。

然而,尽管它们前景广阔,但在更复杂的涉及医学深度知识推理与临床过程中的复杂决策任务中如何最好地利用大型语言模型 (LLM) 仍是一个悬而未决的问题。

同时,随着近期OpenAI o1模型的发布以及多模态大模型的快速进展,我们看到了在不管在形式化概念空间领域也好,还是在真实世界空间智能下领域,推理时 (test-time compute) 正在纳入到scaling law整体扩张版图中的一部分,从而也让我们可以想象到不管来自于从模型内部神经网络的reasoning还是到跨多模型间在面向复杂任务领域下诸如协作时、交互时、规划拆解时等更多scaling law下其蕴含于其中相同的本质与延展的可能...如在复杂的跨多学科临床决策 (MDT) 、大型平台型临床试验及多学科交叉科研探索等领域。

近日,MIT、Google Research和首尔国立大学医院的研究人员提出了一种新颖的多智能体框架 MDAgents,它通过自动为 LLM团队分配协作结构来帮助解决这一差距。

b767ca091455436fb655321b492bd7e3.jpg

具体来说,MDAgents作为一个多智能体框架,旨在根据医疗任务的复杂性动态分配 LLM 之间的协作,模拟现实世界的医疗决策,其框架围绕医疗决策的四个关键阶段构建:

fffa3d59c3334a56b822a9de16070516.jpg

 - 首先评估医疗查询的复杂程度,将其分为低、中、高;

 - 根据此评估,招募合适的专家:针对较简单的病例,招募单个临床医生;针对较复杂的病例,招募多学科团队;

 - 然后,分析阶段将根据案例的复杂程度采用不同的方法,包括从个人评估到协作讨论;

 - 最后,系统综合所有见解以形成结论性决策,准确的结果表明,与单智能体和其他多智能体设置相比,MDAgents 在各种医疗基准上都具有有效性。

bb9f9f44d66c472b93762ec58c17cdda.jpg

649b531cd0d6481a9c07a3694d0d4206.jpg

结果上来看,MDAgents在各种医疗基准测试中表现良好,在10个基准测试中的7个中超越了之前的方法,准确率提高了4.2%;关键步骤包括评估任务复杂性、选择合适的智能体和综合响应,通过小组评审可将准确率提高11.8%;MDAgents还通过调整智能体使用来平衡性能和效率等。

36cc44b37db64a039788283859238286.jpg

de4ebf5d939245c49eb773f580cc7f94.jpg

7b7972c20a24456fb35073f956bf7a21.jpg 

77f2e77a9ff341bfa0368a74c17d67cd.jpg

我想在新的scaling law下,不管是类o1模型的隐性的参数化reasoning还是显性的设计灵活的模型间或与人类通信协作下的Multi-agent,未来必将touch到更复杂任务领域,那时人类与AI两者的关系亦值得我们当下去思考和规划。

今年,我们也看到国内外很多研究机构或科技公司(如Google,我所服务的企业)均发布了在医疗领域包括基础模型在概念或真实空间中的Self play RL训练框架(Google)、多模态融合框架(Stanford)、循证可解释性框架、复杂推理-时、Multi-agent(清华)、RAG等技术,并依旧尝试在复杂医学领域探索前行,我想这亦不光是医工人才们对技术信仰的追求,而是更多的一份对未来的一种责任。

在我之前多篇博客文章中也有诸多涉及医疗+AI大模型的观点文章,大伙感兴趣阅读可回顾参考,也感谢大家一直以来的捧场与互动。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.xdnf.cn/news/13525.html

如若内容造成侵权/违法违规/事实不符,请联系一条长河网进行投诉反馈,一经查实,立即删除!

相关文章

【数据库】深入解析慢 SQL 的识别与优化策略

文章目录 什么是慢 SQL?慢 SQL 的危害如何检测分析慢 SQL使用 MySQL 慢查询日志利用 EXPLAIN 分析执行计划通过 Profiling 获取详细执行信息借助慢 SQL 收集分析平台 实际案例解析:600秒的慢 SQL 优化之旅问题描述初步分析优化步骤1. 优化 SQL 语句结构2…

高校大数据人工智能教学沙盘分享

大数据教学实训沙盘(TipDM-SP)是根据企业实际项目建设而成,并提供沙盘配套装置、软件以及教学实训资源。沙盘的作用主要有3个: 1、采集真实数据,解决教学中缺少真实数据的困扰; 2、形成从数据…

【C++】string模拟实现

各位读者老爷好,俺最近在学习string的一些知识。为了更好的了解string的结构,俺模拟实现了一个丐版string,有兴趣的老爷不妨垂阅!!! 目录 1.string类的定义 2.模拟实现成员函数接口 2.1.constructor&am…

c_str()函数 string类型转换成char*类型 C++实现

问题:在 class 的构造函数中,如果我们在类中初始化了 char * 类型,在调用构造函数时,如果直接传入字符串( string )类型,编译器会提出如下警告: 想要消除这个警告,就需要将 string 类型的变量转…

【vue3文件上传同时出现两个提示框,一个提示成功,一个提示失败,一个是用写死的,一个是接口返回的】

文件上传同时出现两个提示框,一个提示成功,一个提示失败,一个是用写死的,一个是接口返回的 原因: 接口返回的是字符串code200" 把判断的code码改为字符串的就好了

选择哪种Facebook广告目标更有效

在Facebook广告投放中,广告目标的选择决定了投放效果和转化率,但很多人往往忽略了这一步的细节。今天,我们来一起看看Facebook广告目标有哪些,以及如何精准选择! 1. 广告目标在投放中的重要性 广告目标不仅仅是一…

matlab实现主成分分析方法图像压缩和传输重建

原创 风一样的航哥 航哥小站 2024年11月12日 15:23 江苏 为了研究图像的渐进式传输技术,前文提到过小波变换,但是发现小波变换非常适合传输缩略图,实现渐进式传输每次传输的数据量不一样,这是因为每次变换之后低频成分大约是上一…

【缓存策略】你知道 Cache Aside(缓存旁路)这个缓存策略吗

👉博主介绍: 博主从事应用安全和大数据领域,有8年研发经验,5年面试官经验,Java技术专家,WEB架构师,阿里云专家博主,华为云云享专家,51CTO 专家博主 ⛪️ 个人社区&#x…

稀疏视角CBCT重建的几何感知衰减学习|文献速递-基于深度学习的病灶分割与数据超分辨率

Title 题目 Geometry-Aware Attenuation Learning forSparse-View CBCT Reconstruction 稀疏视角CBCT重建的几何感知衰减学习 01 文献速递介绍 稀疏视角锥形束计算机断层扫描(CBCT)重建的几何感知学习方法 锥形束计算机断层扫描(CBCT&a…

电子应用产品设计方案-3:插座式自动温控器设计

一、设计 插座式自动温控器作为一种便捷的温度控制设备,在日常生活和工业应用中发挥着重要作用。它能够根据环境温度的变化自动控制连接设备的电源通断,实现对温度的精确调节和节能控制。本设计旨在提供一种功能强大、易于使用、安全可靠的插座式自动温控…

机器学习—神经网络的Softmax输出

为了建立一个能进行多类分类的神经网络,将采用Softmax回归模型,把它放入神经网络的输出层,如何实现? 当我们用两门课做手写数字识别的时候,我们使用这种架构的神经网络,如果你现在想用十个类进行手写数字分…

web——sqliabs靶场——第五关——报错注入和布尔盲注

这一关开始上强度了,不回显东西了,又要学到新的东西了 发现它没有正确的回显,学到了新知识,报错注入 报错注入 什么是报错注入: MySQL提供了一个 updatexml() 函数,当第二个参数包含特殊符号时会报错&am…

【JavaScript】LeetCode:86-90

文章目录 86 只出现一次的数字87 颜色分类88 下一个排列89 寻找重复数90 前K个高频元素 86 只出现一次的数字 异或x ^ x 0,x ^ 0 x,相同为0,相异为1,且满足交换律。例如:[4, 1, 2, 1, 2] > 1 ^ 1 ^ 2 ^ 2 ^ 4 0 …

CSS回顾-基础知识详解

一、引言 在前端开发领域,CSS 曾是构建网页视觉效果的关键,与 HTML、JavaScript 一起打造精彩的网络世界。但随着组件库的大量涌现,我们亲手书写 CSS 样式的情况越来越少,CSS 基础知识也逐渐被我们遗忘。 现在,这种遗…

Spring Boot编程训练系统:构建可扩展的应用

摘要 随着信息技术在管理上越来越深入而广泛的应用,管理信息系统的实施在技术上已逐步成熟。本文介绍了编程训练系统的开发全过程。通过分析编程训练系统管理的不足,创建了一个计算机管理编程训练系统的方案。文章介绍了编程训练系统的系统分析部分&…

点云论文阅读-1-pointnet++

pointnet局限性:不能获取局部结构信息 作者提出pointnet需要解决的问题: 如何生成点云的分区(需要保证每一个分区具有相似的结构,使学习算法的参数在局部共享)如何通过一个局部特征学习算法抽象点云或局部特征 解决…

Summaries 总结

Goto Data Grid 数据网格 Summaries 摘要 Summary Types 摘要类型 Total Summary 总摘要 汇总总数 (GridSummaryItem) 将针对所有数据网格记录进行计算,并显示在视图页脚中。启用 View 的 OptionsView.ShowFooter 设置以显示视图页脚。 …

MySQL技巧之跨服务器数据查询:基础篇-如何获取查询语句中的参数

MySQL技巧之跨服务器数据查询:基础篇-如何获取查询语句中的参数 上一篇已经描述:借用微软的SQL Server ODBC 即可实现MySQL跨服务器间的数据查询。 而且还介绍了如何获得一个在MS SQL Server 可以连接指定实例的MySQL数据库的连接名: MY_ODBC_MYSQL 以…

unity3d————协程练习题

1.计秒器: void Start(){StartCoroutine(MyCoroutine());}IEnumerator MyCoroutine(){int time 0;while(true){print(time "秒");time;yield return new WaitForSeconds(1);}} 结果: 2.生成多个cude (不卡顿)&#x…

Go开发指南- Gorouting

目录: (1)Go开发指南-Hello World (2)Go开发指南-Gin与Web开发 (3)Go开发指南-Gorouting Goroutine 在java中我们要实现并发编程的时候,通常要自己维护一个线程池,并且需要去包装任务、调度任务和维护上下文切换。这个过程需要消耗大量的精…