微软发布准确率是医学专家4倍AI诊断工具，还能会诊辩论-武汉翊众世纪公司

7月1日消息，微软开发出一款人工智能驱动的医疗工具，称其在诊断复杂疾病方面的成功率是人类医生的四倍。微软认为，这项技术能够加速诊疗进程。

去年，前DeepMind联合创始人穆斯塔法·苏莱曼在微软组建人工智能健康部门，成员基本来自他曾共同创立、现归谷歌所有的DeepMind研究院。这款名为“微软人工智能诊断协调器”（MAI-DxO）的工具也是该部门的首个研究成果。

现任微软人工智能首席执行官的苏莱曼在接受采访时表示，此次试验是迈向“医疗超级智能”的一步，有望帮助解决医疗系统人员短缺和患者候诊时间过长等问题。

微软这套新系统的核心是一个“协调器”，它能创建5个扮演“医生”角色的智能体并组成虚拟专家组，其中每个智能体分工明确，有的提出假设、有的专门选择诊断测试，并通过相互协作和“辩论”来共同制定诊疗方案。

为了测试其性能，研究人员让MAI-DxO学习了《新英格兰医学杂志》（NEJM）上发表的304份研究病例，这些案例详细描述了医生是如何解决最复杂病例的。这使得研究人员能够验证程序能否正确完成诊断并阐明其决策过程。测试采用了一种名为“辩论链”（chain of debate）的新技术，能让人工智能推理模型逐步说明解决问题的思路。

微软调用了来自OpenAI、Meta、Anthropic、谷歌、xAI和DeepSeek的主流大语言模型。协调器让所有大语言模型的表现都有提升，但与OpenAI的o3推理模型配合效果最佳，成功解决了85.5%的《新英格兰医学杂志》案例。

相比之下，经验丰富的人类医生在对比试验中的成功率约为20%。但在试验中，这些医生不允许查阅教科书或向同事请教，否则他们的成功率本可以更高。

这项技术可能很快会部署到微软的Copilot人工智能聊天机器人和必应搜索引擎中，目前这两个平台每天处理约5000万次健康咨询。

苏莱曼表示，微软正接近于实现“不仅仅是略优于人类，而是远超人类表现的AI模型：速度更快、成本更低、准确率高出四倍”。

“这将带来真正的变革，”他补充道。

苏莱曼取得这项研究成果之前，DeepMind在人工智能相关的医疗保健领域已取得一系列突破并处于领先地位。谷歌实验室负责人戴密斯·哈萨比斯（Demis Hassabis）去年因利用人工智能揭示支撑生命的蛋白质的生物奥秘，与他人共同获得诺贝尔化学奖。

微软已向OpenAI投资近140亿美元，并拥有其技术的独家使用权和销售权。然而，这家科技巨头正与试图转型为营利性实体的OpenAI陷入激烈博弈，双方在未来合作条款上存在分歧。

苏莱曼表示，尽管OpenAI的模型表现最佳，但微软对于“MAI-DxO”具体使用的四种“世界级模型”持“中立态度”。

“我们一直认为，它们终将成为商品……真正的差异化在于我们的聚合协调器。”他说。

去年末加入微软的前DeepMind健康部门负责人多米尼克·金（Dominic King）表示，程序的“表现超越了以往任何技术”，并且“如今有机会成为医疗服务的新入口”。

他表示，研究人员还引导人工智能模型考虑成本效益，在试验中显著减少了正确诊断所需的检查项目，在某些情况下可节省数十万美元。但金也强调，这项技术仍处于早期阶段，尚未经过同行评审，也未准备好在临床环境中使用。

快餐妹24小时联系方式查询,上门卖身24小时服务热线电话,闲鱼约本地鸡暗号怎么玩

微软发布准确率是医学专家4倍AI诊断工具，还能会诊辩论