蚂蚁医疗大模型拿下MedBench测评“双料”冠军

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
蚂蚁医疗大模型拿下MedBench测评“双料”冠军
5392点击    2025-03-13 10:30

近日,记者发现,国内权威医疗大模型评测平台MedBench在官网更新了榜单。多个医疗AI产品及研究团队入榜,其中蚂蚁AI健康管家团队研发的蚂蚁医疗大模型以评测榜单97.5、自测榜单98.2的高分再度夺得双料冠军。


蚂蚁医疗大模型拿下MedBench测评“双料”冠军

支付宝医疗大模型发布现场


蚂蚁医疗大模型拿下MedBench测评“双料”冠军

(MedBench评测榜单截图)


蚂蚁医疗大模型拿下MedBench测评“双料”冠军

(MedBench自测榜单截图)


MedBench测评结果显示,蚂蚁医疗大模型在医学知识问答、医学语言生成、复杂医学推理三类单项中位居第一,同时,在医学语言理解和医疗安全和伦理等纬度也有突出表现。在此前的榜单综合测评中,蚂蚁医疗大模型也长期位居综合榜第一。


医疗行业是复杂度较高的领域,医疗大模型实时评估体系对应用稳定落地尤为关键。MedBench为中文医疗大语言模型提供了一个公平、透明且科学的评估标准,蚂蚁医疗大模型登顶榜单,意味着其当前的技术能力转化为医疗AI产品具备专业度和领先性。


据了解,蚂蚁医疗健康团队近期完成了基于强化学习的新一代医疗推理模型研发。AI引擎升级后,该垂直行业大模型不仅具备“医学思维”推理能力,还能完成“图、文、音视频等”多模态交互。基于此,蚂蚁医疗大模型添加百亿级中英文图文、千亿级医疗文本语料及千万级高质量医疗知识图谱进行专业知识训练,经过医患诊疗、药厂等真实场景问答的多任务微调,以及数百个专业医学团队、医生标注数据的强化学习。以医学报告、药品、毛发等图像识别为例,目前该模型准确率达90%以上。


在安全性上,蚂蚁医疗大模型集合了蚂蚁集团在隐私安全风控方面的技术优势,并在数据使用的去标识化方面遵循安全隐私标准。从去年7月推出以来,还面向行业开放了配套的“可信一体机+可信云”解决方案,保障数据隐私与算力效率,为医院、医疗机构提供可靠的本地部署与数据保护支持。


据悉,蚂蚁医疗健康成立至今已有10年,从2023年开始进军医疗AI领域,除了投入垂直领域大模型技术研发外,在AI应用层面同样进展迅速。


公开资料显示,其与浙江卫健委联合推出全国首个省级官方AI健康应用“安诊儿”,已累计服务近3000万人次,覆盖浙江省内1000余家医疗机构。去年7月,与国内头部三家医院、权威医疗机构成立AI医疗创新应用“联盟”以来,蚂蚁医疗健康已与各地卫健委、医保局、医院、医生合作研发了近百个医生智能体,在完成对好大夫在线收购后,双方在AI辅助医生工作方面开展探索,推出“AI科普助手”等系列产品。截至目前,蚂蚁医疗大模型已经成为业内应用场景最丰富、与医疗机构、医生、医院共建最深的垂类大模型之一。


文章来自于“老马那些事”,作者“子莹”。


蚂蚁医疗大模型拿下MedBench测评“双料”冠军

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI医疗影像

【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。

项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file

5
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner