性能碾压谷歌!5000亿美元巨头开源最强端侧医疗AI,背后藏着一家中国企业!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
性能碾压谷歌!5000亿美元巨头开源最强端侧医疗AI,背后藏着一家中国企业!
6548点击    2026-05-13 10:48

一家估值超5000亿美元的币圈富豪公司,秀出了性能碾压谷歌的AI医疗大模型。


近日,以发行全球最大稳定币USDT闻名的Tether推出了AI医疗大模型QVAC MedPsy,并在多项医学推理与诊断基准测试中展现出令人意外的强大性能:


这款仅1.7B参数的轻量级模型,击败了规模大16倍的谷歌MedGemma-27B;且4B版本使用的token比主流模型少3.2倍,在降低计算成本的同时保持了较高的输出质量。


这一结果,直接挑战了AI医疗领域长期存在的“模型规模越大,效果越好”的共识,在官方技术通稿中,Tether AI团队强调,该模型更接近一种“轻量级高密度推理系统”。


性能碾压谷歌!5000亿美元巨头开源最强端侧医疗AI,背后藏着一家中国企业!


不少开发者社区也对其“低参数、高性能”的组合方式给予了积极评价,认为其可能代表医疗大模型的一条新路径。


值得关注的是,Tether旗下AI团队在2024年才启动招募,成立时间极短。从其官网披露的技术说明与开源链路来看,QVAC MedPsy的训练并非完全从零开始构建,而是在多个基础模型之上进行组合式训练与优化。


性能碾压谷歌!5000亿美元巨头开源最强端侧医疗AI,背后藏着一家中国企业!


进一步追溯其论文与技术报告可以发现,在封闭式医学基准测试与HealthBench评估框架中,Tether团队实际采用了来自中国公司的开源医疗大模型——百川智能的Baichuan-M3-235B作为自己的“教师模型”


中国大模型的持久统治力


在Tether团队的内部模型筛选中,Baichuan-M3同台竞技的对手包括OpenAI的GPT-OSS-120B以及量化巨头旗下Ubiquant AI推出的Fleming-R1-32B。


而Baichuan-M3-235B在几乎所有核心评测指标上都展现出明显优势,尤其是在高复杂度医学问题上的表现,拉开了显著差距。


其中,最值得关注的是医学推理基准MedXpertQA。


这是目前业内公认难度最高的医学多选评测之一,相比传统基于USMLE题库的MedQA,它更强调复杂临床推理、多学科诊断与长链路决策能力,某种程度上,更接近顶级医院MDT(多学科会诊)场景下的真实医学判断。


在这一基准上,Baichuan-M3相比竞品取得了高达10.98分的领先优势。对于医疗AI而言,这已经不是简单的“精度提升”,而是意味着模型在复杂病情理解、诊疗逻辑组织以及医学知识调用能力上,出现了代际差异。


不仅如此,在经典大模型评测MMLU-Pro Health上,Baichuan-M3同样展现出显著领先,分别取得了+5.05 / +2.73的优势表现。


事实上,早在2026年1月首次发布时,Baichuan-M3就已经在全球权威医疗AI评测基准 HealthBench上击败GPT-5.2,并刷新当时最高纪录。更难得的是,在AI行业已经进入“月更时代”的背景下,这一优势并未随着时间迅速衰减。


具体来看,Baichuan-M3-235B相较GPT-OSS-120B领先约6至12分,相较Fleming-R1-32B领先约10至12分,并且在HealthBench全部七个维度上都维持了持续性的优势。


性能碾压谷歌!5000亿美元巨头开源最强端侧医疗AI,背后藏着一家中国企业!

Tether团队对Baichuan-M3模型的评价


这种持续领先的背后,是百川在医疗强化学习体系上的长期投入。


从2025年M2开始,百川便将原本依赖患者模拟器与静态Rubric的半动态反馈机制,升级为能够随模型能力共同演化的全动态Verifier System。随着监督信号不断细化、难化,模型得以持续突破能力上限,最终让M3在复杂医学推理与医疗沟通能力上实现跃迁。


与此同时,M3还首次具备了原生“端到端”严肃问诊能力。它能够像真实医生一样主动追问、逐层逼近病因,把关键病史和风险信号一步步问出来,再基于完整信息进行深度医学推理。


这也是为什么,Tether团队并不是Baichuan-M系列模型唯一的支持者。Baichuan-M系列模型在开源社区累计获得超过150万次下载,同时受益于百川推出的「海纳百川」计划,M3 Plus API已向服务医务工作者的机构免费开放,目前已有大量团队基于该模型构建医疗应用。


甚至在今年3月OpenAI发布GPT-5.4后,仍有不少开发者在社区中呼吁,希望GPT系列与Baichuan-M3在HealthBench上展开正面对决,并质疑GPT在医疗健康领域的真实能力,是否已经被中国医疗大模型反超。


性能碾压谷歌!5000亿美元巨头开源最强端侧医疗AI,背后藏着一家中国企业!


正如百川智能创始人、CEO王小川在媒体采访中表达的:“(AI医疗)护城河核心肯定在于模型能力的绝对领先,在医疗这一严肃领域,只有领先一代的技术水平才能建立行业信任 。”


重构专业医疗的“数字基建”


当大模型浪潮席卷各行各业时,真正能切入医疗AI的公司并不多,百川智能算是其中最早的一批。


早在2023年,百川智能成立后迅速跻身国内大模型赛道的前列。到了2025年,百川智能明确了“为人类造医生、为生命建模型”的核心路径,其发布的模型几乎全部围绕医疗场景和推理能力增强展开。


同年10月,百川推出首个循证增强医疗大模型Baichuan-M2Plus,在幻觉率控制上明显优于通用大模型,降低至Deepseek的三分之一,可信度接近资深临床医生水准。


年底,百川智能发布医疗Agent平台PAPA(PlayBook Animated Proactive Agent),能够从提醒用药到动态调整健康计划,实现月度乃至年度的患者康复进程管理,真正将AI嵌入临床闭环。


随后登场的医疗大模型Baichuan-M3更一鸣惊人。在全球权威医疗评测 HealthBench 中以 65.1分 登顶,首次全面超越 GPT-5.2,并刷新了医疗幻觉率最低记录。


2026年以来,医疗健康已成为AI最受重视的落地领域之一。OpenAI推出“个人超级健康助手”ChatGPT Health,谷歌发布最新开源医疗模型MedGemma 1.5,Anthropic也掏出Claude for Healthcare来抢占医疗市场。


不同于通用大模型“先做能力、再找场景”的路径,百川智能选择深耕医疗垂类,围绕临床真实需求打磨产品,持续突破低幻觉率、端到端问诊和复杂临床推理等核心能力。


百川智能构建的“深度问诊”能力,让模型在有限对话轮次中,将临床所需问题问全、问准,其表现甚至显著高于人类医生基线。


首创的“证据锚定”技术,不仅提供引文来源,还将每一句医学结论精确映射到原始论文的对应段落,使AI的医学判断可核验、可追责、可教学,极大增强了临床可信度。


这也让百川智能在医疗AI行业进入深水区后,逐渐形成差异化优势——不仅有强大模型能力,更熟悉医院工作流,更贴近真实临床场景。


在政策支持、医院数智化升级与大模型能力突破的多重推动下,医疗AI正在进入真正的产业化周期。而提前完成垂类深耕、建立技术与场景闭环的百川智能,显然已经站在了更有利的位置。


此外,据智药局获悉,百川智能即将发布AI医疗应用产品与新一代大模型,其应用表现与技术成果值得高度期待。


文章来自于"智药局",作者 "智药局"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI医疗影像

【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。

项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file