AI资讯新闻榜单内容搜索-模型评测

国产医疗大模型登顶权威榜单！核心秘籍：PB级训练数据、模拟医生真实会诊过程

2月7日，中文医疗大模型评测平台MedBench公布最新多模态大模型评测榜单，数坤科技的数坤坤多模态医学大模型V3以63.6分拿下第一。在榜单中，V3的表现超过微医、云知声旗下医疗行业大模型，以及OpenAI、谷歌、阿里千问旗下通用大模型。

来自主题: AI资讯

8368 点击 2026-02-14 10:38

Claude 5史诗级泄露，史上最强编程模型评测炸裂！核心秘密曝光

Anthropic的新模型要来了！代号Fennec的Claude Sonnet 5马上要发布，性能吊打市面上所有编程大模型，价格还砍掉50%，还能比肩一整个人类开发团队，可以说达到编程领域的巅峰。

来自主题: AI资讯

9662 点击 2026-02-04 17:27

具身智能DeepSeek时刻！千寻智能模型开源即登顶全球榜单

全球榜单中唯一成功率超过50%的模型。今日，千寻智能正式开源自研VLA基础模型Spirit v1.5，就在前一天，该模型在全球具身智能模型评测平台RoboChallenge上，综合评测斩获第一。

来自主题: AI资讯

9951 点击 2026-01-12 09:27

807道灵魂拷问后，中国模型竟在「意义测试」中夺冠！

AI不仅会做PPT，写代码，它还能理解更深层次的问题。在美国的一项偏重于文化领域的新基准测试中，中国开源模型Qwen3夺冠，DeepSeek的R1跻身前六，力压多家全球顶级的明星模型。

来自主题: AI资讯

6595 点击 2025-12-23 10:06

中国AI开源16强，最新出炉

知名AI大模型评测Chatbot Arena放榜！阿里Qwen3-235B-A22B-Instruct-2507位列大语言模型总榜第三，月之暗面Kimi-K2-0711-preview、深度求索DeepSeek-R1-0528并列为总榜第五，以开源之姿超越Claude 4、GPT-4.1等顶尖闭源模型。

来自主题: AI资讯

11483 点击 2025-08-05 10:47