AI资讯新闻榜单内容搜索-R1

多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

逻辑推理是人类智能的核心能力，也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现，研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)

来自主题: AI技术研报

9979 点击 2025-06-07 10:35

速递｜AI编程黑马Anysphere再融9亿美元，14个月实现ARR1亿美元，估值破99亿美元

人工智能热潮使部分初创企业实现爆发式增长。但据估算，没有企业能比开发热门AI 编程助手 Cursor 的 Anysphere 增长更快。

来自主题: AI资讯

8024 点击 2025-06-06 16:01

真实联网搜索Agent，7B媲美满血R1，华为盘古DeepDiver给出开域信息获取新解法

大型语言模型 (LLM) 的发展日新月异，但实时「内化」与时俱进的知识仍然是一项挑战。如何让模型在面对复杂的知识密集型问题时，能够自主决策获取外部知识的策略？

来自主题: AI技术研报

9341 点击 2025-06-05 16:43

斯坦福临床医疗AI横评，DeepSeek把谷歌OpenAI都秒了

斯坦福最新大模型医疗任务全面评测，DeepSeek R1以66%胜率拿下第一！

来自主题: AI技术研报

5674 点击 2025-06-04 11:02

MiniMax正暗戳戳憋大招

MiniMax即将发布代号M+的文本推理模型，其表现将影响公司未来竞争力。面对DeepSeek R1的冲击，MiniMax采取国内C端不接入、海外接入的策略，并推出类Manus产品MiniMax Agent。公司通过品牌拆分（海螺AI更名）、纯API商业模式拓展市场，语音模型商业化效果显著，但未进入“基模五强”名单。新推理模型或成其保持行业地位的关键。

来自主题: AI资讯

10288 点击 2025-06-03 00:16