AI资讯新闻榜单内容搜索-模型

智能体丝滑玩手机，决策延迟0.7秒！MSRA等提出验证器架构，不直接依赖大模型生成最终操作

随着人工智能和大语言模型（LLMs）的不断突破，如何将其优势赋能于现实世界中可实际部署的高效工具，成为了业界关注的焦点。

来自主题: AI技术研报

4287 点击 2025-04-03 15:19

让AI替码农卷复杂任务，贾佳亚团队提出MoTCoder，准确率刷新SOTA

大模型写代码早就是基操了，但让它写算法竞赛题或企业级系统代码，就像让只会煮泡面的人去做满汉全席 —— 生成的代码要么是 “铁板一块” 毫无章法，要么是 “一锅乱炖” 难以维护。

来自主题: AI技术研报

9752 点击 2025-04-03 15:12

视觉SSL终于追上了CLIP！Yann LeCun、谢赛宁等新作，逆转VQA任务固有认知

扩展无语言的视觉表征学习。

来自主题: AI技术研报

7899 点击 2025-04-03 15:06

类比的长河，为何流到大模型就被截流？

当我们遇到新问题时，往往会通过类比过去的经验来寻找解决方案，大语言模型能否如同人类一样类比？在对大模型的众多批判中，人们常说大模型只是记住了训练数据集中的模式，并没有进行真正的推理。

来自主题: AI技术研报

10720 点击 2025-04-03 10:50

OpenAI官方基准测试：承认Claude遥遥领先（狗头）

刚刚开源的新基准测试PaperBench，6款前沿大模型驱动智能体PK复现AI顶会论文，新版Claude-3.5-Sonnet显著超越o1/r1排名第一。与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比，PaperBench更考验综合能力，不再是只执行单一任务。

来自主题: AI资讯

10423 点击 2025-04-03 10:37

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！

来自主题: AI技术研报

8802 点击 2025-04-03 10:36

解锁600亿美元蓝海：端侧降噪 + RTC大模型重塑AI玩具交互体验

2025 年，DeepSeek 爆火带动传统产品的智能化升级，如传统玩具向 AI 玩具转型。央视新闻调查数据显示，2025 年 1 月，国内某电商平台面向 3-6 岁儿童的 AI 早教玩具销量环比增长 6 倍。咨询公司 IMARC 的预测数据显示，2024 年全球 AI 玩具市场规模已达 181 亿美元，预计到 2033 年将增长至 600 亿美元。

来自主题: AI资讯

9337 点击 2025-04-03 10:26