AI资讯新闻榜单内容搜索-模型

从Debugger到Developer : 低代码时代新基准NoCode-bench，SWE-Bench作者力荐

当前，大型语言模型（LLM）在软件工程领域的应用日新月异，尤其是在自动修复 Bug 方面，以 SWE-bench 为代表的基准测试展示了 AI 惊人的潜力。然而，软件开发远不止于修 Bug，功能开发与迭代才是日常工作的重头戏。

来自主题: AI技术研报

8035 点击 2025-08-08 17:01

无需外部数据！AI自问自答实现推理能力进化

AI通过自问自答就能提升推理能力？！这正是卡内基梅隆大学团队提出的新框架SQLM——一种无需外部数据的自我提问模型。

来自主题: AI资讯

7069 点击 2025-08-08 16:56

GPT-5，AI的「登月时刻」来了！奥特曼现场发布，三位一体博士级智能体

作为一款全新的「融合模型」，GPT-5将博士级的推理能力带给了所有OpenAI用户。它不仅在编程、写作等方面实现了巨大飞跃，更是在准确性上获得了史诗级提升。它的问世，标志着AI竞争已从模型发布转向真正的「智能发布」。

来自主题: AI资讯

7158 点击 2025-08-08 14:48

全球第一再升级！MiniMax Speech 2.5上线：多语种表现力更强，音色复刻更“像”

今天，MiniMax发布新一代语音生成模型Speech 2.5，再次刷新全球最强语音模型的上限。

来自主题: AI资讯

7719 点击 2025-08-08 14:17

AI界拼多多，首篇分析agent能效比的系统性工作！

一句话概括，花大价钱请来的AI智能体天天搁那儿“过度思考”，这篇论文教你如何让它“该省省该花花”，别再当冤大头了，当你给智能体卸掉复杂记忆/冗余规划这些"奢侈品"后，发现它跑得比香港记者还快还便宜。

来自主题: AI资讯

7870 点击 2025-08-08 13:37

AI 科普丨都2025年了，人们到底在用AI做什么？国外大牛总结了100个案例

近一年来，围绕人工智能（AI）、生成式 AI（GenAI）和大语言模型（LLM）的炒作愈演愈烈，大众的兴趣翻了一番，针对 AI 的投资激增，各国政府也采取了更加明确的立场。根据一些人的说法，AI 与人类的未来息息相关。

来自主题: AI资讯

7761 点击 2025-08-08 12:41

中国人工智能报告2025：新趋势

人工智能引领第四次科技革命，是当前最火的、最具前景、最具爆发力的科技赛道。进入到2025年，发生了什么新的变化？中国人工智能正告别“百模大战”的规模竞赛，向以DeepSeek等六小虎为代表的头部大模型集中。AI发展的核心，从追求模型“可用”转向实现场景的“好用”。

来自主题: AI资讯

25857 点击 2025-08-08 12:33

云计算一哥首度牵手OpenAI，大模型「选择」自由，才是终极胜利

昨天是个热闹的日子，OpenAI 和 Anthropic 几乎在同一时间发布了自家的新款模型：前者是自 GPT-2 以来重新开源的两款模型 gpt-oss（120b 和 20b），后者是 Claude 系列最强的 Opus 4.1。

来自主题: AI资讯

9033 点击 2025-08-08 12:26

颠覆互联网的下一波浪潮：Agentic Web来了！

过去三十年，互联网经历了从静态网页到智能推荐的深刻演变。如今，我们正站在互联网的另一个重大转折点上。这一转折，来自一种全新的范式设想 —— Agentic Web，一个由 AI 智能体组成的、目标导向型的互联网系统。在这个新框架中，用户不再手动浏览网页、点击按钮，而是通过自然语言向智能体发出一个目标，AI 会自主规划、搜索、调用服务、协调其他智能体，最终完成复杂任务。

来自主题: AI技术研报

8869 点击 2025-08-08 12:03

硬核拆解大模型，从 DeepSeek-V3 到 Kimi K2 ，一文看懂 LLM 主流架构

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024–2025 年的 DeepSeek-V3 和 LLaMA 4，不难发现一个有趣的现象：尽管模型能力不断提升，但其整体架构在这七年中保持了高度一致。

来自主题: AI技术研报

9292 点击 2025-08-08 11:52