AI资讯新闻榜单内容搜索-ATI

通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA

WebAgent 续作《WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization》中

来自主题: AI资讯

8340 点击 2025-07-30 11:26

ICML25|标点符号竟是LLM记忆核心！正确处理性能暴涨

近年来，大语言模型（LLM）的能力越来越强，但它们的“饭量”也越来越大。这个“饭量”主要体现在计算和内存上。当模型处理的文本越来越长时，一个叫做“自注意力（Self-Attention）”的核心机制会导致计算量呈平方级增长。这就像一个房间里的人开会，如果每个人都要和在场的其他所有人单独聊一遍，那么随着人数增加，总的对话次数会爆炸式增长。

来自主题: AI技术研报

8591 点击 2025-07-29 12:29

抗干扰能力提升近40% ！无需对抗训练，北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

在人工智能模型规模持续扩大的今天，数据集蒸馏（Dataset Distillation,DD）方法能够通过使用更少的数据，达到接近完整数据的训练效果，提升模型训练效率，降低训练成本。

来自主题: AI技术研报

8260 点击 2025-07-29 10:12

上下文工程难吗？试下Claude Code写入Kiro的Spec，自动搞定上下文

10天前Amazon发布了他们自己的开发平台，Kiro IDE，其中有一个很厉害的交互功能“Spec（Specification）”，强调的是规范的文档，说明书，以一套非常结构化的方法确保开发过程的系统性、可控性和质量，堪称现代软件工程的最佳实践。让vibe coding有一个规范的范式。

来自主题: AI资讯

9147 点击 2025-07-26 11:46

提速79%！上交大新方法优化企业级AI流程调度 | IEEE ICDCS’ 25

复合LLM应用 (compound LLM applications) 是一种结合大语言模型（LLM）与外部工具、API、或其他LLM的高效多阶段工作流应用。

来自主题: AI技术研报

9744 点击 2025-07-25 09:51

Z Potentials｜Milton Yan, 00后辍学创业 Agent-native PaaS，打造Agent爆款制造机

自 ChatGPT 引爆公众认知以来，AI 开始渗透进写作、编程、设计等多个应用场景，推动人类进入“智能体（Agent）”时代。曾经遥不可及的自动化交互，如今正在成为现实。在这背后，一场关于基础设施的重构也悄然展开——从模型能力到部署体验，谁能打通智能 Agent 的“最后一公里”，谁就掌握了这场范式变革的主动权。

来自主题: AI资讯

8626 点击 2025-07-23 13:34

飞书WPS们大战AI办公，OpenAI也要加入战场？

据海外科技媒体《The Information》报道，OpenAI 正在开发一项重要功能——让 ChatGPT 原生支持并编辑 Excel 和 PowerPoint 文件。这意味着，用户未来可以直接在 ChatGPT 中创建或者打开 .xlsx 和 .pptx 文件，并在 AI 的协助下进行公式输入、图表分析、幻灯片排版等操作，无需依赖传统 Office 软件。

来自主题: AI资讯

8465 点击 2025-07-23 09:52