AI资讯新闻榜单内容搜索-模型

分享一个很前沿的 AI4AI 成果：两个月，把 Deep Search 做到了SOTA

刚读了一篇 AI4AI 论文《AI4AI at Scale》，来自 XYZ Agentic Team。还是第一次听到这个 Lab。他们用 AI4AI 的方式做出了两个很强的搜索 agent，也公开了方法。借这篇 paper 讲讲 AI4AI 到底怎么工作，下面尽量少堆术语。

来自主题: AI技术研报

8422 点击 2026-07-26 15:38

美团LongCat模型负责人将离职

有知情人士透露，美团LongCat团队基础模型负责人裴鹏即将离职。公开资料显示，裴鹏毕业于北京大学，长期深耕信息检索与自然语言处理方向，职业履历覆盖多家全球顶尖科技企业。

来自主题: AI资讯

9369 点击 2026-07-26 14:53

四大AI手搓蒙娜丽莎！8次临摹，最像那版全被自己改没了

新智元报道 AI第一次拿起彩铅画蒙娜丽莎，但发生了一件奇怪的事：没有任何一个模型的最终作品，赢过它自己中途最好那版：它们总在最好的时候改过了头。而且，同样是7幅画，成本相差了20倍！最左为原作，

来自主题: AI资讯

8618 点击 2026-07-26 14:24

起底 AI 中转站江湖

2026 年春天，AI 中转站这门略显灰色的生意，突然迎来了一位最不缺流量的玩家。4 月，孙宇晨开始为 B.AI 站台，把「一个 Key 调用所有大模型」的生意，称作「AI Agent 的底层金融基础设施」。

来自主题: AI资讯

8325 点击 2026-07-26 14:23

Vibe Coding撞墙了？换个思路治好AI编程的「局部失忆」

现在的 Agent 将所有的工程线索和垃圾噪音都一股脑扔进 Chat Context 里，缺乏一层独立、结构化的 Engineering State 来做隔离与控制。为了打破这个瓶颈，Valkor 联合浙江大学智能计算与软件研究中心、伦敦大学学院（UCL）软件工程团队正式推出并开源了 loom。

来自主题: AI技术研报

8709 点击 2026-07-26 14:21

本周AI项目推荐｜Amagine、FrameX、Blinkko ...让AI进入“现实”的各种方法

这些项目未必都是最成熟的，但它们有一个共同点：没有把模型本身当作产品，而是把 AI 放进一条具体的任务链里，让一个想法变成物品，让一个需求得到回应，或者让一套智能系统真正运转起来。

来自主题: AI资讯

9024 点击 2026-07-26 11:43

迈向长程智能体，人大高瓴发布149页全景综述

我们想强调的是：智能体 “跑得久”，并不等于 “具备长程能力”。真正的关键，不在于占用更多时间与算力，而在于能否在更长、更复杂、更真实的推理依赖链上持续、有效地行动。长期以来，Autonomous Agent、Self-Evolving Agent 等概念常与长程智能体混用。

来自主题: AI技术研报

8617 点击 2026-07-26 11:28

Loss收敛不代表学会：腾讯混元ACL 2026拆解SFT训练中15.3%的“假学会”样本

SFT是LLM从“通才”变成“专才”的关键步骤。业界默认做法是：准备标注数据（QA对、指令-回复对等）在基座模型上跑SFT训练。看loss曲线收敛了→认为训练完成。但问题在于：loss是全局平均，掩盖了样本间的差异。loss收敛只代表“大部分样本学会了”——那些始终学不会的样本被淹没了。

来自主题: AI技术研报

8310 点击 2026-07-26 11:25

千万级标注成本归零！CVPR 2025清华团队成果：相机的“自运动”就是最好的老师

以往的空间音频模型，要么受限于实验室的苛刻采集条件，要么被高昂的人工标注成本卡住脖子。而团队的核心洞察是：相机的自运动本身就是一种免费的监督信号。当相机转动时，声源在声场中的相对位置随之改变——这种变化无需人工标注，模型即可从中学习空间对应关系。这项工作入选CVPR 2025 Highlight，投稿论文前2%。

来自主题: AI技术研报

8083 点击 2026-07-26 11:25

把 1.6T 参数模型搬进办公室，我们在 WAIC 看到一台自带静音的 Token 工厂

按照超聚变的定位，TokenBox™ 是一套面向办公室场景的企业级本地 AI 平台。它将算力模块、模型服务、推理加速、Token 运营和安全管理整合进同一套产品体系，让企业能够在本地持续生产、调度和管理 Token。

来自主题: AI资讯

8649 点击 2026-07-26 11:24