天工「刷新」、阶跃「聚焦」,腰部AI公司要靠智能体最后一博?
天工「刷新」、阶跃「聚焦」,腰部AI公司要靠智能体最后一博?QuestMobile 在 5 月发布的中国市场报告中指出,今年 3 月 AI 原生 APP 活跃用户数突破 2.7 亿,同比增长 536.8%,但也形成了截然不同的梯队,可以观察到明显的「赢者通吃」
QuestMobile 在 5 月发布的中国市场报告中指出,今年 3 月 AI 原生 APP 活跃用户数突破 2.7 亿,同比增长 536.8%,但也形成了截然不同的梯队,可以观察到明显的「赢者通吃」
Agent 能力边界正在快速演进,未来随着更强的规划和推理能力的不断提升,Agent 们将参与到社会经济运作中。在这一趋势下,将可能诞生类似 Visa 或 Stripe 级别的商业基础设施的机会。
智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。
效果超预期、当前PPT制作第一名……
之前我们探讨过公司AI能力的评判方式:
2009 年,Marc Andreessen 和 Ben Horowitz 在金融危机最深的低谷中创办了 Andreessen Horowitz(a16z),在硅谷人心惶惶、资本退潮的时刻逆势出击。那一年,美国只诞生了两家新风投基金,一家是传奇投资人 Ron Conway 发起的,另一家,便是他们。
编程智能体也有「进化论」!Transformer作者初创Sakana AI与UBC推出达尔文-哥德尔机(DGM),能自动改写自身代码,性能翻倍超越人工设计。还能跨语言迁移、发明新工具。AI要觉醒了?
在多智能体AI系统中,一旦任务失败,开发者常陷入「谁错了、错在哪」的谜团。PSU、杜克大学与谷歌DeepMind等机构首次提出「自动化失败归因」,发布Who&When数据集,探索三种归因方法,揭示该问题的复杂性与挑战性。
在过去的一周,这一方向的进展尤其丰富。有人发现,几篇关于「让 LLM(或智能体)学会自我训练」的论文在 arXiv 上集中出现,其中甚至包括受「哥德尔机」构想启发而提出的「达尔文哥德尔机」。或许,AI 模型的自我进化能力正在加速提升。
北大校友官宣推出号称“最强通用Agent” Fairies(中译仙女),能执行Deep research、代码生成、发邮件等1000个操作。关键是无需邀请码,Mac和Windows用户只需下载APP就能立即上手试玩。(⊙ˍ⊙)