
你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新
你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新你或许也有过这样的猜想,如何让AI智能体(Agent)变得更聪明、更能干,同时又不用烧掉堆积如山的算力去反复微调模型?
你或许也有过这样的猜想,如何让AI智能体(Agent)变得更聪明、更能干,同时又不用烧掉堆积如山的算力去反复微调模型?
AI写论文早就不稀奇了,可如今,它甚至能提出实验方案,设计出能被验证的分子。今年10月,AI将更进一步,走上学术舞台。在一场名为Agents4Science的会议上,它不仅要当第一作者、评审,还要亲自上台报告。这不只是一次会议,更像是一场公开的实验。
我们也看过各种 AI Coding 领域的评测,发现大多停留在了 「代码生成」与「封闭题目」的考核,却忽视了环境配置、依赖处理、跨仓库资源利用等开发者必经的真实需求 —— 当下众多 Benchmark 仅通过题目,已难以衡量 Code Agent 的实际效果。
人多,好办事。agent多,照样好办事! 在最新的Andrew’s Letters中,吴恩达老师就指出: 并行智能体正在成为提升AI能力的新方向。
我们每天都在用语音交流,从早上叫醒Siri到晚上和家人通话,语音似乎是人类最直观的交流方式。但当我们试图让机器也用这种方式与我们互动时,却发现背后隐藏着巨大的技术挑战。
“投资可以很简单很有趣。” 这是一个9岁开始炒股、10年前押中英伟达的投资老手——赖蕴琦Vakee,想传递给所有人的理念。
最近,a16z的合伙人们发布了一篇深度分析文章,系统梳理了Computer Use(计算机使用)技术的发展现状和未来前景。他们认为,这项技术正在将AI agent从概念推向现实,让AI真正具备了处理端到端数字工作流的能力。
大厂在 AI Agent 上的每一步动作,都值得紧盯。因为没人能预测,一个看似小小的产品,最终会被扩展到多大规模,串联出怎样的「新业务体系」。
近日,上海交大和上海人工智能实验室的研究发现,AI 的风险正从个体失控转向群体性的恶意共谋(Collusion)——即多个智能体秘密协同以达成有害目标。Agent 不仅可以像人类团队一样协作,甚至在某些情况下,还会展现出比人类更高效、更隐蔽的「团伙作案」能力。
“Agent元年”进程过半,Agent虽已从处理简单任务转向复杂交付,却仍卡在“信息断层”的关键瓶颈—— 受限于训练数据截止日期,难以及时获取实时动态信息,企业级场景落地始终差临门一脚。