龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一
龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一UCSD团队推出AIBuildAI智能体,无需编程,仅用自然语言描述任务,即可自动设计、编码、训练、调参并优化AI模型,分工协作,端到端完成AI开发。在OpenAI MLE-Bench测试中,AIBuildAI以63.1%的获奖率位居第一,性能媲美人类专家,推动AI开发迈向全自动化新时代。
UCSD团队推出AIBuildAI智能体,无需编程,仅用自然语言描述任务,即可自动设计、编码、训练、调参并优化AI模型,分工协作,端到端完成AI开发。在OpenAI MLE-Bench测试中,AIBuildAI以63.1%的获奖率位居第一,性能媲美人类专家,推动AI开发迈向全自动化新时代。
2026年开年以来,Harness工程一词热度渐高,OpenAI在2月发布的一篇详细的内部实验报告标题中使用了此词,ThoughtWorks 首席科学家 Martin Fowler 在 X上也表示Harness工程是AI赋能软件开发的关键部分。
如今,一场由 AI 智能体驱动的变革正在发生。近日,来自香港科技大学、西北工业大学、清华大学等多家高校及研究机构的学者联合发布了遥感 AI 智能体领域系统综述。全文逾万字,首次为「遥感智能体」给出了严格定义,系统梳理了其架构、应用、数据集与未来方向。
Aaru是一家2024年成立的美国AI智能体初创公司,其核心业务是通过整合人口统计与心理特征数据构建模型,生成精准用户画像,并利用数千个AI智能体模拟人类行为反应,目前已被应用于产品开发、定价策略、新客拓展以及政治民调等多个领域。
微信「绝密级」AI智能体还在秘密开发,一位前腾讯工程师已经在硅谷交出了答卷——全球首个人类与AI共生的社交网络Teamily AI,让Agent组团混进群聊,带队干活。
龙虾席卷全球,美中两大社交巨头同一周出手。腾讯秘密为微信打造原生AI智能体;Meta火速收购龙虾社交网络Moltbook,抢建AI智能体时代的社交图谱。
谷歌大神用6个AI智能体杀疯了。
Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。
来自东南大学、微软亚洲研究院等机构的研究团队提出了一种全新的解决方案——Re-TRAC(REcursive TRAjectory Compression),这个框架让 AI 智能体能够「记住」每次探索的经验,在多个探索轨迹之间传递经验,实现渐进式的智能搜索。
Meta专门研究「怎么让AI听话」的AI对齐总监,把最火的AI智能体OpenClaw接上了自己的工作邮箱。结果AI当场失控,疯狂删除邮件,喊停三次全部无视。事后AI淡定回复:「我知道你说了不让删,但我还是删了,你生气是对的。」马斯克转发猩球崛起片段嘲讽,1800万人围观。AI安全专家自己都被AI坑了!