
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
自从 Devin(首个全自动 AI 软件工程师)提出以来,针对软件工程的 AI Agent 的设计成为研究的焦点,越来越多基于 Agent 的 AI 自动软件工程师被提出,并在 SWE-bench 数据集上取得了不俗的表现、自动修复了许多真实的 GitHub issue。
Kevin Scott表示,过去20年里,人工智能领域最重要的进步都与“规模”有关;OpenAI的潜力在于未来可能成为构建AI平台的基础;数据的质量比数量更重要。
现实中,机器人收据收集可以通过远程操控实现。来自UCSD、MIT的华人团队开发了一个通用框架Open-TeleVision,可以让你身临其境操作机器人,即便相隔3000英里之外。
超越Devin!SWEBench排行榜上迎来了新玩家
北大-兔展联合发起的Sora开源复现计划Open-Sora-Plan,今起可以生成最长约21秒的视频了!
龙争虎斗的大模型竞技场,今天突然更新:国内大模型公司零一万物旗下的Yi-Large千亿参数闭源大模型,跃升总榜第七,也成为榜上国产大模型第一。可以看到,它的成绩几乎与GPT-4-0125-preview持平。同时,国内清华系大模型公司智谱华章的GLM-4-0116也杀进总榜,位居第15位。
微软的“GitHub版Devin”——Copilot WorkSpace,终于上线了!
当下,AI代码生成领域正在野蛮式生长,巨头涌入,AI员工频频上线企业;首个AI程序员Devin被曝造假…… 面对风起云涌的代码生成变革,李建国给出了这样一个明确论断。
全网爆火的世界首个AI程序员Devin,如今被爆出视频竟是作假?
首个AI程序员,演示视频大幅度造假??? 不久之前震撼硅谷的Devin,再度震撼硅谷——但这次是被打假。