北大提出首个可验证的仓库级生成基准RepoZero,评测LLM能否从0生成一个代码仓库
北大提出首个可验证的仓库级生成基准RepoZero,评测LLM能否从0生成一个代码仓库投稿来自北京大学与百度联合团队,他们提出了首个面向“从零生成完整代码仓库”的评测基准 RepoZero,通过跨语言复现任务与自验证框架 ACE,推动代码补全更近一步迈向自动化软件工程。
搜索
投稿来自北京大学与百度联合团队,他们提出了首个面向“从零生成完整代码仓库”的评测基准 RepoZero,通过跨语言复现任务与自验证框架 ACE,推动代码补全更近一步迈向自动化软件工程。
AI 时代,个人创新创业变得相对简单了,于是出现了越来越多的 OPC。
今天一早,我去了北京国家会议中心,参加百度Create 2026 AI开发者大会-超级个体主论坛。
AI工具最残酷的检验场,不在硅谷,而在义乌。
家庭具身智能企业「欧拉万象(Ola Dimensions)」近日已完成数亿元人民币融资,由招商局创投领投,赛富投资、九合创投、拙朴投资、BV百度风投、聚合投资等知名机构联合投资。
今日,百度推出新一代基础模型文心5.1。百度称,文心5.1将总参数压缩至约1/3、激活参数压缩至约1/2,使用业界同规模模型约6%的预训练成本,实现同级别模型基础效果领先。不过,百度并未明确说明这一“6%成本”的具体对标模型范围与口径。
江苏南京执业律师李小亮发现,在百度手机 APP、百度网站搜索其个人姓名+职务时,百度“AI 智能回答”竟然给出“李小亮律师被判三年有期徒刑”的错误文字内容,并配上他着律师袍的照片。
2026 年,「数据」正成为具身智能竞赛的新焦点,京东、百度等科技巨头纷纷入局。然而,喧嚣之中,一个根本问题悬而未决:什么样的数据,才是具身智能真正需要的?
《读佳》独家获知,百度智能云团队做了一款AI短剧创作平台Hogee AI,并会推出APP版本。据了解,Hogee为AI短剧全链路创作平台,依托百度自研的OpenClaw数字员工体系,用不同工种的AI智能体替代传统短剧团队中的部分岗位,让创作者依托大模型实现从剧本到成片的落地,有利于优质故事以低成本走向市场。
昨天,我去了百度 AI DAY 现场。这次 AI DAY 的主角,是百度文库网盘联合推出的通用智能体GenFlow,正式升级到 4.0版本。GenFlow 4.0是一个「全端通用智能体」,给用户提供通用化、个性化、主动化的智能服务,月活已经破亿。现在还在网盘中兼容了OpenClaw的能力。