MSRA首测AI从零建仓库:能写、能跑,但不一定对丨ACL'26
MSRA首测AI从零建仓库:能写、能跑,但不一定对丨ACL'26大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
搜索
大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
果不其然,最近一周Claude天天崩,就是为了新模型做储备。
过去两年,具身智能最大的瓶颈,其实不是模型。
这两天,一款名为Elephant(大象)的匿名模型,在OpenRouter上悄然亮相。上线不到48小时,这一模型已经冲到OpenRouter热榜(Trending)第一,目前调用量超过1850亿个token。
谷歌悄悄加了一个Agent新入口:Gemini开始长出「手脚」,不再只负责回答问题,还准备下场替你干活了。
AI 公司对更多数据的贪婪需求推高了从事该行业不起眼工作的初创公司的销售额:这些公司与律师、博士学位持有者和医生签约 ,由他们对 AI 模型生成的答案进行评分。
大模型写代码这件事,越来越像「既能写片段,又离真实工程差一截」。
一个在 AI 社区广泛流传的架构思路,正在让大量团队走弯路。
40克AI眼镜变身Agent之眼,数字分身定制分身。当Agent爬出屏幕走进物理世界,这场关于生产力的降维打击,真的不只是说说而已。
GTC 大会上人人都在谈 Agent 和具身智能,但真正让我理解 AI 如何进入物理世界的,是在一台极氪 9X 里发生的两场对话。