
从"工具人"到"数字队友":AI协作革命的最后一公里
从"工具人"到"数字队友":AI协作革命的最后一公里从数字工具到数字队友的进化之路 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
从数字工具到数字队友的进化之路 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。
特朗普政府的AI大计划还没正式亮相,就在GitHub泄露了!一个叫ai.gov的网站即将上线,要把AI塞进政府每个角落。聊天机器人、超级API、实时监控工具,野心大到吓人,但网友们已经开怼:这靠谱吗?
过去一段时间,“通用 Agent”成了 AI 应用的默认发展方向。无论产品叙事还是技术布局,大家似乎都在追求一个“什么都能做”的智能体。但现实逐渐显露:通用 Agent 在真实世界中并不那么“通用”。
推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了benchmark上限
未中顶会,没有发表arXiv,一篇博客却成为OpenAI速通票。天才科学家Keller Jordan仅凭Muon优化器博客加入OpenAI。甚至,它可能被用于训练下一代超级模型GPT-5。
据自媒体“申妈的朋友圈”消息,知情人士透露,字节人工智能实验室 (AI Lab) 负责人李航已经正式卸任,他在内部系统的身份变为劳务/顾问。
「西部世界」真的要来了!科学家们正试图为AI装上人类大脑。最新进展由美国国家实验室主导。
知识以一种奇怪的方式进入了我的大脑。
当学术研究沦为「填空游戏」,利用美国NHANES公共数据集,结合AI工具如ChatGPT,研究者通过套用模板、排列变量,批量生产看似精美却质量堪忧的论文。背后不仅是技术的滥用,更是科研评价体系扭曲的缩影。