
世界模型挑战赛,单项奖金10000美元!英伟达全新分词器助力下一帧预测
世界模型挑战赛,单项奖金10000美元!英伟达全新分词器助力下一帧预测近日,人形机器人公司1X公布了世界模型挑战赛的二阶段:Sampling。一同登场的还有合作伙伴英伟达新发布的Cosmos视频分词器,超高质量和压缩率助力构建虚拟世界。
近日,人形机器人公司1X公布了世界模型挑战赛的二阶段:Sampling。一同登场的还有合作伙伴英伟达新发布的Cosmos视频分词器,超高质量和压缩率助力构建虚拟世界。
Meta的视频版分割一切——Segment Anything Model 2(SAM 2),又火了一把。
近日,DeepMind 团队将水印技术和投机采样(speculative sampling)结合,在为大语言模型加入水印的同时,提升其推理效率,降低推理成本,因此适合用于大规模生产环境。
11月4日,OpenAI CEO Sam Altman(以下称“Altman”)在“The Twenty Minute VC”播客中回答了这些问题,他明确表示,提升推理能力一直是OpenAI的核心战略。
本文介绍了来自北京大学王选计算机研究所的王勇涛团队的最新研究成果 VL-SAM。针对开放场景,该篇工作提出了一个基于注意力图提示的免训练开放式目标检测和分割框架 VL-SAM,在无需训练的情况下,取得了良好的开放式 (Open-ended) 目标检测和实例分割结果,论文已被 NeurIPS 2024 录用。
近日,卡内基梅隆大学与华盛顿大学的研究团队推出了 NaturalBench,这是一项发表于 NeurIPS'24 的以视觉为核心的 VQA 基准。它通过自然图像上的简单问题——即自然对抗样本(Natural Adversarial Samples)——对视觉语言模型发起严峻挑战。
在互联网发展史上,域名交易一直是科技巨头布局的重要一环。今日凌晨,OpenAI 首席执行官 Sam Altman 一如既往地搞“深夜突袭”,在社交媒体平台 X 上发布了一条简短的推文:“chat.com”。随后用户发现,这个域名直接跳转到了 ChatGPT 官方网站。
Segment Anything Model 2(SAM 2)在传统视频目标分割任务大放异彩,引起了众多关注。然而,港中文和上海 AI Lab 的研究团队发现 SAM 2 的贪婪选择策略容易陷入「错误累积」的问题,即一次错误的分割掩码选择将影响后续帧的分割结果,导致整个视频分割性能的下降。这个问题在长视频分割任务中显得更加严重。
实时API将完全改变我们与人工智能互动的方式,定制化AI模型成为主流,并且通过模型蒸馏实现低延迟、低成本、高性能,使AI更易使用、更高质量。
Sam Altman认为,人类历史发展的技术进步,就是通过创造更好的工具、再利用这些工具取得更惊人的成就。