微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-Sora
微软开源视频Tokenizer新SOTA!显著优于Cosmos Tokenizer和Open-SoraSora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。
来自主题: AI技术研报
7784 点击 2024-12-26 15:43
Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。
近日,人形机器人公司1X公布了世界模型挑战赛的二阶段:Sampling。一同登场的还有合作伙伴英伟达新发布的Cosmos视频分词器,超高质量和压缩率助力构建虚拟世界。
tokenizer对于图像、视频生成的重要性值得重视。
日前,MLCommons协会发布最新MLPerf™ Storage v1.0 AI存储基准测试成绩。浪潮信息分布式存储平台AS13000G7表现出众,在3D-UNet和CosmoFlow两个模型共计8项测试中,斩获5项性能全球第一。
为了这个视频模型,英伟达每天正在疯狂地爬取相当于 80 年时长的视频数据。
英伟达版Sora曝光——
Humane AI Pin 的背后理念很简单:这是一台没有屏幕的手机。它不会要求用户去打开各种应用或者在键盘上进行操作,而是通过一个 AI 助手和一个称作 CosmOS 的操作系统,将所有复杂功能简化。