AI资讯新闻榜单内容搜索-模型权重

LeCun谢赛宁首发全新视觉多模态模型，等效1000张A100干翻GPT-4V

近日，LeCun和谢赛宁等大佬，共同提出了这一种全新的SOTA MLLM——Cambrian-1。开创了以视觉为中心的方法来设计多模态模型，同时全面开源了模型权重、代码、数据集，以及详细的指令微调和评估方法。

来自主题: AI资讯

5346 点击 2024-06-27 16:22

Flash Attention稳定吗？Meta、哈佛发现其模型权重偏差呈现数量级波动

众所周知，大语言模型的训练常常需要数月的时间，使用数百乃至上千个 GPU。以 LLaMA2 70B 模型为例，其训练总共需要 1,720,320 GPU hours。由于这些工作负载的规模和复杂性，导致训练大模型存在着独特的系统性挑战。

来自主题: AI技术研报

7690 点击 2024-05-12 15:49

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

近年来，多模态大型语言模型（MLLM）在各个领域的应用取得了显著的成功。然而，作为许多下游任务的基础模型，当前的 MLLM 由众所周知的 Transformer 网络构成，这种网络具有较低效的二次计算复杂度。

来自主题: AI技术研报

8823 点击 2024-04-22 17:42

Stable Video 3D震撼上线，视频扩散模型史诗级提升！4090可跑，权重已开放

近日，Stability AI又发布了新作SV3D，基于视频扩散模型的SV3D将3D模型生成的效果提升了一大截，模型权重已在huggingface开放。

来自主题: AI技术研报

5550 点击 2024-03-21 10:20

Stable Video 3D震撼登场：单图生成无死角3D视频、模型权重开放

3D 生成领域迎来新的「SOTA 级选手」，支持商用和非商用。Stability AI 的大模型家族来了一位新成员。昨日，Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后，又为社区带来了 3D 视频生成大模型「Stable Video 3D」（简称 SV3D）。

来自主题: AI技术研报

7868 点击 2024-03-20 16:10

全球首个类Sora开源复现方案来了！全面公开所有训练细节和模型权重

全球首个开源的类Sora架构视频生成模型，来了！

来自主题: AI技术研报

8290 点击 2024-03-18 21:25

没等来OpenAI，等来了Open-Sora全面开源

不久前 OpenAI Sora 以其惊人的视频生成效果迅速走红，在一众文生视频模型中突出重围，成为全球瞩目的焦点。继 2 周前推出成本直降 46% 的 Sora 训练推理复现流程后，Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型「Open-Sora 1.0」，涵盖了整个训练流程，包括数据处理、所有训练细节和模型权重，携手全球 AI 热爱者共同推进视频创作的新纪元。

来自主题: AI技术研报

5503 点击 2024-03-18 17:25