AI TNT— 让一部分先用AI实现商业化

几乎是和斯坦福“炒虾洗碗”机器人同一时间，谷歌DeepMind也发布了最新具身智能成果。

来自主题: AI资讯

4726 点击 2024-01-05 16:38

一个来自MIT博士生的惊人发现：只需对Transformer的特定层进行一种非常简单的修剪，即可在缩小模型规模的同时显著提高模型性能。

来自主题: AI技术研报

1165 点击 2023-12-31 12:01

MIT、微软联合研究：不需要额外训练，也能增强大语言模型的任务性能并降低其大小。

来自主题: AI资讯

1453 点击 2023-12-26 14:55

Transformer作者创立的大模型公司，再获5650万美元投资，换算成人民币有四亿多。

来自主题: AI资讯

2111 点击 2023-12-13 16:41

在视频生成场景中，用 Transformer 做扩散模型的去噪骨干已经被李飞飞等研究者证明行得通。这可算得上是 Transformer 在视频生成领域取得的一项重大成功。

来自主题: AI资讯

3128 点击 2023-12-13 15:49

今天，李飞飞携斯坦福联袂谷歌，用Transformer生成了逼真视频，效果媲美Gen-2比肩Pika。2023年俨然已成AI视频元年！

来自主题: AI资讯

6328 点击 2023-12-12 15:07

替代注意力机制，SSM 真的大有可为？

来自主题: AI资讯

3085 点击 2023-12-11 16:19

过度训练让中度模型出现了结构泛化能力。

来自主题: AI资讯

5266 点击 2023-12-08 14:37

现在ChatGPT等大模型一大痛点：处理长文本算力消耗巨大，背后原因是Transformer架构中注意力机制的二次复杂度。

来自主题: AI技术研报

6990 点击 2023-12-05 17:32

屹立不倒的 Transformer 迎来了一个强劲竞争者。在别的领域，如果你想形容一个东西非常重要，你可能将其形容为「撑起了某领域的半壁江山」。但在 AI 大模型领域，Transformer 架构不能这么形容，因为它几乎撑起了「整个江山」。

来自主题: AI资讯

5698 点击 2023-12-05 16:33