AI资讯新闻榜单内容搜索-Transforme

非Transformer架构新模型爆火，从第一性原理出发，MIT CSAIL衍生团队打造

挑战Transformer，MIT初创团队推出LFM（Liquid Foundation Model）新架构模型爆火。

来自主题: AI技术研报

8114 点击 2024-10-02 11:48

就在刚刚，MIT系初创公司Liquid AI团队官宣：推出首批多模态非Transformer模型——液体基础模型LFM。

来自主题: AI资讯

4807 点击 2024-10-01 14:52

一个受线虫启发的全新架构，三大「杯型」均能实现 SOTA 性能，资源高度受限环境也能部署。移动机器人可能更需要一个虫子的大脑。

来自主题: AI技术研报

6986 点击 2024-10-01 14:10

通往AGI的路径只有一条吗？实则不然。这家国产AI黑马认为，「群体智能」或许是一种最佳的尝试。他们正打破惯性思维，打造出最强AI大脑，要让世界每一台设备都有自己的智能。

来自主题: AI技术研报

8916 点击 2024-09-27 19:19

取代现有计算架构。人工智能（AI）硬件有望彻底被颠覆，在计算速度和能效方面实现前所未有的改进。

来自主题: AI资讯

3892 点击 2024-09-25 16:56

扩展多模态大语言模型（MLLMs）的长上下文能力对于视频理解、高分辨率图像理解以及多模态智能体至关重要。这涉及一系列系统性的优化，包括模型架构、数据构建和训练策略，尤其要解决诸如随着图像增多性能下降以及高计算成本等挑战。

来自主题: AI技术研报

7655 点击 2024-09-21 18:19

随OpenAI爆火的CoT，已经引发了大佬间的激战！谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？

来自主题: AI技术研报

8835 点击 2024-09-20 19:48

Transformer 是现代深度学习的基石。传统上，Transformer 依赖多层感知器 (MLP) 层来混合通道之间的信息。

来自主题: AI资讯

4029 点击 2024-09-19 15:16

注意力是 Transformer 架构的关键部分，负责将每个序列元素转换为值的加权和。将查询与所有键进行点积，然后通过 softmax 函数归一化，会得到每个键对应的注意力权重。

来自主题: AI技术研报

6374 点击 2024-09-19 11:10

坐拥世界最大的搜索业务，谷歌一直独步于硅谷。搜索所带来的丰厚广告收入，让两位创始人谢尔盖・布林 (Sergey Brin) 和拉里・（Larry Page）可以退居二线，安心享受生活。

来自主题: AI资讯

3858 点击 2024-09-12 14:13