AI资讯新闻榜单内容搜索-AI架构

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

在自然语言处理、语音识别和时间序列分析等众多领域中，序列建模是一项至关重要的任务。然而，现有的模型在捕捉长程依赖关系和高效建模序列方面仍面临诸多挑战。

来自主题: AI技术研报

6109 点击 2024-10-15 19:22

非Transformer架构新模型爆火，从第一性原理出发，MIT CSAIL衍生团队打造

挑战Transformer，MIT初创团队推出LFM（Liquid Foundation Model）新架构模型爆火。

来自主题: AI技术研报

7857 点击 2024-10-02 11:48

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

随OpenAI爆火的CoT，已经引发了大佬间的激战！谷歌DeepMind首席科学家Denny Zhou拿出一篇ICLR 2024论文称：CoT可以让Transformer推理无极限。但随即他就遭到了田渊栋和LeCun等的质疑。最终，CoT会是通往AGI的正确路径吗？

来自主题: AI技术研报

8624 点击 2024-09-20 19:48

KAN结合Transformer，真有团队搞出了解决扩展缺陷的KAT

Transformer 是现代深度学习的基石。传统上，Transformer 依赖多层感知器 (MLP) 层来混合通道之间的信息。

来自主题: AI资讯

3823 点击 2024-09-19 15:16

统一transformer与diffusion！Meta融合新方法剑指下一代多模态王者

本文引入了 Transfusion，这是一种可以在离散和连续数据上训练多模态模型的方法。

来自主题: AI技术研报

9709 点击 2024-08-25 12:39

入职一年半，这个AI员工晋升为了国内首位AI架构师

你敢想，AI 已经不满足只做程序员了，如今又向架构师这一进阶职业发起挑战。

来自主题: AI资讯

9419 点击 2024-08-08 18:49

探索AI Agent的认知架构及记忆的实现机制

Agent的记忆实现和调用是提高Agent智能水平的关键。

来自主题: AI技术研报

9251 点击 2024-08-01 11:57

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer

超越Transformer和Mamba的新架构，刚刚诞生了。斯坦福UCSD等机构研究者提出的TTT方法，直接替代了注意力机制，语言模型方法从此或将彻底改变。

来自主题: AI技术研报

5538 点击 2024-07-09 15:41

全面超越Transformer！清华蚂蚁推出纯MLP架构，长短程时序预测大幅提升

Transformer很强，Transformer很好，但Transformer在处理时序数据时存在一定的局限性。

来自主题: AI技术研报

8711 点击 2024-06-11 16:05

多模态CoT思维链架构来了，现已开源｜来自厦大&腾讯优图

多模态大模型，也有自己的CoT思维链了！厦门大学&腾讯优图团队提出一种名为“领唱员（Cantor）”的决策感知多模态思维链架构，无需额外训练，性能大幅提升。

来自主题: AI技术研报

10179 点击 2024-05-28 20:56

AI资讯新闻榜单内容搜索-AI架构

北大林宙辰团队全新混合序列建模架构MixCon：性能远超Mamba

非Transformer架构新模型爆火，从第一性原理出发，MIT CSAIL衍生团队打造

Transformer推理天花板被谷歌打破？DeepMind首席科学家亮出84页PPT，却遭LeCun反对

KAN结合Transformer，真有团队搞出了解决扩展缺陷的KAT

统一transformer与diffusion！Meta融合新方法剑指下一代多模态王者

入职一年半，这个AI员工晋升为了国内首位AI架构师

探索AI Agent的认知架构及记忆的实现机制

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑， 一夜推翻Transformer

全面超越Transformer！清华蚂蚁推出纯MLP架构，长短程时序预测大幅提升

多模态CoT思维链架构来了，现已开源｜来自厦大&腾讯优图

大模型最强架构TTT问世！斯坦福UCSD等5年磨一剑，一夜推翻Transformer