AI资讯新闻榜单内容搜索-AI框架

哈萨比斯：谷歌想创造第二个Transformer，还想把AlphaGo和Gemini强强联合

当一家人工智能公司的首席执行官更像是计算机科学家而不是推销员时，我感觉更舒服

来自主题: AI资讯

3074 点击 2024-08-20 14:31

一文看懂Mamba，Transformer最强竞争者

Mamba 虽好，但发展尚早。

来自主题: AI资讯

6138 点击 2024-08-19 14:46

非Transformer架构站起来了！首个纯无注意力大模型，超越开源巨头Llama 3.1

Mamba 架构的大模型又一次向 Transformer 发起了挑战

来自主题: AI资讯

5282 点击 2024-08-13 17:49

Mamba再次挑战霸主Transformer！首个通用Mamba开源大模型一鸣惊人

TII开源全球第一个通用的大型Mamba架构模型Falcon Mamba 7B，性能与Transformer架构模型相媲美，在多个基准测试上的均分超过了Llama 3.1 8B和Mistral 7B。

来自主题: AI资讯

6287 点击 2024-08-13 17:07

换掉Transformer，7B开源模型立刻登顶！任意长序列都能处理

只是换掉Transformer架构，立马性能全方位提升，问鼎同规模开源模型！

来自主题: AI资讯

6431 点击 2024-08-13 16:47

黑匣子被打开了！能玩的Transformer可视化解释工具，本地运行GPT-2、还可实时推理

2017 年，谷歌在论文《Attention is all you need》中提出了 Transformer，成为了深度学习领域的重大突破。该论文的引用数已经将近 13 万，后来的 GPT 家族所有模型也都是基于 Transformer 架构，可见其影响之广。作为一种神经网络架构，Transformer 在从文本到视觉的多样任务中广受欢迎，尤其是在当前火热的 AI 聊天机器人领域。

来自主题: AI资讯

6285 点击 2024-08-11 17:38