AI资讯新闻榜单内容搜索-推理成本

GPT-4推理能力暴涨32%，谷歌新型思维链效果超CoT，计算成本可降至1/40

谷歌&南加大推出最新研究“自我发现”（Self-Discover），重新定义了大模型推理范式。与已成行业标准的思维链（CoT）相比，新方法不仅让模型在面对复杂任务时表现更佳，还把同等效果下的推理成本压缩至1/40。

来自主题: AI技术研报

4765 点击 2024-02-08 19:44

MoE（混合专家）作为当下最顶尖、最前沿的大模型技术方向，MoE能在不增加推理成本的前提下，为大模型带来性能激增。比如，在MoE的加持之下，GPT-4带来的用户体验较之GPT-3.5有着革命性的飞升。

来自主题: AI资讯

10312 点击 2024-02-06 17:53

在 AI 赛道中，与动辄上千亿参数的模型相比，最近，小模型开始受到大家的青睐。比如法国 AI 初创公司发布的 Mistral-7B 模型，其在每个基准测试中，都优于 Llama 2 13B，并且在代码、数学和推理方面也优于 LLaMA 1 34B。

来自主题: AI技术研报

10354 点击 2024-02-02 11:50

对于大型视觉语言模型（LVLM）而言，扩展模型可以有效提高模型性能。然而，扩大参数规模会显著增加训练和推理成本，因为计算中每个 token 都会激活所有模型参数。

来自主题: AI技术研报

7798 点击 2024-01-31 16:23

风投烧完之后，哪些大模型创业公司会开始盈利？

来自主题: AI资讯

6197 点击 2024-01-26 13:54

Lightning Attention-2 是一种新型的线性注意力机制，让长序列的训练和推理成本与 1K 序列长度的一致。

来自主题: AI技术研报

3149 点击 2024-01-18 18:27

22倍加速还不够，再来提升46%，而且方法直接开源！这就是开源社区改进MIT爆火项目StreamingLLM的最新成果。

来自主题: AI资讯

8208 点击 2024-01-08 14:44