AI TNT— 让一部分先用AI实现商业化

长上下文能力只是吹牛？最强GPT-4o正确率仅55.8%，开源模型不如瞎蒙

当今的LLM已经号称能够支持百万级别的上下文长度，这对于模型的能力来说，意义重大。但近日的两项独立研究表明，它们可能只是在吹牛，LLM实际上并不能理解这么长的内容。

来自主题: AI资讯

4073 点击 2024-07-23 16:10

视频上下文学习！大模型学会“照猫画虎”生成，结合模拟器还能精准控制真实环境交互，来自MSRA

视频生成也能参考“上下文”？！

来自主题: AI技术研报

8057 点击 2024-07-17 19:17

谷歌7大模型22项AI大招轰炸，70秒视频生成、Gemini安卓合体、200万tokens上下文

秀杀手级AI玩法、Gemini安卓合体截胡苹果、最强TPU，谷歌2小时提了121次AI。

来自主题: AI资讯

6575 点击 2024-05-15 17:16

国产大模型：今天起，我们100万tokens只需1元！

昨天刚刚在顶会ICLR作为特邀演讲（Invited Talk）中“国内唯一”的大模型玩家智谱AI，今天又放出了一个好消息

来自主题: AI技术研报

7538 点击 2024-05-12 12:35

百万tokens低至1元！大模型越来越卷了

在刚刚举行的 ICLR 2024 大会上，智谱AI的大模型技术团队公布了面向激动人心的AGI通用人工智能前景的三大技术趋势，同时预告了GLM的后续升级版本。

来自主题: AI资讯

4715 点击 2024-05-12 11:19

58行代码把Llama 3扩展到100万上下文，任何微调版都适用

堂堂开源之王Llama 3，原版上下文窗口居然只有……8k，让到嘴边的一句“真香”又咽回去了。

来自主题: AI资讯

8892 点击 2024-05-06 20:51

LLM上下文窗口突破200万！无需架构变化+复杂微调，轻松扩展8倍

大型语言模型（LLM）往往会追求更长的「上下文窗口」，但由于微调成本高、长文本稀缺以及新token位置引入的灾难值（catastrophic values）等问题，目前模型的上下文窗口大多不超过128k个token

来自主题: AI技术研报

6987 点击 2024-04-29 20:31

谷歌：假如AI大模型支持无限长上下文，会如何？

为解决大模型（LLMs）在处理超长输入序列时遇到的内存限制问题，本文作者提出了一种新型架构：Infini-Transformer，它可以在有限内存条件下，让基于Transformer的大语言模型（LLMs）高效处理无限长的输入序列。实验结果表明：Infini-Transformer在长上下文语言建模任务上超越了基线模型，内存最高可节约114倍。

来自主题: AI资讯

7676 点击 2024-04-14 11:32

谷歌爆改Transformer，“无限注意力”让1B小模型读完10部小说，114倍信息压缩

它通过将压缩记忆（compressive memory）整合到线性注意力机制中，用来处理无限长上下文

来自主题: AI资讯

7476 点击 2024-04-13 20:07

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

谷歌又放大招了，发布下一代 Transformer 模型 Infini-Transformer。

来自主题: AI技术研报

8334 点击 2024-04-13 16:44