AI资讯新闻榜单内容搜索-长上下文

强化学习解决长上下文推理问题：通义推出QwenLong-L1-32B

上下文长度达 13 万 token，适用于多段文档综合分析、金融、法律、科研等复杂领域任务。

来自主题: AI技术研报

7118 点击 2025-05-28 09:42

GPT-4.1，在ChatGPT中可用了！现在，它不仅在API中开放，Plus、Pro和Team用户都可以使用。网友们兴奋地展开实测后，纷纷吐槽：OpenAI这是诈骗吧，说好的一百万超长上下文呢？

来自主题: AI资讯

10999 点击 2025-05-15 12:08

来自英伟达和UIUC的华人团队提出一种高效训练方法，将LLM上下文长度从128K扩展至惊人的400万token SOTA纪录！基于Llama3.1-Instruct打造的UltraLong-8B模型，不仅在长上下文基准测试中表现卓越，还在标准任务中保持顶尖竞争力。

来自主题: AI技术研报

8420 点击 2025-05-01 13:54

在以 transformer 模型为基础的大模型中，键值缓存虽然用以存代算的思想显著加速了推理速度，但在长上下文场景中成为了存储瓶颈。为此，本文的研究者提出了 MILLION，一种基于乘积量化的键值缓存压缩和推理加速设计。

来自主题: AI技术研报

9045 点击 2025-04-30 08:32

目前的视频生成技术大多是在短视频数据上训练，推理时则通过滑动窗口等策略，逐步扩展生成的视频长度。然而，这种方式无法充分利用视频的长时上下文信息，容易导致生成内容在时序上出现潜在的不一致性。

来自主题: AI技术研报

7040 点击 2025-04-23 14:19

一句话看懂：o3以深度推理与工具调用能力领跑复杂任务，GPT-4.1超长上下文与精准指令执行适合API开发，而o4-mini则堪称日常任务的「性价比之王」。

来自主题: AI资讯

8233 点击 2025-04-21 16:52

OpenAI重磅发布的GPT-4.1系列模型，带来了编程、指令跟随和长上下文处理能力的全面飞跃！由中科大校友Jiahui Yu领衔的团队打造。与此同时，备受争议的GPT-4.5将在三个月后停用，GPT-4.1 nano则以最小、最快、最便宜的姿态强势登场。

来自主题: AI资讯

10824 点击 2025-04-15 08:53

今天在各大信息渠道看到 Llama4 发布的消息，一上来就放出三个模型，具体能力这里就不在赘述，相信大家已经多少看到不少介绍了。

来自主题: AI资讯

7480 点击 2025-04-07 09:51

长文本任务是当下大模型研究的重点之一。在实际场景和应用中，普遍存在大量长序列（文本、语音、视频等），有些甚至长达百万级 tokens。

来自主题: AI技术研报

8597 点击 2025-03-17 16:04

AI21Labs 近日发布了其最新的 Jamba1.6系列大型语言模型，这款模型被称为当前市场上最强大、最高效的长文本处理模型。与传统的 Transformer 模型相比，Jamba 模型在处理长上下文时展现出了更高的速度和质量，其推理速度比同类模型快了2.5倍，标志着一种新的技术突破。

来自主题: AI资讯

9720 点击 2025-03-10 00:28