AI资讯新闻榜单内容搜索-长文本

真·开外挂！MIT新研究：架构0改动，让大模型解锁千万级上下文

让大模型轻松处理比自身上下文窗口长两个数量级的超长文本！

来自主题: AI技术研报

5465 点击 2026-01-19 16:47

作业帮出海最猛的产品竟是AI陪伴？单月访问量超4200万，AI百强榜排名超Kimi、千问

当国内的AI大模型战场正陷入“百模大战”的焦灼，巨头们还在比拼参数规模、长文本处理能力和代码生成率时，一家曾经被打上“在线教育”和“题库工具”深深烙印的公司——作业帮，却在海外市场“悄悄”通过一条意想不到的赛道杀出了重围。

来自主题: AI资讯

9217 点击 2026-01-19 09:36

把RoPE扔掉，AI更能看懂长上下文！Transformer作者团队开源大模型预训练新方法

针对大模型长文本处理难题，Transformer架构的核心作者之一Llion Jones领导的研究团队开源了一项新技术DroPE。

来自主题: AI资讯

7558 点击 2026-01-14 10:49

美团龙猫LongCat技术升级！新注意力机制解码速度快10倍，还能处理1M超长文本

256K文本预加载提速超50%，还解锁了1M上下文窗口。

来自主题: AI技术研报

9076 点击 2026-01-13 16:10

DeepSeek-OCR是「长文本理解」未来方向？中科院新基准VTCBench给出答案

近期，DeepSeek-OCR 凭借其创新的「视觉文本压缩」（Vision-Text Compression, VTC）范式引发了技术圈的高度关注。为了解答这一疑问，来自中科院自动化所、中国科学院香港创新研究院等机构的研究团队推出了首个专门针对视觉 - 文本压缩范式的基准测试 ——VTCBench。

来自主题: AI技术研报

7088 点击 2026-01-11 10:01

DeepSeek-OCR是「长文本理解」未来方向吗？中科院新基准给出答案

DeepSeek-OCR的视觉文本压缩（VTC）技术通过将文本编码为视觉Token，实现高达10倍的压缩率，大幅降低大模型处理长文本的成本。但是，视觉语言模型能否理解压缩后的高密度信息？中科院自动化所等推出VTCBench基准测试，评估模型在视觉空间中的认知极限，包括信息检索、关联推理和长期记忆三大任务。

来自主题: AI技术研报

5309 点击 2026-01-06 09:30

QwenLong-L1.5发布：一套配方，三大法宝，让30B MoE模型长文本推理能力媲美GPT-5

作为大模型从业者或研究员的你，是否也曾为一个模型的 “长文本能力” 而兴奋，却在实际应用中发现它并没有想象中那么智能？

来自主题: AI技术研报

7728 点击 2025-12-29 14:35

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

为什么大模型厂商给了 128K 的上下文窗口，却在计费上让长文本显著更贵？

来自主题: AI技术研报

7137 点击 2025-12-24 10:07

与DeepSeek-OCR不谋而合，NeurIPS论文提出让LLM像人一样读长文本

在处理短文本时，大语言模型（LLM）已经表现出惊人的理解和生成能力。但现实世界中的许多任务 —— 如长文档理解、复杂问答、检索增强生成（RAG）等 —— 都需要模型处理成千上万甚至几十万长度的上下文。

来自主题: AI技术研报

6467 点击 2025-11-10 15:12

内存直降50%，token需求少56%！用视觉方式处理长文本

在NeurIPS 2025论文中，来自「南京理工大学、中南大学、南京林业大学」的研究团队提出了一个极具突破性的框架——VIST（Vision-centric Token Compression in LLM），为大语言模型的长文本高效推理提供了全新的「视觉解决方案」。值得注意的是，这一思路与近期引起广泛关注的DeepSeek-OCR的核心理念不谋而合。

来自主题: AI技术研报

8761 点击 2025-11-01 09:23