AI资讯新闻榜单内容搜索-超长上下文

谷歌新架构突破Transformer超长上下文瓶颈！Hinton灵魂拷问：后悔Open吗？

两项关于大模型新架构的研究一口气在NeurIPS 2025上发布，通过“测试时训练”机制，能在推理阶段将上下文窗口扩展至200万token。两项新成果分别是：Titans：兼具RNN速度和Transformer性能的全新架构；MIRAS：Titans背后的核心理论框架。

来自主题: AI技术研报

7493 点击 2025-12-06 11:10

老黄对token密集型任务下手了。

来自主题: AI资讯

9642 点击 2025-09-10 12:19

超长上下文窗口的大模型也会经常「失忆」，「记忆」也是需要管理的。

来自主题: AI技术研报

9044 点击 2025-07-16 16:26

GPT-4.1，在ChatGPT中可用了！现在，它不仅在API中开放，Plus、Pro和Team用户都可以使用。网友们兴奋地展开实测后，纷纷吐槽：OpenAI这是诈骗吧，说好的一百万超长上下文呢？

来自主题: AI资讯

11339 点击 2025-05-15 12:08

一句话看懂：o3以深度推理与工具调用能力领跑复杂任务，GPT-4.1超长上下文与精准指令执行适合API开发，而o4-mini则堪称日常任务的「性价比之王」。

来自主题: AI资讯

8556 点击 2025-04-21 16:52

今天在各大信息渠道看到 Llama4 发布的消息，一上来就放出三个模型，具体能力这里就不在赘述，相信大家已经多少看到不少介绍了。

来自主题: AI资讯

7836 点击 2025-04-07 09:51

开源模型上下文窗口卷到超长，达400万token！刚刚，“大模型六小强”之一MiniMax开源最新模型—— MiniMax-01系列，包含两个模型：基础语言模型MiniMax-Text-01、视觉多模态模型MiniMax-VL-01。

来自主题: AI技术研报

8607 点击 2025-01-15 15:10

「2025 年，我们可能会看到第一批 AI Agent 加入劳动力大军，并对公司的生产力产生实质性的影响。」——OpenAI CEO Sam Altman

来自主题: AI技术研报

9046 点击 2025-01-15 14:06

国产大模型，最近有点卷。

来自主题: AI资讯

7083 点击 2024-11-20 09:56

就在刚刚，Anthropic发现了大模型的惊人漏洞。经过256轮对话后，Claude 2逐渐被「灌醉」，开始疯狂越狱，帮人类造出炸弹！谁能想到，它的超长上下文，反而成了软肋。

来自主题: AI技术研报

9771 点击 2024-04-03 15:46