AI资讯新闻榜单内容搜索-上下文

Cursor 迎来了强大的对手，Augment Code实测

根据官方介绍，Augment Agent 是首个转为大型代码库工作的专业软件工程师设计的 AI 编码助手，上下文支持 200K ，也就是 20 万的 token 啊。

来自主题: AI资讯

8596 点击 2025-04-14 11:10

今天在各大信息渠道看到 Llama4 发布的消息，一上来就放出三个模型，具体能力这里就不在赘述，相信大家已经多少看到不少介绍了。

来自主题: AI资讯

6060 点击 2025-04-07 09:51

原生多模态Llama 4终于问世，开源王座一夜易主！首批共有两款模型Scout和Maverick，前者业界首款支持1000万上下文单H100可跑，后者更是一举击败了DeepSeek V3。目前，2万亿参数巨兽还在训练中。

来自主题: AI技术研报

8116 点击 2025-04-06 18:06

近来风头正盛的GPT-4.5，不仅在日常问答中展现出惊人的上下文连贯性，在设计、咨询等需要高度创造力的任务中也大放异彩。

来自主题: AI技术研报

7421 点击 2025-04-04 15:22

大模型同样的上下文窗口，只需一半内存就能实现，而且精度无损？前苹果ASIC架构师Nils Graef，和一名UC伯克利在读本科生一起提出了新的注意力机制Slim Attention。

来自主题: AI资讯

5897 点击 2025-03-17 19:52

长文本任务是当下大模型研究的重点之一。在实际场景和应用中，普遍存在大量长序列（文本、语音、视频等），有些甚至长达百万级 tokens。

来自主题: AI技术研报

7410 点击 2025-03-17 16:04

LLM自身有望在无限长token下检索信息！无需训练，在检索任务「大海捞针」（Needle-in-a-Haystack）测试中，新方法InfiniRetri让有效上下文token长度从32K扩展至1000+K，让7B模型比肩72B模型。

来自主题: AI技术研报

8378 点击 2025-03-16 13:28

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

7152 点击 2025-03-12 14:53

开源微调神器Unsloth带着黑科技又来了：短短两周后，再次优化DeepSeek-R1同款GRPO训练算法，上下文变长10倍，而显存只需原来的1/10！

来自主题: AI技术研报

3915 点击 2025-03-11 10:42

由于语言泛化，今天出现了很有趣的现象：「Agent 是什么」，这个问题没有了标准的定义。一个常见的观点是：Agent 是一种让 AI 以类似人的工作和思考方式，来完成一系列的任务。一个 Agent 可以是一个 Bot，也可以是多个 Bot 的协同。

来自主题: AI技术研报

9417 点击 2025-03-10 11:33