AI资讯新闻榜单内容搜索-128K

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 128K

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

提高大模型记忆这块儿，美国大模型开源王者——英伟达也出招了。

来自主题: AI技术研报

8206 点击 2026-01-14 15:29

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

仅需15%全量Attention！「RTPurbo」阿里Qwen3长文本推理5倍压缩方案来了

为什么大模型厂商给了 128K 的上下文窗口，却在计费上让长文本显著更贵？

来自主题: AI技术研报

7122 点击 2025-12-24 10:07

国产多模态AI再开源！实测截图转网页、搜图购物，价格减半

国产多模态AI再开源！实测截图转网页、搜图购物，价格减半

国产多模态AI再开源！实测截图转网页、搜图购物，价格减半

原生工具调用、128K上下文，图文创作仍有短板。

来自主题: AI技术研报

10539 点击 2025-12-10 10:51

这一次，天玑9500的端侧AI能力，友商赶不上了

这一次，天玑9500的端侧AI能力，友商赶不上了

这一次，天玑9500的端侧AI能力，友商赶不上了

9 月 22 日下午，联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500，并展示了一系列新形态端侧的 AI 应用，在公众层面首次推动端侧 AI 从尝鲜到好用。现在，让手机端大语言模型（LLM）处理一段超长的文本，最长支持 128K 字元，它只需要两秒就能总结出会议纪要，AI 还能自动修改你的错别字。

来自主题: AI资讯

7690 点击 2025-09-22 19:09

视频理解新标杆，快手多模态推理模型开源：128k上下文+0.1秒级视频定位+跨模态推理

视频理解新标杆，快手多模态推理模型开源：128k上下文+0.1秒级视频定位+跨模态推理

视频理解新标杆，快手多模态推理模型开源：128k上下文+0.1秒级视频定位+跨模态推理

能看懂视频并进行跨模态推理的大模型Keye-VL 1.5，快手开源了。

来自主题: AI技术研报

7807 点击 2025-09-06 12:44

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

马斯克掀桌子了，最强开源大模型诞生！Grok-2近万亿参数性能首曝

Grok-2正式开源，登上Hugging Face，9050亿参数+128k上下文有多猛？近万亿参数「巨兽」性能首曝。马斯克再现「超人」速度，AI帝国正在崛起。

来自主题: AI资讯

8368 点击 2025-08-24 14:02

实测DeepSeek V3.1，不止拓展上下文长度

实测DeepSeek V3.1，不止拓展上下文长度

实测DeepSeek V3.1，不止拓展上下文长度

DeepSeek V3.1和V3相比，到底有什么不同？官方说的模模糊糊，就提到了上下文长度拓展至128K和支持多种张量格式，但别急，我们已经上手实测，为你奉上更多新鲜信息。

来自主题: AI产品测评

10522 点击 2025-08-21 10:49

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1 Base突袭上线！击败Claude 4编程爆表，全网在蹲R2和V4

DeepSeek V3.1新版正式上线，上下文128k，编程实力碾压Claude 4 Opus，成本低至1美元。在昨晚，DeepSeek官方悄然上线了全新的V3.1版本，上下文长度拓展到128k。本次开源的V3.1模型拥有685B参数，支持多种精度格式，从BF16到FP8。

来自主题: AI资讯

7985 点击 2025-08-20 12:56

刚刚DeepSeek发布3.1版本，实测有进步，在编程等个别场景可硬刚GPT-5

刚刚DeepSeek发布3.1版本，实测有进步，在编程等个别场景可硬刚GPT-5

刚刚DeepSeek发布3.1版本，实测有进步，在编程等个别场景可硬刚GPT-5

没等到Deepseek R2，DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点，上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始，鲸哥以为从V3升级到V 3.1，以为是不大的升级，鲸哥体验下来还有惊喜。

来自主题: AI资讯

9459 点击 2025-08-20 03:37

Hugging Face开源顶级小参数模型模型SmolLM3：双模式推理+128K上下文

Hugging Face开源顶级小参数模型模型SmolLM3：双模式推理+128K上下文

Hugging Face开源顶级小参数模型模型SmolLM3：双模式推理+128K上下文

今天凌晨，全球著名大模型开放平台Hugging Face开源了，顶级小参数模型SmolLM3。

来自主题: AI技术研报

7432 点击 2025-07-09 11:32

上一页当前第1页,共3页下一页