AI资讯新闻榜单内容搜索-LightTrans

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: LightTrans

优于o1预览版，推理阶段KV缓存缩减一半，LightTransfer降本还能增效

LLM 在生成 long CoT 方面展现出惊人的能力，例如 o1 已能生成长度高达 100K tokens 的序列。然而，这也给 KV cache 的存储带来了严峻挑战。

来自主题: AI技术研报

6573 点击 2025-03-11 09:32