月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

5380点击 2024-03-18 20:36

继2月以投后约25亿美金估值炸场后，杨植麟的大模型公司月之暗面终于有了一次公开对媒体的活动。

虽然杨植麟本人并未露面，但是发布了更长上下文窗口的版本：

200万字上下文版本，今天即刻在Kimi上开启内测。

并且在与Kimi对话过程中，加入了（不打断模型思路的）“继续”功能按钮

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

月之暗面工程副总裁许欣然（同时也是Infra负责人）在会议室咚、咚、咚把好几摞厚厚的打印纸重重地放在桌面上，分别是打印出来的《中医中医内科学》《中医诊断学》、英伟达2023年年度财报、《甄嬛传》剧本版。

一摞比一摞厚。

现场放话：“欢迎大家体验”。

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

去年10月，月之暗面第一次公开亮相，发布了20万字上下文窗口的Kimi模型。

5个月过去——5个月，对AI世界已经是非常久的时间了，Kimi主要在3个方面有所提升：

遵循更复杂的指令
更强的信息检索能力
网页版、Android、iOS、小程序

提出“Kimi 10分钟速成定律”

此次月之暗面最主要的动作，就是将自家模型的上下文窗口提升了一个数量级。

即从发布之初的20万字，拓展到200万字。

同时据许欣然透露，5个月过去，相同成本、相同设备情况下，模型响应速度提升了3倍左右。

为了达到更好的长窗口无损压缩性能，月之暗面的研发和技术团队从模型预训练到对齐、推理环节均进行了原生的重新设计和开发，不走“滑动窗口”、“降采样”等技术捷径，攻克了很多底层技术难点。

200万字上下文窗口，意味着Kimi模型能够吃下更长的文档内容，完成更长和更复杂的任务。

包括但不限于，快速整理N多文件，如从500份简历中提取信息：

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

现场月之暗面还提出了“Kimi 10分钟速成定律”。

即无关领域大众小众，也无关资料或多或少，只要把资料一股脑丢给模型，10分钟内，Kimi都能快速入门一个新领域。

比如德州扑克、中医内科、开（某个特定型号的）飞机、大模型推理……

现场月之暗面还提出了“Kimi 10分钟速成定律”。

即无关领域大众小众，也无关资料或多或少，只要把资料一股脑丢给模型，10分钟内，Kimi都能快速入门一个新领域。

比如德州扑克、中医内科、开（某个特定型号的）飞机、大模型推理……

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

现场还演示了Kimi模型挖掘长篇故事情节中深层次信息的能力。

案例自然是被人类开发程度不足10%的甄嬛传（笑死）。

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

值得注意的是，月之暗面在媒体沟通会现场提出了一个新说法，即大模型们最近的新竞速赛道，“大海捞针”功能，恐怕全绿也没什么太大意义了。

最初，大海捞针其实是一个非常好的评测标准，因为当时大家都没有针对这个case去优化过。

但现在它已经不是一个很好的评测指标了，当大家都去关注它的时候，就一定会想尽办法去优化它，慢慢就失去了原本的参考意义。

如果大海捞针不行了，有什么新的评测标准能够检测模型长文本能力吗？

“暂时还没有。”许欣然笑道。

他表示，模型窗口越来越长，评测的纬度变得非常非常多，不过团队已经在和学术界团队共同探讨这个开放性的问题。

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

期望打造“个人麦肯锡”

从20万字上下文窗口，迭代为今天开始内测的200万字上下文窗口，具体的模型应用场景又有什么新的亮眼之处？会不会只是从“处理50封简历”到“处理500封简历”的简单线性外扩？

一味拓展大模型上下文窗口的边界，会不会打造出一把普通人想象中的“皇帝的金锄头”？

“实际上，可能会不断地出现更多的现实场景，只有足够长的context才能完成。”月之暗面表示，在200万字版本推出后，接下来Kimi模型会在以下几个方向发展：

第一，领域专家。

利用长文本能力吃掉一个领域里几乎所有的相关资料，使调研一个行业成为简单的事情。

第二，可完成复杂多步任务的Agent，月之暗面内部称之为“个人麦肯锡”。

希望模型未来不只是像能处理“帮我翻译一下这个PDF”这类非常具体的任务，也能自动完成抽象、复杂的任务。

第三，多模态能力。

Context长了之后，Kimi模型可以容纳更多高清的、时间更长的这种视频，从而让我们模型很方便地去拓展到更多的模态

。

据月之暗面联合创始人周昕宇现场的答复，Sora出来以前，月之暗面就在根据自己的节奏推进多模态能力的研发，Sora的出现也并没有打乱原有的安排。

“预计今年会推出我们自己的多模态模型/产品。”

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

One More Thing

最后，他家大模型还悄么声地改名了：

Kimi Chat➡️Kimi智能助手

Moonshot大模型➡️Kimi大模型

本文来源于量子位 | 公众号 QbitAI 作者衡宇

月之暗面Kimi模型升级：200万字窗口版可申请，新增“继续”功能

关键词: 月之暗面 , Kimi , Kimi模型 , 国产大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI