Kimi 今天发布了 AI 深度搜索功能, Web 端逐渐放量,预计 10 月 14 日全量上线。
产品功能和试用体验我们稍后再谈。
从产品形态上来看,Kimi 可能是国内最接近 ChatGPT 的 AI Native 产品,恰巧近期 OpenAI 的一些动作,我们觉得可以做一些延展的讨论。
在 AI 产品形态的探索上,过去两年正在定义行业的 OpenAI 只有一个答案:chatbot。
行业更加关注 OpenAI 在模型上的动作,年初的视频生成 Sora,年中的多模态 4o,以及近期发布的 RL 推理强化模型 o1-preview,都在全行业引起了广泛讨论。
但在模型能力的主线之外,还有另一条也许更重要的主线任务,产品化,在 2024 年尤其明显。OpenAI 产品层面的一切动作,都指向了 ChatGPT。
4o 的实时语音在 ChatGPT App 里,o1 直接放进了 ChatGPT 里,最近刚刚发布的交互更新 canvas,直接以可选模型的形式放进了 ChatGPT 里,甚至仅开放少量试用的 SearchGPT,也在官方 blog 里明确指出,当前只是原型版本,后续会将重点功能直接移植到 ChatGPT 里。
SearchGPT 官方 blog,感谢沉浸式翻译
打开现在的 ChatGPT,可以理解 OpenAI 的思路,只有一个「对话框」,可以在一个对话流里切换模型,4o real-time、canvas、o1,这些模型都成为了 feature。
Model as a feature,甚至,post-training as a feature。主动的 MoE 和被动的选择切换,对产品来说,模型只是功能。
GPT-4o with canvas 的交互是一个很好的「preview」,在一个对话框里,启动文本/代码编辑,通过「聊天」,创造生产力。可以想见 OpenAI 接下来的动作,是任何功能,任何交互,都可以在一个对话流里完成。
ChatGPT 里已有 6 种模型可供切换
更多模态的选择,更多形态的交互,就能打开一个又一个新的场景。
这和市面上很多「智能体」模式的 chatbot 的区别在于:一个十项全能的助手,还是 10 个各有所长的专家,甚至一个庞大的人才市场。
多一个功能,对智能体市场来说是多一个「人才」,对 ChatGPT 来说是助手多了一个技能点。
用户体验上的差异,用互联网黑话说,就是一个 leader 是否要跟很多人对齐,同步 context。
这一视角来源于之前与 Kimi 创始人杨植麟的交流,在大约一年的尝试和摸索后,他持有类似的观点。
今年 6 月,在媒体曝料月之暗面曾有两款泛娱乐产品折戟的消息传出后不久,杨植麟在 Founder Park 的大会上强调月之暗面会更加聚焦,「做好 Kimi 这一个产品」。
在那之前的另一次交流中,他更加明确地表达过对于产品形态的想法:
张鹏:你认为 Kimi 这样的产品,最终我们会怎样定义它?
杨植麟:我们还是希望它能成为一个入口。
张鹏:这么明确?
杨植麟:对。因为 AGI 最终的产品形态可能是比较确定的。因为 AGI 的定义就是和人一样智能,本质上跟它交互的感觉与跟人交互没有区别。所以我觉得,AI 之后(的体验),只要你想到一个问题,或者有一件事需要做,但自己不想做,都可以让它去做,或者说有一件事,你不确定自己能不能做好,AI 会在其中扮演一个很关键的角色。所以只要智能的需求是一个普世的需求,那大概率会存在一个或若干个入口。
张鹏:就是每个人身边其实都有这样的几个人,有个啥事就想起来。
杨植麟:对,这个人既博学又温柔,不光是给你建议,还能帮你把事给做了。我觉得一定会有这样的产品。
AI 产品的「主线任务」是明确的。
但这种产品形态,或许只适合具备模型能力的团队。甚至在组织层面上,同时具备产品和模型能力的大厂,如果产品团队并不完全依赖于模型团队,All-in-one 的移动互联网 Super App 标准目前看也是面向市场的最佳选择之一。
怀着长期以来对 AI 搜索的疑问,或者说,抱着当下所有 AI 产品都处于「preview」阶段的预期,我们也体验了「Kimi 探索版」这个产品。
工作学习中有很多需要搜索、研究的地方,很多工作是在大量的网页里提取信息,根据不同的需求进行梳理,我们日常也有大量的工作与此有关,但你可以在其他地方看到相关测试,我们就不展开了。
还有什么场景,不是苦大仇深的工作和作业,同样需要大量收集信息并整理呢?
战斗。
结合 Founder Park 个别同事的生活经验,我们做了一些测试,效果还是不错的,大有可为。
(以下 prompt 仅为测试产品,不代表 Founder Park 观点。)
先清晰梳理
手把手教
连贯上下文
IP 黑话都懂
往事历历在目(还泛化了)
就是这个就是这个.jpg
真正的智能,直奔詹黑大本营
AI 产品的可能性还挺多的。博学、温柔,给你建议,把事给做了,都感受到了。
养成依赖是用户体验很重要的一环。搜索引擎二十多年,虽然有「Don't ask something you can Google」这样为人处事的守则,人们还是习惯张嘴问身边人。但当搜索变成「身边人」,也许情况会发生一些变化。
下面还是正经介绍下这次 Kimi 更新的功能。
10 月 11 日,月之暗面发布了 Kimi 的新版本——Kimi 探索版,主打深度搜索,可以模型人类的推理思考过程,对长难问题和复杂问题进行拆解,同时会尝试搜索更多内容,官方对此的说法是,「Kimi 探索版的搜索量是普通版的 10 倍」。
Kimi 探索版会分批上线 web 端,预计 10 月 14 日全量上线。使用方式为打开对话框左下角的探索版开关,或者直接在对话框中输入「/」切换,但是如果你没有把输入法切换为英文,直接输入了「、」,Kimi 也是能识别的。
官方介绍都本次更新的主要特点:
“如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。” Kimi 探索版产品负责人表示。
Kimi 主攻生产力场景,核心用户是知识工作者和大学生。根据 Similarweb 数据,从今年以来,在代表生产力的 PC 网页端,Kimi 的月访问量从 140多万增长到 2500 多万,增长了 17 倍。目前 Kimi 的 PC 网页版,也是国内 AI 助手产品中唯一月访问量超过 2500 万。
这是 Kimi 探索版的第一项能力,后续还会有其他新能力上线。
对于复杂且需要多步骤回答的问题,Kimi 的回答在这次升级后有了明显的质量提升,不会只关注其中一个问题,或者只回答问题中的某个子项,比如常见的历年数据统计这样的需求。
除了对问题按照类别进行拆解之外,Kimi 探索版这次的另外一个升级,是拆解了回答问题的步骤,尤其是那种需要思考下或者了解逻辑之后才能回答的问题。比如这个:
kimi 先去搜索了逻辑推理题的解题方法,然后再运用这种逻辑方法去回答这个问题。作为对比,kimi 探索版的答案是正确的,而普通版的 kimi 的回答,是错误的。
文章来自于“Founder Park”,作者“Founder Park”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales