ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Kimi发力AI搜索,产品形态更加明确,在聊天中探索生产力
7600点击    2024-10-12 10:40

Kimi 今天发布了 AI 深度搜索功能, Web 端逐渐放量,预计 10 月 14 日全量上线。


产品功能和试用体验我们稍后再谈。


从产品形态上来看,Kimi 可能是国内最接近 ChatGPT 的 AI Native 产品,恰巧近期 OpenAI 的一些动作,我们觉得可以做一些延展的讨论。


01 

把模型当成产品 feature


在 AI 产品形态的探索上,过去两年正在定义行业的 OpenAI 只有一个答案:chatbot。


行业更加关注 OpenAI 在模型上的动作,年初的视频生成 Sora,年中的多模态 4o,以及近期发布的 RL 推理强化模型 o1-preview,都在全行业引起了广泛讨论。


但在模型能力的主线之外,还有另一条也许更重要的主线任务,产品化,在 2024 年尤其明显。OpenAI 产品层面的一切动作,都指向了 ChatGPT。


4o 的实时语音在 ChatGPT App 里,o1 直接放进了 ChatGPT 里,最近刚刚发布的交互更新 canvas,直接以可选模型的形式放进了 ChatGPT 里,甚至仅开放少量试用的 SearchGPT,也在官方 blog 里明确指出,当前只是原型版本,后续会将重点功能直接移植到 ChatGPT 里。


SearchGPT 官方 blog,感谢沉浸式翻译


打开现在的 ChatGPT,可以理解 OpenAI 的思路,只有一个「对话框」,可以在一个对话流里切换模型,4o real-time、canvas、o1,这些模型都成为了 feature。


Model as a feature,甚至,post-training as a feature。主动的 MoE 和被动的选择切换,对产品来说,模型只是功能。


GPT-4o with canvas 的交互是一个很好的「preview」,在一个对话框里,启动文本/代码编辑,通过「聊天」,创造生产力。可以想见 OpenAI 接下来的动作,是任何功能,任何交互,都可以在一个对话流里完成。


ChatGPT 里已有 6 种模型可供切换


更多模态的选择,更多形态的交互,就能打开一个又一个新的场景。


这和市面上很多「智能体」模式的 chatbot 的区别在于:一个十项全能的助手,还是 10 个各有所长的专家,甚至一个庞大的人才市场。


多一个功能,对智能体市场来说是多一个「人才」,对 ChatGPT 来说是助手多了一个技能点


用户体验上的差异,用互联网黑话说,就是一个 leader 是否要跟很多人对齐,同步 context。


这一视角来源于之前与 Kimi 创始人杨植麟的交流,在大约一年的尝试和摸索后,他持有类似的观点。


今年 6 月,在媒体曝料月之暗面曾有两款泛娱乐产品折戟的消息传出后不久,杨植麟在 Founder Park 的大会上强调月之暗面会更加聚焦,「做好 Kimi 这一个产品」。


在那之前的另一次交流中,他更加明确地表达过对于产品形态的想法:


张鹏:你认为 Kimi 这样的产品,最终我们会怎样定义它?


杨植麟:我们还是希望它能成为一个入口。


张鹏:这么明确?


杨植麟:对。因为 AGI 最终的产品形态可能是比较确定的。因为 AGI 的定义就是和人一样智能,本质上跟它交互的感觉与跟人交互没有区别。所以我觉得,AI 之后(的体验),只要你想到一个问题,或者有一件事需要做,但自己不想做,都可以让它去做,或者说有一件事,你不确定自己能不能做好,AI 会在其中扮演一个很关键的角色。所以只要智能的需求是一个普世的需求,那大概率会存在一个或若干个入口。


张鹏:就是每个人身边其实都有这样的几个人,有个啥事就想起来。


杨植麟:对,这个人既博学又温柔,不光是给你建议,还能帮你把事给做了。我觉得一定会有这样的产品。


AI 产品的「主线任务」是明确的。


但这种产品形态,或许只适合具备模型能力的团队。甚至在组织层面上,同时具备产品和模型能力的大厂,如果产品团队并不完全依赖于模型团队,All-in-one 的移动互联网 Super App 标准目前看也是面向市场的最佳选择之一。


02

AI 搜索是自由的


怀着长期以来对 AI 搜索的疑问,或者说,抱着当下所有 AI 产品都处于「preview」阶段的预期,我们也体验了「Kimi 探索版」这个产品。



工作学习中有很多需要搜索、研究的地方,很多工作是在大量的网页里提取信息,根据不同的需求进行梳理,我们日常也有大量的工作与此有关,但你可以在其他地方看到相关测试,我们就不展开了。


还有什么场景,不是苦大仇深的工作和作业,同样需要大量收集信息并整理呢?


战斗。


结合 Founder Park 个别同事的生活经验,我们做了一些测试,效果还是不错的,大有可为。


(以下 prompt 仅为测试产品,不代表 Founder Park 观点。)


先清晰梳理


手把手教


连贯上下文


IP 黑话都懂


往事历历在目(还泛化了)


就是这个就是这个.jpg


真正的智能,直奔詹黑大本营


AI 产品的可能性还挺多的。博学、温柔,给你建议,把事给做了,都感受到了。

养成依赖是用户体验很重要的一环。搜索引擎二十多年,虽然有「Don't ask something you can Google」这样为人处事的守则,人们还是习惯张嘴问身边人。但当搜索变成「身边人」,也许情况会发生一些变化。


下面还是正经介绍下这次 Kimi 更新的功能。


03

Kimi 探索版产品介绍


10 月 11 日,月之暗面发布了 Kimi 的新版本——Kimi 探索版,主打深度搜索,可以模型人类的推理思考过程,对长难问题和复杂问题进行拆解,同时会尝试搜索更多内容,官方对此的说法是,「Kimi 探索版的搜索量是普通版的 10 倍」


Kimi 探索版会分批上线 web 端,预计 10 月 14 日全量上线。使用方式为打开对话框左下角的探索版开关,或者直接在对话框中输入「/」切换,但是如果你没有把输入法切换为英文,直接输入了「、」,Kimi 也是能识别的。



官方介绍都本次更新的主要特点:


  • 自主规划策略,会先规划问题的整体策略,将问题拆解为有层次的子问题,然后分步回答。


  • 大规模信息检索,一次性检索多个关键词,相比手工搜索的大提速。


  • 回答的同时会即时反思搜索结果,补充信息。多在信息和数据查询类任务中触发,不是所有任务都会进行反思。


“如果 Kimi 搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到。未来搜索引擎会成为AI更擅长调用的工具,人只需要专注于提出好的问题,AI就可以结合模型本身的能力在庞大的互联网中自主海量搜索,不断反思迭代,更精准地定位所需答案。” Kimi 探索版产品负责人表示。


Kimi 主攻生产力场景,核心用户是知识工作者和大学生。根据 Similarweb 数据,从今年以来,在代表生产力的 PC 网页端,Kimi 的月访问量从 140多万增长到 2500 多万,增长了 17 倍。目前 Kimi 的 PC 网页版,也是国内 AI 助手产品中唯一月访问量超过 2500 万。


这是 Kimi 探索版的第一项能力,后续还会有其他新能力上线。


案例展示


对于复杂且需要多步骤回答的问题,Kimi 的回答在这次升级后有了明显的质量提升,不会只关注其中一个问题,或者只回答问题中的某个子项,比如常见的历年数据统计这样的需求。



除了对问题按照类别进行拆解之外,Kimi 探索版这次的另外一个升级,是拆解了回答问题的步骤,尤其是那种需要思考下或者了解逻辑之后才能回答的问题。比如这个:



kimi 先去搜索了逻辑推理题的解题方法,然后再运用这种逻辑方法去回答这个问题。作为对比,kimi 探索版的答案是正确的,而普通版的 kimi 的回答,是错误的。


文章来自于“Founder Park”,作者“Founder Park”。


关键词: Kimi , AI , AI搜索 , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

6
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales