ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Kimi上线浏览器插件,偷袭AI搜索?
3937点击    2024-07-14 11:03


上半年爆火的Kimi大模型,进行了一次小而美的更新。


在谷歌Chrome和微软Bing两大主流浏览器中,上线了名为Kimi浏览器助手/ Kimi Copilot 的浏览器插件。



浏览器插件?在这个通用大模型军备竞赛的年份,算不上是个热门赛道。


并且,仅看介绍文案,Kimi的插件似乎也只是一个功能的扩展,AI搜索、总结网页和摘要功能,横向比较在2024年神仙打架的众多模型,甚至算不上新功能。


但,短短几天,这个由月之暗面提供的官方插件,迅速进入了Bing浏览器的热门范围(不过这个热门实际上是个性化推荐,不同用户的热门未必相同),且在圈内热度颇高。



在讨论区,一众网友都是这么评价的:



浏览器助手,是什么?Kimi做了什么,让这个插件这么神奇?


传统打工人的上班搭子


来了?


浏览器插件,大部分是一些应用在网页中的小功能,蓝媒君仅有的几个浏览器插件,基本也就是广告拦截、视频调节和PDF编辑。


但Kimi做的这个插件,有一点特别。


特别好用——浏览器插件包含三个功能,分别是文本划线提问、文本摘要总结,以及设置Kimi常驻网页侧边栏。


在Bing/Chrome浏览器添加扩展之后,网页(默认页面右下角,可自由拖动)中会出现一个圆形的Kimi小图标,表明插件已经处于启用状态。



这时候,在网页中高亮任意文字,鼠标移动到高亮部分时也会弹出一个Kimi小图标,点一下图标,Kimi插件将自动调用大模型的AI能力,帮你解释这部分文字。



并且,还能自动浏览上下文,帮用户总结出一大段文字的主要内容。



不过略显遗憾的是,目前版本的Kimi浏览器助手,数据库更新得似乎还不太及时,并不具备像一众AI搜索应用那样全网检索资讯的能力,更像是大模型加持的百科全书。



Kimi插件并不知道


GPT-4o已经发布了


第二项功能“文本摘要总结”,则是对Kimi擅长的长文本处理,做了一点点拓展。


点击右下角Kimi图标,网页中会弹出一个对话框:输入框让用户提出需求,以及一个“总结全文”功能的预设按键。



直接将一篇万字访谈录甩给Kimi测试:不用选中任何内容,直接在页面点击总结全文,Kimi短时间内就迅速生成了一段500字的总结,概述访谈内容后又分点整理了几个主要话题。



阅读长文本这个功能说起来并不新鲜,国内很多大模型的本体,实际上已经卷到了几十万甚至上百万字符的水平。


但Kimi这个插件被安排在网页中之后,不可避免会有遇到很多无效的干扰信息,比如资讯类相关侧边榜单,或者其他同类型文章的推荐链接,都以文字的形式同时出现在页面中,内容由于算法很可能也都是相似的。


这就需要大模型对页面中的文本种类进行识别和分区,哪些是连贯的文章内容,哪些是和文章本体无关的其他文本内容。


不管是通过页面布局还是通过文字前后关系,总之Kimi在识别文章主体这一项做的挑不出问题,对文章内容的概括能力也依然在线。


而第三个功能“Kimi侧边栏常驻”,则不像前两项一样有相对具体的使用场景——Kimi提供了另一种调用Kimi的方案,让大模型常驻在网页的侧边栏,省去了来回切换网页的时间。



在插件界面从全局浮窗切换到侧边栏模式之后,点击右下角Kimi图标,大模型将自动出现在屏幕右侧,用户可以直接对Kimi提问网页中的内容,或者要求Kimi搜索其他地方的信息。



当然,由于这部分功能调用的是Kimi大模型本体(和网页版Kimi和手机APP互通),好处是能在手机和网页端同步搜索内容,但高峰时段也绕不开算力墙。



“好用”是一种能力


对比很多通用大模型的版本迭代,或是隔段时间就有的新功能重磅发布,Kimi这次更新浏览器插件,只能算是一次“小更”。


并未像之前在B站等平台投流那样大肆宣传推广,似乎只是月之暗面的开发者搞了一个实用工具,没什么bug就开放给用户体验了。


但这个小插件,确实带来了一些改变,至少是改变的可能:


对部分用户使用大模型习惯和流程的改变。


体验完三个功能后,虽然有时提供的内容比较局限,算力墙的问题看上去短时间也没法破除,但Kimi这个插件给蓝媒君带来的直观感受就是,很方便,很好用。


以往在PC端,阅读过程中如果需要借助大模型搜索某个问题,流程一般都是把要查的内容节选出来,复制粘贴或者再编辑一下问题,打开大模型官网粘过去,然后再把内容复制下来到某个文档里比对,或者在网页之间来回切换着看。


这样做是OK的,和现在这种直接在网页内部调用小窗Kimi的模式,得到的内容大差不差,但有差距的地方,就是使用上的便捷程度,是用户体验。


这一点,非常直观。


安装插件后,不需要切换网页来回比对了,直接划线从小窗里查资料,在侧边栏输入需要大模型解答的问题,效率的提高带来了体验的极大提升。


在蓝媒君看来,这个插件的上线,带来的变化绝不是本就很火的Kimi,又多了一个入口。而是精准切中了蓝媒君这种还没完全转到用大模型处理信息,浏览器使用频率依然很高的打工人的痛点。



让这部分打工人能够更流畅、更方便地调用大模型能力,对于厂家来说就是让产品离目标用户更近了。


今年苹果WWDC上线的Apple Intelligence,智能写作、AI邮件、文本总结等等功能,其实也都是安卓阵营早就做出来的功能,


而苹果AI的讨论度依然很高,反响依然不错。一方面能力上苹果和OpenAI的合作确实技术力领先,另一方面,在形式上,可以看出苹果是真正将AI能力塞进了日常的用户使用习惯中间,而不是新增一个APP,新增一个设备让用户多一道手续。


Apple Intelligence的写作工具在用户打字、回邮件或者阅读的过程中,都可以主动调用AI能力辅助,相当于一个趁手的AI工具就在屏幕旁边垂手可得,不用再到处找看怎么使用、合不合适。这种logo常驻带来的存在感,也算得上一种营销。


把能力强的应用,做得“好用”,本身就是一种能力。而在这方面,Kimi大模型的这个浏览器插件,显然可以给到一个高分。


本文来自微信公众号“AI蓝媒汇”(ID:lanmeih001),作者:陶然


关键词: kimi , AI , AI插件 , AI搜索
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

3
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/