上半年爆火的Kimi大模型,进行了一次小而美的更新。
在谷歌Chrome和微软Bing两大主流浏览器中,上线了名为Kimi浏览器助手/ Kimi Copilot 的浏览器插件。
浏览器插件?在这个通用大模型军备竞赛的年份,算不上是个热门赛道。
并且,仅看介绍文案,Kimi的插件似乎也只是一个功能的扩展,AI搜索、总结网页和摘要功能,横向比较在2024年神仙打架的众多模型,甚至算不上新功能。
但,短短几天,这个由月之暗面提供的官方插件,迅速进入了Bing浏览器的热门范围(不过这个热门实际上是个性化推荐,不同用户的热门未必相同),且在圈内热度颇高。
在讨论区,一众网友都是这么评价的:
浏览器助手,是什么?Kimi做了什么,让这个插件这么神奇?
浏览器插件,大部分是一些应用在网页中的小功能,蓝媒君仅有的几个浏览器插件,基本也就是广告拦截、视频调节和PDF编辑。
但Kimi做的这个插件,有一点特别。
特别好用——浏览器插件包含三个功能,分别是文本划线提问、文本摘要总结,以及设置Kimi常驻网页侧边栏。
在Bing/Chrome浏览器添加扩展之后,网页(默认页面右下角,可自由拖动)中会出现一个圆形的Kimi小图标,表明插件已经处于启用状态。
这时候,在网页中高亮任意文字,鼠标移动到高亮部分时也会弹出一个Kimi小图标,点一下图标,Kimi插件将自动调用大模型的AI能力,帮你解释这部分文字。
并且,还能自动浏览上下文,帮用户总结出一大段文字的主要内容。
不过略显遗憾的是,目前版本的Kimi浏览器助手,数据库更新得似乎还不太及时,并不具备像一众AI搜索应用那样全网检索资讯的能力,更像是大模型加持的百科全书。
Kimi插件并不知道
GPT-4o已经发布了
第二项功能“文本摘要总结”,则是对Kimi擅长的长文本处理,做了一点点拓展。
点击右下角Kimi图标,网页中会弹出一个对话框:输入框让用户提出需求,以及一个“总结全文”功能的预设按键。
直接将一篇万字访谈录甩给Kimi测试:不用选中任何内容,直接在页面点击总结全文,Kimi短时间内就迅速生成了一段500字的总结,概述访谈内容后又分点整理了几个主要话题。
阅读长文本这个功能说起来并不新鲜,国内很多大模型的本体,实际上已经卷到了几十万甚至上百万字符的水平。
但Kimi这个插件被安排在网页中之后,不可避免会有遇到很多无效的干扰信息,比如资讯类相关侧边榜单,或者其他同类型文章的推荐链接,都以文字的形式同时出现在页面中,内容由于算法很可能也都是相似的。
这就需要大模型对页面中的文本种类进行识别和分区,哪些是连贯的文章内容,哪些是和文章本体无关的其他文本内容。
不管是通过页面布局还是通过文字前后关系,总之Kimi在识别文章主体这一项做的挑不出问题,对文章内容的概括能力也依然在线。
而第三个功能“Kimi侧边栏常驻”,则不像前两项一样有相对具体的使用场景——Kimi提供了另一种调用Kimi的方案,让大模型常驻在网页的侧边栏,省去了来回切换网页的时间。
在插件界面从全局浮窗切换到侧边栏模式之后,点击右下角Kimi图标,大模型将自动出现在屏幕右侧,用户可以直接对Kimi提问网页中的内容,或者要求Kimi搜索其他地方的信息。
当然,由于这部分功能调用的是Kimi大模型本体(和网页版Kimi和手机APP互通),好处是能在手机和网页端同步搜索内容,但高峰时段也绕不开算力墙。
对比很多通用大模型的版本迭代,或是隔段时间就有的新功能重磅发布,Kimi这次更新浏览器插件,只能算是一次“小更”。
并未像之前在B站等平台投流那样大肆宣传推广,似乎只是月之暗面的开发者搞了一个实用工具,没什么bug就开放给用户体验了。
但这个小插件,确实带来了一些改变,至少是改变的可能:
对部分用户使用大模型习惯和流程的改变。
体验完三个功能后,虽然有时提供的内容比较局限,算力墙的问题看上去短时间也没法破除,但Kimi这个插件给蓝媒君带来的直观感受就是,很方便,很好用。
以往在PC端,阅读过程中如果需要借助大模型搜索某个问题,流程一般都是把要查的内容节选出来,复制粘贴或者再编辑一下问题,打开大模型官网粘过去,然后再把内容复制下来到某个文档里比对,或者在网页之间来回切换着看。
这样做是OK的,和现在这种直接在网页内部调用小窗Kimi的模式,得到的内容大差不差,但有差距的地方,就是使用上的便捷程度,是用户体验。
这一点,非常直观。
安装插件后,不需要切换网页来回比对了,直接划线从小窗里查资料,在侧边栏输入需要大模型解答的问题,效率的提高带来了体验的极大提升。
在蓝媒君看来,这个插件的上线,带来的变化绝不是本就很火的Kimi,又多了一个入口。而是精准切中了蓝媒君这种还没完全转到用大模型处理信息,浏览器使用频率依然很高的打工人的痛点。
让这部分打工人能够更流畅、更方便地调用大模型能力,对于厂家来说就是让产品离目标用户更近了。
今年苹果WWDC上线的Apple Intelligence,智能写作、AI邮件、文本总结等等功能,其实也都是安卓阵营早就做出来的功能,
而苹果AI的讨论度依然很高,反响依然不错。一方面能力上苹果和OpenAI的合作确实技术力领先,另一方面,在形式上,可以看出苹果是真正将AI能力塞进了日常的用户使用习惯中间,而不是新增一个APP,新增一个设备让用户多一道手续。
Apple Intelligence的写作工具在用户打字、回邮件或者阅读的过程中,都可以主动调用AI能力辅助,相当于一个趁手的AI工具就在屏幕旁边垂手可得,不用再到处找看怎么使用、合不合适。这种logo常驻带来的存在感,也算得上一种营销。
把能力强的应用,做得“好用”,本身就是一种能力。而在这方面,Kimi大模型的这个浏览器插件,显然可以给到一个高分。
本文来自微信公众号“AI蓝媒汇”(ID:lanmeih001),作者:陶然
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/