百模大战之后,大伙儿或许有个共识:
现在不缺大模型,缺的是怎么更好地把大模型用起来的方法。
有个现成的例子是,印象笔记一直被很多知识工作者当成自己的“第二大脑”来用,在AIGC时代,用户看到了它更智能的改变。
其实早在2018年,印象笔记就在AIGC的领域里开启了自己的摸爬滚打,几年下来,积累了不少经验和思考。
在本次中国AIGC产业峰会上,印象笔记董事长兼CEO唐毅从知识管理的角度,分享了印象笔记在AIGC领域,从技术到应用和产品的所见所闻、所思所感。
为了完整体现唐毅的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。、
中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。
以下为唐毅演讲全文:
针对AIGC技术,我认为从技术到模型、算法、实践和应用的一系列垂直和落地的思考是非常重要的。所以,今天我从知识管理的角度,分享一下印象笔记从技术到应用和产品的一些想法。
首先简单介绍一下印象笔记,它源于硅谷的一款叫Evernote的产品。
一直以来,印象笔记的愿景就是成为知识人群的第二大脑。这使得我们的思考一直围绕着“知识场景”和“大脑的关键功能”。
今天我会从AI驱动印象笔记系列产品,在内容理解、智慧提炼、个人知识积累和公域知识获取等知识管理的场景中的实践经验,来做分享。
印象笔记对AIGC的研发和实践早在2018年完成国内公司独立重组时就开始了。正式独立之后,我们首先更多地用了supervise learning的方式来做NLP,同时也开始启动了自己的小规模模型训练。
早在2023年3月,我们就已经开始利用自己的垂直专有模型驱动自己的AI产品,并将功能落地在旗下的软件和智能硬件产品。
由于印象笔记在国内市场较早地启动了AIGC的全面实践,我们也积累了更多的经验和更深入的思考。
在我们看来,AIGC的发现还处在比较早期的阶段,对人类社会的影响也才刚刚开始,但现阶段,关于大趋势和方向性的思考更是必不可少的。
首先,相比算力的发展和模型规模的扩大发展,模型算法的进展却是相对缓慢的。
同时,到现在为止,算力的投入和收益是不成比例的,我相信真正对产业经济产生深远影响的技术,最终总的回报ROI要达到正向才可以。
另一个对于基座模型的挑战是,在基座模型训练中,或许不一定每位在座的朋友都同意。
我们看到一个现象,在模型训练中,随着公域数据的逐渐穷尽,合成数据被大量加入使用,这也会直接导致模型输出效果下降。
有挑战也有机遇,我们看到,特定数据的优化在模型能力提升中的作用、模型的小型化趋势、小规模模型能力的持续提升在AI产品交付效果的提升中都起着越来越关键的作用。
谈到AI交付,印象笔记是既做工具又做模型的厂商,在垂直整合的过程中,我们发现,由于我们采用印象专有大模型直接服务用户,用户可以对模型的效果和性能有着迅速和直观的感受,从而对背后的训练和调优过程给予直接有效的反馈。
而另一方面,AI产品的交付又远远不是仅仅将模型能力简单直接地交付到用户面前。
另一个显著的趋势是,小型化、垂直化的模型可以更高效地处理问题。在行业日益追求模型效率化的过程中,数据对模型质量和交付质量的影响在提升,对算力的需求反而在下降。
基于这些趋势和我们的实践经验,我想强调“复合AI系统”的概念,这是在AI产品交付和大模型本身之间的一个非常关键的应用思考点和架构设计点。
从不同的论文中我们也可以看到相似观点——系统性思维下的模型训练、调优,以及与整个AI系统其它组成部分的有机组合,是现在AIGC应用的一个重要思考角度。
不同AI系统需要不同角度的思考,印象笔记关于“复合AI系统”的思考主要有以下几点:
第一,我们的模型采用混合部署策略,以专有模型驱动主要用户服务和交互场景,模型本身具有路由和任务判断能力,同时也具备质量判断和云端一体的路由判断能力。
第二,我们对公域和私域数据的区分处理和保护管理有独特的系统和严密的规则。
第三,智能代理本身的功能是阵列式的,在关键节点分析用户的意图、做任务的拆解,最后还要系统化地接收用户反馈的过程。
“复合AI系统”超越AIGC应用单一模型驱动的思考方式,而在此系统下设计一款成功的AI应用也需要考虑不同的因素,这也是印象笔记在AI产品的打造中比较独特的体会。
首先,我们需要非常明确地分析和判断出这款应用的准确使用场景。
同时,你的AI复合系统如何驱动这个产品给用户进行交付也十分关键。
对此,也有两个重要思考点。
一个是最合适的AI应用载体在哪——是在云端?在移动端?在某一个第三方平台?还是GPTs或插件?不用的载体在不同的场景和工作流中有着不同的作用。
另一个是何为最适合的交互——自然语言交互还是传统GUI交互?
我们提倡用符合用户直觉性的方式进行交互设计,使用户用到AI功能和AI产品的时候是一种最自然的选择和体验。
因此产品的交互不是绝对的LUI或者CUI——例如在纯粹LUI或CUI的交互中,它虽然更自由、更开放,但完全开放的对话窗口也会增加用户的焦虑感 ——用户会停在那里不知道该做什么。
所以产品中既应该有完全开放的交互窗口,也应该有开放交互和传统的GUI相辅相成的Copilot性质的交互设计,同时也应该有降低用户焦虑感的传统限制性菜单处理交互式设计。
因此,在一个“复合AI系统”下打造AI超级应用时,我们认为除了AI系统思维之外,数据、用户、场景、载体、交互等关键的要素是需要非常慎重考虑的关键点。
回到印象笔记的实践,我们通过自有模型的混合部署,比较早地进行了全面的布局和落地,推出了多种方向的功能:
内容生成与搜索、语义性搜索、大文件理解、多文件理解、与上万篇笔记的私人对话等等。
通过逐步实践,我们总结出了一些令我们感到兴奋的方法和获得了一些较为满意的结果。
“印象AI”的推出,对新用户的增长、用户留存和商业化转化的驱动效果都非常显著。
呼应我在今天演讲开始提到的观点——作为AI从业者,对于核心技术、产品策略、市场投入等方面的实践的检验,最终总要能够回到对ROI的结果的衡量上来。
目前,印象笔记旗下全系列的软件和智能硬件产品都已经在印象大模型的驱动下,完成了AI功能和产品的落地交付。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales