5 月 7 日,零一万物官宣了第一款为中国人量身一站式 AI 工作平台 —— 万知。它可以做会议纪要、周报、写作助手,还可以解读财报、论文等各类文件,帮你做 PPT。这一切,都可以登录一键解决,中英双语,完全免费。
大众可以通过网页(www.wanzhi.com)和微信小程序万知 AI 找到这位人人都能用上的 AI 个人特助。
零一万物也重磅宣布,李开复博士亲自出任万知 CEO(Chief Experience Officer),也就是「首席体验官」,倾听用户反馈,与大家一同解锁「AI 特助」万知新用法。他将在这段时间里亲自推出一系列 AI 助力工作生活新范式的万知使用教程,在万知上提交的用户反馈也会集结为《万知首席体验官周报》陆续分享,邀请广大网友一起迎接 AI-first 的全新体验。
一般的白领或学生工作者,在工作或学习中使用电脑、手机最经常的工作任务,不出 「找、读、写」三大刚需。搜索和核实信息、阅读大量的文档资料或进行数据分析,进而总结撰写所需要的内容,几乎是人人都熟悉、经常性重复的基础工作流程。迈入人工智能时代,万知针对这三个共性需求,提供了三大 AI 秘技:
【秘技一】AI 知识问答:指尖轻松调度 100 个跨领域的超级 IQ 博士
基于零一万物国际领先的 Yi 大模型海量知识库,万知在「兵家必争之地」的 AI 通用问答场景中,展现出了不俗的产品性能,面对复杂问题也能够快速总结给出「聪明」的高分答案,比起传统信息搜索,AI 更能快速直击精准又深度的解答。
与其他通用问答产品相比,万知的一大特色在于,善用多种形式输出更有质量的内容。以表格、简易思维导图等形式替代大量「字海」,便于用户理解。得益于此,在更偏生活化的场景中,万知可以更好地扮演生活小助手等角色。接收用户要求后不到一秒钟,万知就已经将所需信息以表格的形式呈现,方便用户直接上手。
同时,为了弥补大模型知识库的滞后性、避免幻觉产生,万知支持实时访问和整合互联网信息,为用户提供最新的数据和见解。
【秘技二】AI 读文档:秒读 5000 页字海,多模态读懂中英图表
万知可在 10 秒内完成数十万字超长文档阅读,而输出高质量问答离不开基座模型无损上下文的能力。
在这方面,零一万物已经有了相当成熟的技术积累:零一万物在 200K 超长上下文窗口的 Yi 模型版本上进行迭代优化,可以轻松处理 40 万字资料。今年 3 月,零一万物进一步推出了基于全导航图的新型向量数据库笛卡尔(Descartes),为 RAG(检索增强生成)提供了高效极速的检索机制,0.1 秒判别用户意图,极速调度检索,给予用户高效的优质反馈。
Yi 大模型本身的超长上下文窗口搭配领先的 RAG 方案,共同构建起了万知「5000 页文档速读」的超长文档阅读能力。60 万字的英文小说《马斯克传》一度让不少 AI 助手「宕机」,万知则能轻松解读。
在实测过程中,一篇 169 页的全英文财报,万知小程序可在 3 秒内对内容重点进行提炼,对于财报中的财务数据进行解读,并且按照财报叙述逻辑总结重点。在对话末尾,万知还为用户给出提示性质的追问,帮助用户加深对财报内容的理解。
与便于移动入手的小程序相比,万知的 PC 网页版的功能更加全面,力求在细节方面满足用户需求。
如在文档解读场景中,万知 PC 网页版在输入框内提供了「截图提问」按钮,创新式地将行业领先的多模态模型能力与应用场景相结合。用户可在左侧截取文档内容,针对性进行提问,提高回答效率,再也不用担心解读复杂的各类数据图表,中英双语都能解读。
【秘技三】AI 创作 PPT:手机生成 2 分钟 + PC 接力更完美
曾几何时,Boss 一阵夺命连环 call,打工人就要立马交付各种 PPT。现在,仅靠万知微信小程序就能帮你做得有模有样:用户只需要在手机页面输入相关 PPT 主题,万知就能生成文字大纲,经用户确认后万知还支持一键生成 PPT。
得益于 RAG 实时检索,万知 AI 能够基于「大脑知识 + 新鲜实事」生成 PPT 大纲,辅之以多种版式和 AI 配图,一份精美的 PPT 两分钟就能出炉。
早上醒来看到老板临时来的 PPT 任务再也不用怕,即使在早高峰人挤人的地铁里,你也能在手机上利用碎片化的时间进行办公。当然 AI 的生成效果还不尽完美,如果内容有瑕疵,你还可以在手机端复制链接,转到 PC 界面(同一个账户 PC 和手机端均共享历史文件)接力修改 PPT,用 AI 增强换图或本地上传功能优化到满意为止。
目前,万知网页版已内置了机构宣传、职场汇报、地产城市宣传、课程教案、项目汇报等多种模版可供选择。更贴心的是,你可以自定义页数、受众对象、演示场景的属性等条件来定制 PPT,输出中文、英文双语可选,跨国的信息准备再也不发愁。
同时,你还可以上传 Word 材料让万知帮你转化成 PPT、或上传 PPT 参考模板进行个性化内容填充。
在 AI 2.0 时代 ,即便是使用搭载 Copilot 的 Windows Office,用户仍然需要面对空白界面和跳动的光标,一切创意的开端都需要人工参与。而以万知为代表的 AI-First 工具则存在本质上的不同,用户以自然语言与 AI 交互,由 AI 完成初步创作。繁杂的功能界面、文件格式兼容等等不再是创作的阻碍,用户需要学习的仅仅是如何更好地向 AI 提出需求。
根据万知团队贴近职场用户的研究观察,使用 AI-First 万知之后的个人工作效率平均有五成以上的提升。其中最大程度的效率提升来自:知识检索和整理、文档构思撰写。针对某一些低专业判断的日常白领任务,比如众多发票分类总结、众多简历资格要点筛选,节约时间高达八成以上;针对文件撰写,以往需要 10 分钟的内容现在可以 1 分钟内搞定,一步步助力网友实践个人工作效率 x10 的目标。
基于大模型能力的 AI-first 应用将重构职场生态正在成为越来越多行业的共识。用上万知,金融行业从业者能够快速阅读财报,掌握核心数据;HR 可以在诸多简历中提取关键信息,洞察候选人优劣;教育工作者可以使用大模型来个性化学习内容,根据学生的学习进度和偏好推荐定制化的学习资源。
在产品设计的过程中,万知也贴合了中国职场的特色。与海外办公场景多集中在 PC 上不同,中国职场内移动办公的需求更为普遍。在零一万物生产力产品负责人曹大鹏看来,万知小程序与 PC 网页端有着很强的协同效应,小程序对应碎片化的移动办公,PC 网页端则对应专业深度办公场景;小程序是用户输入需求的快捷入口,PC 网页端则可供用户做深入的细化调整。
一些小细节上也能体现出万知在提升用户体验方面的用心。在问答场景中,与同类竞品先列索引后给答案不同,万知先给用户答案再列索引,更贴近 AI-First 产品中的用户体验;在 PPT 制作页面,万知会更直观地展示 PPT 生成的过程,缩短用户体感的等待时间。
事实上,零一万物已经于去年海外进行了产品试水,探索 PMTF(Product Market Technology Fit 产品技术市场契合),明确了 AI 读文档、PPT 制作等高价值场景,在打造优质专业的用户体验的基础上探索商业化空间。
结合海外实践经验,零一万物将万知定位为「一站式 AI 工作平台」,将职业白领、大学生等高知群体确定为核心用户层,力求利用大模型能力解决用户工作场景中的真实问题,让每个人都能轻松用上万知这个 AI 个人特助。
经过 2023 年的混战,国内大模型产品都在争夺「中国版 ChatGPT」的心智定位。回溯 2023 年初,ChatGPT 仅用 2 个月的时间便获得过亿用户,创下了互联网最快破亿应用的记录。从用户数据角度来看,中国目前还未迎来自己的「ChatGPT Moment」。
零一万物 CEO 李开复博士表示,大模型推理成本的下降会推动着中国 AI 大模型进入落地为王的阶段,今年会迎来「大模型应用爆发元年」。基于强大的 Yi 大模型的模型知识能力,搭配上以 AI-first 理念精心设计的工具软件界面,零一万物试图打造适合国人的「ChatGPT Moment」。
万知将在竞争中不断迭代。「从目前国内的竞争环境来看,我认为未来不会是一家独大的局面。」 曹大鹏表示,「零一万物作为大模型驱动的创业公司,我们会围绕生产力场景做产品创新。」
据他所说,万知已经从海外实践中探索出了 AI 读文档、PPT 等多个高价值场景,同时已基于千亿参数模型搭建起了场景专属模型,之后将会进一步优化模型性能,提升内容生成专业程度。随着模型性能的进一步增强,大众接受程度的提升,未来高价值场景会越来越多,万知也将会为中国用户带来更多惊喜。
本文来自微信公众号“机器之心”
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI