AIGC果然要将所有软件重塑一遍?
中国AIGC产业峰会上,金山办公副总裁、研发中台事业部总经理姚冬分享了金山办公拥抱AI的思考与实践。
作为一家已成立36年的老牌办公软件公司,金山办公在AI浪潮中将战略重心着重放在了协作、AI这两点之上。由此,WPS也进行了一波重塑。
姚冬在演讲中表示:
今天的WPS已不仅是一个文档编辑器。
为什么会这样说?
为了完整体现姚冬的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。
中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。
以下为姚冬演讲全文:
金山办公是一家大家较为熟悉的公司,成立已有36年。说句开玩笑的话,WPS都是我小时候用的软件了。
36年来,我们一直专注于一个非常确定的赛道,那就是办公类产品。随着技术的更新、迭代,我们不断地拥抱新的技术的变化。
最近五年,我们的战略可以称为多屏、内容、云、协作和AI;最近两年,我们重心尤其放在协作和AI上面。
4月9号,我们召开了一场企业级产品WPS 365的发布会,发布了新一代产品。
可能在很多人眼里,WPS是写文档的,文字、编辑、排版、PPT生成、表格、计算。其实,WPS已经不仅是一个文档编辑器。
它除了具备文档编辑的能力,还有企业数据协作、知识管理、通信以及各种跟算法相关的模型服务,提供端的编辑的同时还提供在线多人协作共享文档。
整个WPS 365已经是涵盖了编辑、协作、文档管理多个功能在内的完整的办公平台。
WPS 365发布会上,我们主要发布了WPS AI企业版,其中包括三个类型的产品:AI Hub、AI Docs和Copilot Pro。
接下来我逐一介绍。
AI Hub是干什么的?
今天很多企业都想用上AI的能力,他们会采购或自主研发一些大模型。但业界会有一个问题:大模型没有标准,不像传统的API、数据库,总有个接口规范。
大模型厂商各家的API千奇百怪,互相不兼容。OpenAI有OpenAI的一套,百度有百度的一套。中国发布的大模型大概有几十上百个了,每个API完全不一样,而且开源的API也完全不一样。
所以当企业使用这些AI模型的时候会遇到一个问题:应用必须兼容所有的AI接口,因为它也不确定最终业务用哪个模型,也有可能混合,什么都用。
所以我们提供一个解决方案,能够兼容市面上绝大多数的商业模型以及开源模型。我们配备了统一的接口、统一接入的规范、统一应用开发体系,并且用户可以在开源模型上做微调。
我们把这种能力统称AI Hub,这是企业使用AI能力时的一个基座。
下面大家可以看到,只是做一个最简单的应用:跟模型聊聊天。在聊天界面里,你可以选择不同的模型。你觉得哪个模型擅长聊什么主题就可以随时无缝切换。
我们现在不只是支持上面的这些模型。很多企业会自己采购,他们可以选择适合的模型,甚至自己研发。
第二个是AI Docs。AI Docs可以这么理解:
很多企业经营很多年后,会积累大量的数据。员工每天都在写文档、看东西,比如写各种报告、调研、产品设计、数据分析,这些宝贵的文档其实是企业非常重要的知识。
而且,一般企业只要写了的文档基本都不会删除,这些文档会积累下来。
过去企业一直头疼一个问题:明明知道那些文档是多年员工呕心沥血沉淀下来的丰富的知识,但这类知识因为是非结构化知识,无法再利用。
我们都知道,存在数据库里面的数据有非常严谨的格式,这些数据很容易被API调用。
但是写在文档里的数据创作过于自由,可能是文字、图表、插图,甚至就是一张扫描件。格式也非常自由,可能是PPT、PDF、3D Studio的设计图纸……
那么,用传统的搜索引擎来解决可不可以呢?
搜索引擎可以。但传统的搜索引擎基于关键词搜索,在面对非结构化知识的时候效果非常差,因为文档里面元素实在太多。
而现在基于大模型技术,这件事变得可行了。因为大模型非常擅长理解这种非结构化的自然语言,如果配合多模态大模型甚至可以理解图表、插图和扫描件。
所以我们提供了一套这样的解决方案,因为本身WPS为办公用户提供了文档库,如果用了我们企业级的解决方案,这些企业的文档本来就存在WPS提供的云文档的文档库里面。
我们基于文档存储做了新的文档,基于自然语言大模型做阅读理解和搜索的一套东西,可以跟这些文档做问答。
传统搜索引擎想搜某个公式搜不到。但是基于大模型和多模态方法,可以从这样文档里面抽取相应的内容和知识,并且回答用户相关的问题。
当然,企业文档还要考虑一个很麻烦的事情:企业文档是有权限的。
一个企业里面一般都会有一些规定,不是所有人都可以看所有文档,而且这个权限是有严格的管理的。比如企业跨部门的、不同管理层级的人有不同的查看权限。
而我们本来做文档管理就提供了非常丰富的权限审查,即使大模型帮用户阅读理解文档和搜索的时候,也能保障这个权限。
比如一个普通员工突然想问CEO上周汇报写的什么,汇报明明在文档里,因为他没有权限,所以他搜也搜不到,他问也不会回答相关的问题,我们有完整的文档权限体系保障信息的不越权。
除了写作、做问答搜索以外,很多企业会基于过去的文档做创作。
政务领域很典型,经常写一些公文、通知、报告,要保证一个部门里面所有历史上相关的文档内容、措辞、风格保持一致性。总不能说一个部门发布的每一篇文档写作风格迥异,这一般不太会。
传统方法只能好好培训一系列相关从业人员,仔细阅读前辈们写的东西,模拟前辈的风格去写。
在今天大模型时代,大模型本身就能理解自然语言的写作风格,模拟过去某个人的风格,创作下一个新的文档,这也是根据企业知识做智能创作。
WPS解决方案可以将传统的办公文档库一键生成智能文档库,拥有智能文档、多格式解析、权限的控制、知识创作,还有一个可扩展的文档的结构化。
最后说一下Copilot Pro。
Copilot这个词大家都明白,去年微软给大家普及了一下这个词。我们为什么说是Pro呢?因为在上面增加了一些东西。
以前基于软件的图形界面叫GUI,今天,下一代基于大模型的UI设计是基于自然语言的UI交互用户界面,叫LUI。
举一个典型例子,以前我们做数据分析,手里有电子表格,里面有数据,数据可能不够规整,需要做一些筛选清洗。复杂的分析不光要用公式算法还要写一段脚本。
数据分析之后还要写一个结果,制成饼图、柱图、折线图呈现给用户。
这个过程非常复杂,要求用户懂数据分析、算法、脚本编写、软件开发、公式,甚至懂各种图表参数、设置、配置。
而今天,只需要跟大模型说你要分析什么数据,得出什么样的结论,想让它最后以什么样的方式呈现,大模型就能在背后生成相应的Javascript脚本、Python脚本、电子表格里的公式等,把你期望的这一切都做好,最后生成一个图表和结论性报告。
一轮对话说不清楚,那就跟模型做多轮对话,还可以追加需求。
这是基于办公对话数据的分析。
它是生成了一个Python脚本,Python脚本在执行之后会分析数据,并且做一些计算和算法,最后得出一个图表的结论,而你只需要在底下输入框里面输入自然语言说出你的要求。
WPS基于AI技术为企业搭建了一套“企业大脑”,它提供了基础的大语言模型服务,也提供了二次开发的API,提供文档知识搜索和再利用、辅助创作,另外提供了数据处理和分析系统。
今天WPS办公不再是简单的编辑器,而且除了上面三个之外,我们提供了一整套基于WPS协作工具的企业协作方案,包括聊天,有消息、会议、邮件、日历、云盘、工作台和待办。
今天的办公不再只是简单地写文档、分析数据,更重要的是人和人、人和AI之间的协作。
文档数据在人和人之间没有传播其实一个数据孤岛,并没有太大的意义。而我们平台上很多文档的生命周期特别长,一个文档活跃了几个月,因为这个文档是关于项目的计划,参与项目的人在几个月时间内不停的往文档上补充内容。
这是沉浸式会议,会议不再是传统音视频通信,含有语音识别、会议辅助系统、文档分享、事后基于智能AI的会议纪要。
最后,我们基于大模型提供了一套数字员工解决方案,基于这套方案我们自己做了一些简单的数字员工,作为样例。
各个企业都有自己的API,而这些API以前是普通员工无法使用的。总不能让普通员工去写Python脚本调用外部API吧?但是我们可以通过数字员工方式,让大语言模型调API,用户只需要跟语言模型做沟通就可以了。
今天WPS 365品牌已经包含了传统的office文档的编辑、AI企业版,以及整个基于AI协作解决方案。
这是我们新发布的新质生产力平台WPS 365,金山办公希望通过开放、赋能,持续地服务企业级客户。
文章来自于公众号量子位
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales