ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
金山办公姚冬:AI让办公不再孤立,LUI是下一代交互 | 中国AIGC产业峰会
5715点击    2024-05-12 14:42

AIGC果然要将所有软件重塑一遍?


中国AIGC产业峰会上,金山办公副总裁、研发中台事业部总经理姚冬分享了金山办公拥抱AI的思考与实践。


作为一家已成立36年的老牌办公软件公司,金山办公在AI浪潮中将战略重心着重放在了协作、AI这两点之上。由此,WPS也进行了一波重塑。


姚冬在演讲中表示:


今天的WPS已不仅是一个文档编辑器。


为什么会这样说?



为了完整体现姚冬的思考,在不改变原意的基础上,量子位对演讲内容进行了编辑整理,希望能给你带来更多启发。


中国AIGC产业峰会是由量子位主办的行业峰会,20位产业代表与会讨论。线下参会观众近千人,线上直播观众300万,获得了主流媒体的广泛关注与报道。


话题要点


  • 最近两年,金山办公的战略重心尤其放在协作和AI上面


  • 整个WPS已经是涵盖了编辑、协作、文档管理多个功能在内的完整的办公平台


  • 以前的软件叫图形界面GUI,下一代基于大模型、基于自然语言的用户界面,可以叫LUI


  • 今天的办公不再只是简单地写文档、分析数据,更重要的是人和人之间的协作


以下为姚冬演讲全文:


WPS不再是一个文档编辑器


金山办公是一家大家较为熟悉的公司,成立已有36年。说句开玩笑的话,WPS都是我小时候用的软件了。


36年来,我们一直专注于一个非常确定的赛道,那就是办公类产品。随着技术的更新、迭代,我们不断地拥抱新的技术的变化。


最近五年,我们的战略可以称为多屏、内容、云、协作和AI;最近两年,我们重心尤其放在协作和AI上面。



4月9号,我们召开了一场企业级产品WPS 365的发布会,发布了新一代产品。


可能在很多人眼里,WPS是写文档的,文字、编辑、排版、PPT生成、表格、计算。其实,WPS已经不仅是一个文档编辑器。


它除了具备文档编辑的能力,还有企业数据协作、知识管理、通信以及各种跟算法相关的模型服务,提供端的编辑的同时还提供在线多人协作共享文档。


整个WPS 365已经是涵盖了编辑、协作、文档管理多个功能在内的完整的办公平台



WPS 365发布会上,我们主要发布了WPS AI企业版,其中包括三个类型的产品:AI Hub、AI Docs和Copilot Pro

接下来我逐一介绍。


AI Hub:多个大模型随意切换


AI Hub是干什么的?


今天很多企业都想用上AI的能力,他们会采购或自主研发一些大模型。但业界会有一个问题:大模型没有标准,不像传统的API、数据库,总有个接口规范。


大模型厂商各家的API千奇百怪,互相不兼容。OpenAI有OpenAI的一套,百度有百度的一套。中国发布的大模型大概有几十上百个了,每个API完全不一样,而且开源的API也完全不一样。


所以当企业使用这些AI模型的时候会遇到一个问题:应用必须兼容所有的AI接口,因为它也不确定最终业务用哪个模型,也有可能混合,什么都用。


所以我们提供一个解决方案,能够兼容市面上绝大多数的商业模型以及开源模型。我们配备了统一的接口、统一接入的规范、统一应用开发体系,并且用户可以在开源模型上做微调。


我们把这种能力统称AI Hub,这是企业使用AI能力时的一个基座


下面大家可以看到,只是做一个最简单的应用:跟模型聊聊天。在聊天界面里,你可以选择不同的模型。你觉得哪个模型擅长聊什么主题就可以随时无缝切换。



我们现在不只是支持上面的这些模型。很多企业会自己采购,他们可以选择适合的模型,甚至自己研发。


AI Docs:盘活企业非结构化数据


第二个是AI Docs。AI Docs可以这么理解:


很多企业经营很多年后,会积累大量的数据。员工每天都在写文档、看东西,比如写各种报告、调研、产品设计、数据分析,这些宝贵的文档其实是企业非常重要的知识。


而且,一般企业只要写了的文档基本都不会删除,这些文档会积累下来。


过去企业一直头疼一个问题:明明知道那些文档是多年员工呕心沥血沉淀下来的丰富的知识,但这类知识因为是非结构化知识,无法再利用。

我们都知道,存在数据库里面的数据有非常严谨的格式,这些数据很容易被API调用。


但是写在文档里的数据创作过于自由,可能是文字、图表、插图,甚至就是一张扫描件。格式也非常自由,可能是PPT、PDF、3D Studio的设计图纸……


那么,用传统的搜索引擎来解决可不可以呢?


搜索引擎可以。但传统的搜索引擎基于关键词搜索,在面对非结构化知识的时候效果非常差,因为文档里面元素实在太多。


而现在基于大模型技术,这件事变得可行了。因为大模型非常擅长理解这种非结构化的自然语言,如果配合多模态大模型甚至可以理解图表、插图和扫描件。


所以我们提供了一套这样的解决方案,因为本身WPS为办公用户提供了文档库,如果用了我们企业级的解决方案,这些企业的文档本来就存在WPS提供的云文档的文档库里面。



我们基于文档存储做了新的文档,基于自然语言大模型做阅读理解和搜索的一套东西,可以跟这些文档做问答。


传统搜索引擎想搜某个公式搜不到。但是基于大模型和多模态方法,可以从这样文档里面抽取相应的内容和知识,并且回答用户相关的问题。

当然,企业文档还要考虑一个很麻烦的事情:企业文档是有权限的


一个企业里面一般都会有一些规定,不是所有人都可以看所有文档,而且这个权限是有严格的管理的。比如企业跨部门的、不同管理层级的人有不同的查看权限。


而我们本来做文档管理就提供了非常丰富的权限审查,即使大模型帮用户阅读理解文档和搜索的时候,也能保障这个权限。



比如一个普通员工突然想问CEO上周汇报写的什么,汇报明明在文档里,因为他没有权限,所以他搜也搜不到,他问也不会回答相关的问题,我们有完整的文档权限体系保障信息的不越权。


除了写作、做问答搜索以外,很多企业会基于过去的文档做创作。


政务领域很典型,经常写一些公文、通知、报告,要保证一个部门里面所有历史上相关的文档内容、措辞、风格保持一致性。总不能说一个部门发布的每一篇文档写作风格迥异,这一般不太会。


传统方法只能好好培训一系列相关从业人员,仔细阅读前辈们写的东西,模拟前辈的风格去写。


在今天大模型时代,大模型本身就能理解自然语言的写作风格,模拟过去某个人的风格,创作下一个新的文档,这也是根据企业知识做智能创作。


WPS解决方案可以将传统的办公文档库一键生成智能文档库,拥有智能文档、多格式解析、权限的控制、知识创作,还有一个可扩展的文档的结构化。


Copilot Pro:自然语言交互式办公


最后说一下Copilot Pro。


Copilot这个词大家都明白,去年微软给大家普及了一下这个词。我们为什么说是Pro呢?因为在上面增加了一些东西。


以前基于软件的图形界面叫GUI,今天,下一代基于大模型的UI设计是基于自然语言的UI交互用户界面,叫LUI



举一个典型例子,以前我们做数据分析,手里有电子表格,里面有数据,数据可能不够规整,需要做一些筛选清洗。复杂的分析不光要用公式算法还要写一段脚本。


数据分析之后还要写一个结果,制成饼图、柱图、折线图呈现给用户。


这个过程非常复杂,要求用户懂数据分析、算法、脚本编写、软件开发、公式,甚至懂各种图表参数、设置、配置。


而今天,只需要跟大模型说你要分析什么数据,得出什么样的结论,想让它最后以什么样的方式呈现,大模型就能在背后生成相应的Javascript脚本、Python脚本、电子表格里的公式等,把你期望的这一切都做好,最后生成一个图表和结论性报告。


一轮对话说不清楚,那就跟模型做多轮对话,还可以追加需求。


这是基于办公对话数据的分析。



它是生成了一个Python脚本,Python脚本在执行之后会分析数据,并且做一些计算和算法,最后得出一个图表的结论,而你只需要在底下输入框里面输入自然语言说出你的要求。


今天,办公是人和人、人和AI的协作


WPS基于AI技术为企业搭建了一套“企业大脑”,它提供了基础的大语言模型服务,也提供了二次开发的API,提供文档知识搜索和再利用、辅助创作,另外提供了数据处理和分析系统。



今天WPS办公不再是简单的编辑器,而且除了上面三个之外,我们提供了一整套基于WPS协作工具的企业协作方案,包括聊天,有消息、会议、邮件、日历、云盘、工作台和待办。


今天的办公不再只是简单地写文档、分析数据,更重要的是人和人、人和AI之间的协作


文档数据在人和人之间没有传播其实一个数据孤岛,并没有太大的意义。而我们平台上很多文档的生命周期特别长,一个文档活跃了几个月,因为这个文档是关于项目的计划,参与项目的人在几个月时间内不停的往文档上补充内容。



这是沉浸式会议,会议不再是传统音视频通信,含有语音识别、会议辅助系统、文档分享、事后基于智能AI的会议纪要。


最后,我们基于大模型提供了一套数字员工解决方案,基于这套方案我们自己做了一些简单的数字员工,作为样例。



各个企业都有自己的API,而这些API以前是普通员工无法使用的。总不能让普通员工去写Python脚本调用外部API吧?但是我们可以通过数字员工方式,让大语言模型调API,用户只需要跟语言模型做沟通就可以了。


今天WPS 365品牌已经包含了传统的office文档的编辑、AI企业版,以及整个基于AI协作解决方案。


这是我们新发布的新质生产力平台WPS 365,金山办公希望通过开放、赋能,持续地服务企业级客户。




文章来自于公众号量子位

关键词: AI办公 , LUI , AIGC , 金山AI , 大模型
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales