惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死
7728点击    2025-05-26 14:12

国产智能体,这次真封神了。


过去这段时间,「智能体」简直杀疯了。


无论是初创公司还是互联网大厂,主流 AI 玩家们都开始围着它转,说它是大模型的下一站也毫不夸张。


作为人工智能的一种高级实现,智能体比大模型更具实体化、自主性、交互性,已经进化成「会思考、动手强、能串联一切工具的全能战士」。


就在 5 月 22 日,这条 AI 赛道迎来了一个足以傲视群雄的「巨无霸」产品,其背后站着的正是一家国产大模型厂商 —— 昆仑万维。


这家位居国内大模型第一梯队的选手,面向全球正式发布了天工超级智能体(Skywork Super Agents)(下文简称 Skywork),直接卷出了新高度!


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


与 Manus、OpenAI deep research、Genspark 等其他智能体相比,Skywork 有三大必杀技:「场景全、能力强与框架开源。


首先是「全」,Skywork 远不是一两个小工具拼凑出来的智能体,而是系统打包了 5 个专家级 AI Agent,可以一键生成专业文档、数据表格、PPT、播客、网页五件套,称得上是内容创作者眼中的黄金搭子。


更炸裂的是,Skywork 还提供了 1 个通用 AI Agent,可以一站式地输出音乐、MV、宣传片、绘本、有声书等多模态内容。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


其次是「智商」爆表,跑分成绩给了我们很大惊喜。


Skywork 在多个 AI Agent 基准测试榜单中登顶,比如在 GAIA(最困难、最全面的智能体基准测试)中,面对从初级到高级、从易到难的不同任务(Level 1 到 Level 3),它全面超越了 Manus、OpenAI deep research。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


这还没完,Skywork 在 SimpleQA(评测智能体回答事实性问题准确性的基准测试)中的得分(94.5)同样超越了 OpenAI 以及当前 SOTA,解决大模型「胡言乱语」更给力了。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


最后是让开发者沸腾的 —— 全球首个开源的 deep research agent 框架,这意味着每个人都可以参与到智能体的定义中来了。


同时,直接开放三大 MCP 接口,供开发者调用文档生成、数据分析、PPT 演示文档三大能力,形成以智能体为核心的「AI 操作系统」,成为开发者们的新基建。


  • 框架开源地址:https://github.com/SkyworkAI/DeepResearchAgent
  • MCP 地址:https://mcp.so/server/skywork-super-agents/Skywork-ai


还有一点特别值得称道,Skywork 不搞现在 AI 圈讨厌的饥饿营销那套,不排队、不抢码、不内测申请,上线即可用。性价比还贼高,单个通用任务成本仅需 0.96 元。


今日,昆仑万维重磅宣布天工超级智能体(Skywork Super Agents)APP 正式上线,这也是全球首款基于 AI Agent 架构的 Office 智能体手机 App。


看起来,想要体验智能体的小伙伴终于有了一个实力更强、价格又便宜的选择。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


第一手实测:智能体界的「全能型选手」


从 OpenAI 的 deep research 到 Manus、Genspark 等专精型 Agent,市面上的产品在功能上可以说大同小异,而「谁真正能落地、谁真正好用」成为普通用户最关心的问题。


接下来,我们就搞个一手实测,看看 Skywork 这个「新秀」的实力究竟如何。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


  • 全球官网:https://skywork.ai
  • 中国官网:https://tiangong.cn


多场景写作


最近 AI 率检测的问题频频登上各大平台的热搜榜。有大学生发帖称,熬秃了头写的毕业论文 AI 率被判了 80%,测试一番后发现朱自清的《荷塘月色》AI 率竟超 60%。为了去 AI 味儿,学生们绞尽脑汁,要么疯狂改标点,要么短句改长句……


对此,我们让 Skywork 生成一份适用于 B 站 3 分钟科技短视频的脚本, 吐槽一下当前 AI 技术的发展带来的魔幻现实。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


不得不说,Skywork 设计的「UP 主台词」很有 B 站特色,如「屏幕前的各位『肝帝们』」、「亿点点变化」、「以前是怕抄袭,现在是怕被 AI」 等语句非常贴合年轻受众,既有梗又有深度。而且它还在合适的位置穿插着柱状图、专家观点的引用,更增强了脚本的传达力与可信度。


可视化数据分析


Skywork 的表格模式类似于 Microsoft Excel 和 Google Sheets,输入主题、需求或者上传原始数据后,它就能智能分析并生成表格、图标等。


我们输入指令:「生成一份图灵奖 2015-2024 年的获奖统计」。


Skywork 并不急于执行,而是通过与用户交互确认任务细节,包括统计维度(如获奖人数、国籍、研究领域、所属机构)和展示方式(如表格、趋势图、占比图等)。这种前置的任务拆解能力,使得整个分析过程具有极高的准确性和可控性。


紧接着,它会自动生成待办清单,调用各种 MCP 工具依次执行任务,整个过程无需用户参与。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


Skywork 准确完成了数据整理和分析任务,最终生成四个结构完整、信息翔实的 sheet。在可视化呈现方面,它生成的饼图、柱状图和折线图不仅美观,还极具数据表达力。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


精美 PPT


打工人最怕三件事:加班没有加班费、老板突然 @你、顺便做个 PPT。别的顺便是顺手,这个「顺便」是要命:字体怎么调都不对,图表怎么看都很土,辛辛苦苦熬夜干到凌晨三点,结果老板瞅了一眼:「感觉不太对,你再打磨下」。


现在,Skywork 给每个被 PPT 逼疯的打工人开了张救命的「药方」。只要一句简单的 Prompt:制作《日本镰仓的旅游攻略》PPT,它立马就能生成一份结构清晰、颜值在线的 PPT。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


从最终生成效果来看,该 PPT 不仅有实用信息点,还配了高质量的场景图、路线图和日程表,我们完全可以直接拿来用。


创意网页


今年 2 月份,Andrej Karpathy 提出了 Vibe Coding(氛围编程)的概念,码农们不用逐行写代码,只要用自然语言描述目标功能,专用大模型即可生成对应代码。


Skywork 目前也能实现这一功能,输入需求就能快速生成可溯源、可编辑、可应用的高质量多模态 html 成果。举个例子,我们让它「生成一个开心消消乐的网页小游戏」,几分钟后它啪地甩来一个水果卡通风的成品。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


这个网页小游戏不仅界面设计的好看,更重要的是,它真实可玩。在规定的一分钟内,玩家让三个或以上相同的水果图标连成一条直线即可消除,并且它还能根据得分情况增加等级。


智能音频播客


去年谷歌 NotebookLM 曾掀起一股 AI 播客热潮,仅需一个链接或文档,几分钟就能转成接地气的男女对谈。当时,不少 AI 圈的大咖为它「站台」,甚至连「死对头」OpenAI CEO Altman 都认为它很酷。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


Skywork 这次上线的播客模式与之有异曲同工之妙。我们输入 Prompt:《面纱》读书对谈播客,它随即就去找资料写稿「录制」,然后一键生成音频播客。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


AI 男女主播吐字清晰,语音语调自然真实,语气词、说话的气口都把握得相当到位。从内容来看,他俩也不是照本宣科,而是在真正读懂了小说后,针对播客这一媒介形式进行的自我创作。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


与谷歌 NotebookLM 不同的是,如果我们对成品有任何调整需求,可以直接在聊天框里提,Skywork 随时修改。比如,我们让播客增加一部分,介绍小说中的男主沃尔特・费恩是个怎样的人,Skywork 立马在原有播客基础上更新了相应的内容。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


音乐与视频生成


此前,昆仑万维发布了全球首个音乐推理大模型 Mureka O1,不输 Suno 的惊艳效果让所有人看到了其在音乐生成领域的深厚造诣。


Skywork 的音乐实力同样不俗,比如「生成一段适合清晨独自散步时听的轻音乐」,它以钢琴为主旋律,整体节奏舒缓匀称,给人一种在晨光中漫步的惬意感觉。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


视频生成也不在话下,比如「城市天台夜晚,一群会发光的小鸟从霓虹灯上起飞,汇聚成一个漂浮的时间钟表」,这种复杂 Prompt 的目标场景都能 hold 住,你就说赞不赞吧?!


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


Skywork 还能生成带背景音乐的视频,如下「generate a video with music: a man raps to the camera」。下一步的升级方向可能就是直接生成指定对白、语气的音画同步视频了,就像谷歌 Veo 3 所能做到的那样。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


这一波实测下来,我们切身的感受是:强,太强了!


无论是生成内容的丰富性、专业性、准确性,还是界面设计的美观程度和布局的合理性,Skywork 都展现出了一个「全能型」智能体该有的样子,甩开了现有竞品。


人无我有,打造差异化竞争优势


在体验过程中,我们发现,Skywork 在任务协同、多模态生成、结果可信度和个人知识库上,具备了真正的「差异化实力」,克服了 Manus、OpenAI deep research 等竞品的痛点,实现了「人无我有」的后发优势。


超能 Office 三件套 —— 高效内容创作与生产力输出


当代打工人,谁没被文档、表格和 PPT 这工作「三件套」逼疯过?


如今,Skywork 把文档、表格、PPT 这三大办公工具整合在了一起,生成的内容不仅更详细、更条理,还能做出各种清晰好看的图表,甚至还能插入 Youtube 视频。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


当然,如果你想对生成的内容进一步细化调整,Skywork 提供了在线编辑功能,通过「编辑」按钮直接在界面上修改文字、调整结构,像使用在线协作工具一样自然流畅。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


导出格式也非常灵活,包括 PPTX、PDF、HTML、Google Slides 等多种格式,满足我们在决策讨论、版本迭代、二次创作中的不同需求。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


生成酷炫内容 —— 多模态内容融合


在日常创作中,我们往往需要在文字、图片、音频、视频等多个工具之间来回切换,才能把一个想法完整呈现。


Skywork 在通用对话任务上打破传统 Agent 任务执行的边界,接入网页搜索、思考分析、图片生成、图片理解、语音生成、音乐生成、视频生成等十余个 MCP,让创作者无需奔波于不同平台,就能一键生成宣传片、MV、有声书、绘本等多种形式的内容。


比如我们仅用一个 Prompt,就让它混搭出一个小猫的旅行 vlog,不仅准确生成出各大地标,还让小猫在每一个场景中自然入镜,整个过程无需人工干预。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

提示词:帮我生成一个小猫的旅行 vlog,内容分别是小猫到法国埃菲尔铁塔、美国自由女神像、中国长城、澳大利亚悉尼歌剧院、埃及金字塔、印度泰姬陵、日本富士山等地旅游并与这些著名景点自拍合照,配乐轻松欢快。


这种「Agent+MCP 多工具融合」的架构,有望引领下一代内容生产的范式革命。


信源可追溯 —— 向可验证内容创作演进


在如今这个内容泛滥的时代,信息可靠性反倒成了稀缺资源。大模型虽然擅长高效生成,但它们一本正经地胡说八道早就不是什么新闻。


Skywork 试图解决的正是这个痛点。它生成的每一段文字、每一张图片都不是凭空捏造,而是能清晰追溯到具体出处。输出文本可以关联原文段落,图片也能标注出溯源网页或知识库来源,甚至还附上完整的信源列表。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


这种将信息溯源融入创作流程,让用户在生成内容的同时随时验证,大大降低了大模型「满嘴跑火车」的风险,真正让每一次产出都有据可查。


个人知识库 —— 打造私有化智能内容循环


如今,市面上的智能体普遍存在的一大痛点在于:素材零散、成果不可持续,缺乏系统性积累机制。


为了解决这些挑战,Skywork 上线了个人知识库。我们可以上传 pdf、doc、ppt、xls 等多种格式的文件,也可以上传录音、url 和 youtube 视频播放地址。每个知识库支持上传最多 50 个文档,并可根据不同主题创建多个知识库,实现清晰有序的知识管理。


更重要的是,Skywork 不只是一个信息存储工具,更是一个智能创作引擎。基于知识库内容,我们可以一键生成 多模态内容,它们又能反向存入知识库,形成「素材 - 创作 - 再积累」的正向循环,打造真正可生长的个人知识系统。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


以上这些差异化功能,构成了 Skywork 的核心竞争力,使之成为真正「有用、敢用、好用」且更具性价比的 AI 智能打工人。


从信息发现到结构化内容输出

全链路流程被打通


为了实现通用化、性能更强的智能体,Skywork 在底层技术上祭出了多项自研,打造全链路智能内容引擎,从深度搜索到高效生成,一站式解决复杂任务。


首先自研一个 deep research 模型,通过依托「深度思考 + 推理」的信息检索,不仅查得更广与更准,还能更快找到高质量源信息;强化学习能力的加持又进一步增强模型面向各种搜索任务的泛化性,性能上全面对标 OpenAI 竞品。


接下来是一套自研的 agent workflow 框架,在高效完成传递信息、拆解任务之外,还能灵活调用基座大模型,使智能体能力得以延伸。效果也非常显著,在开源的 deep research 排行榜上拿下了 SOTA 成绩。


此外还自研一个生成物模型,实现高质量数据的生成、收集和训练,使生成内容更丰富、更真实且可读性更强;配合自研的在线编辑系统,无缝兼容常见办公软件,实现一站式内容生成与修改,并能一键导出成稿,效率与友好性绝对是拉满了。


最后,面对特别复杂的任务也有诀窍 —— 「化整为零、各个击破」,即将复杂任务拆分为多个小任务,每个小任务单独进行深度研究、互不干扰,有效突破了模型上下文长度的限制,支持超复杂任务协同解决。


正是技术上的一系列突破,Skywork 才有了如今敢于叫板一切对手的实力。


Office 的下一次革命来了?


自大模型技术爆发以来,人们一直在寻找应用的突破方向,最先开启自动化革命的恰恰是写代码本身。


现在,很多人都知道自然语言驱动的编程工具 Cursor,它正在吸引越来越多的程序员。人们写代码的方式已经发生了变化:先让 AI 写一个 readme 列出项目设计思路、功能逻辑,然后再让 AI 一步一步地实现就可以了。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死


Cursor 也让编程门槛降到了一个前所未有的低点,号称让非程序员也能参与开发。只要你能描述清楚需求,Cursor 就能帮你生成专业级的代码。


同样地,超级智能体带来的能力,就像是 Office 版本的 Cursor。无论是制作文档、表格、PPT,还是生成网页或播客,它都可以根据你提出的需求快速进行生成,节省你大量的工作时间。


随着智能体成为 AI 产业界的核心关键词,它已过了秀概念的阶段,并开始了从技术展示向场景落地、从工具层向系统层的过渡。此次,Skywork 的推出不仅印证了中国 AI 企业在智能体领域具备了与国际对手抗衡乃至超越的实力,而且预示了接下来在该 AI 方向上「技术 + 场景 + 生态」全面交锋的趋势。


对于昆仑万维来说,这是一次具有战略意义的突破。在未来更大的应用前景铺开之前,它用一款全栈自研的超级智能体为自己在市场上赢得了先机。从上手体验来看,这款产品已经越过了实用化的门槛。


或许过不了多久,大量的工作就会由智能体接手,这何尝不是办公全家桶的一次进化?你只需要提出需求,投喂文件资料,确认好细节后,坐等 AI 交作业!


文章来自于“机器之心”,作者“杜伟”。


惊了,我的电脑在自动打工!花不到1块钱雇个「AI超人」,Office三件套被卷死

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0