省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程
7474点击    2026-01-05 15:26

去年花 3000 万美元都买不到的团队,今年字节跳动自己做了个类似的产品,还限时免费。


刚刚,字节在海外悄悄上线了 AnyGen,功能看起来和当年想收购的 Manus 有点像——都是语音驱动的 AI 工作空间,能把你的语音、照片、想法直接变成文档、PPT、甚至故事书。


买不到?那就自己做。这背后藏着字节在 AI 办公赛道的野心。


收购被拒的故事:为什么 3000 万不够?


时间拉回到 2024 年初。


字节跳动高层曾与肖弘在香港单独会面,出价 3000 万美元收购蝴蝶效应(也就是后来开发出 Manus 的团队)。当时 Manus 的前身产品 Monica 刚开始高速增长,年度经常性收入(ARR)已经达到千万美金级别。


3000 万美元,按当时的估值来看,大概是 3 倍市销率(PS)。听起来不算低,但创始团队觉得这个价不够公允——毕竟他们上一轮融资估值就已经不止这个数了。


最终,这笔收购没谈成。


再往后的事你可能知道了:2025 年 3 月,Manus 正式上线,这是一款能够调度不同工具解决复杂问题的 Agent 产品,一发布就引发全球关注。今年 12 月中旬,Manus 宣布年度经常性收入(ARR)已突破 1 亿美元。


然后,Meta 以数十亿美元收购了开发 Manus 的公司蝴蝶效应,这是 Meta 成立以来第三大收购,仅次于 WhatsApp 和 Scale AI。


从 3000 万到数十亿,差了一百倍。


字节大概也意识到,当初那个价确实给低了。不过既然买不到,那就自己做一个——这就是 AnyGen 的由来。


AnyGen 是什么?核心功能拆解


字节在海外上线了一款 AI 办公产品 AnyGen,定位是"语音驱动的人工智能工作空间"。


简单说,它想做的事是:你随时长按录音,说出想法,AnyGen 就能帮你把这些碎片化的内容整理成可交付的文档、PPT、报告,甚至图文并茂的故事书。


产品定位


AnyGen 瞄准的是这样一群人:


  • 内容创作者:需要快速把想法变成文章、故事、视频脚本
  • 产品经理:开完会要整理需求文档和 PPT
  • 个人知识工作者:想用 AI 提升工作效率,但不想学复杂的 Prompt


核心卖点就一句话:别打字了,直接说


核心功能模块


AnyGen 能随时让语音笔记、照片和自己的想法,转化为文档、见解和演示文稿等内容。具体来说,它有 4 个核心模块:


模块 1:文档生成


省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程


功能:语音或文字输入 → 自动生成结构化文档


你可以长按录音键,边想边说,AnyGen 会实时转成文字。说完之后,点击"生成文档",它就能自动整理成有标题、有段落、有逻辑的文档。


生成的文档支持飞书式的编辑体验,可以继续修改调整。


模块 2:演示文稿生成


功能:内容 → PPT


省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程


把文档内容一键转成 PPT,速度很快,而且支持单页编辑。这意味着你不用全部重新生成,只需要调整某一页就行。


这个功能对产品经理和需要频繁做汇报的人来说挺实用——开完会录个音,2 分钟就能生成一份汇报材料。


模块 3:故事书 / 漫画生成


省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程


功能:创意构思 → 图文内容


这是 AnyGen 比较有意思的一个功能。你可以输入一个主题(比如"讲解光合作用的趣味故事书"),AnyGen 会调用 Nano Banana来生成配图,然后自动排版成一本图文并茂的故事书。


从试用反馈看,这个功能有点像 NotebookLM 的多模态内容生成——不只是文字,还能生成图片、甚至漫画风格的内容。


模块 4:数据分析(通用智能体)


省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程


功能:上传数据 → 可视化洞察


你可以上传 Excel、CSV,或者直接拍张数据表格的照片,AnyGen 会自动分析数据,生成图表和洞察报告。


这个功能的门槛很低,不需要你懂 SQL 或者写代码,适合非技术背景的人快速做数据可视化。


三大应用场景实战


光看功能介绍可能不够直观,咱们来看几个实际的使用场景。


场景 1:会议记录自动化


需求:产品经理开完需求评审会,要整理会议纪要 + 做一份汇报 PPT


操作步骤


1. 会议中:打开 AnyGen,长按录音键,记录讨论的核心要点

• 不用一字不落地记录,只需要说出关键信息

• 支持多次录音,随时补充

2. 会后整理:点击"生成文档"

• AnyGen 自动把语音转成结构化文档

• 自动提取核心观点、待办事项、时间节点

3. 生成 PPT:选中文档内容,一键转 PPT

• 自动生成标题页、内容页、总结页

• 支持单页编辑,调整某一页的内容或排版


预期结果:10 分钟的会议 → 2 分钟生成完整材料


对比传统方式(听录音 → 整理笔记 → 写文档 → 做 PPT),时间至少压缩了 80%。


场景 2:创意内容快速成型


需求:给孩子做一本科普故事书,讲解光合作用的原理


操作步骤


1. 语音描述需求

• "我想做一本讲光合作用的故事书,要有趣、有插图,适合 8 岁小孩看"

2. AnyGen 生成内容

• 调用 Nano Banana2 模型生成配图

• 自动撰写故事文本(用拟人化的方式讲植物的光合作用)

• 排版成可下载的 PDF 或图片格式

3. 微调细节

• 可以针对某一页的图片或文字进行修改

• 调整配色、字体、插图风格


预期结果:从构思到成品 < 5 分钟


这个场景特别适合内容创作者、教育工作者,或者想给孩子做点个性化内容的家长。


场景 3:数据分析可视化


需求:运营人员拿到一份用户增长数据,要快速做成可视化报告给老板看


操作步骤


1. 上传数据

• 直接上传 Excel 文件

• 或者拍张表格照片(AnyGen 会自动识别)

2. 语音说明需求

• "帮我分析过去 3 个月的用户增长趋势,重点看新增用户和留存率"

3. 自动生成报告

• AnyGen 生成折线图、柱状图

• 自动提炼关键洞察(比如"10 月新增用户环比增长 25%")

• 输出可下载的报告(PDF 或 PPT 格式)


预期结果:非技术人员也能 5 分钟做出专业级数据报告


AnyGen vs Manus:功能对比


既然 AnyGen 被拿来和 Manus 对比,那它俩到底有什么异同?


相似之处


两款产品确实有一些共同点:


  • 都是 AI Agent 产品:不只是简单的对话式 AI,而是能主动调度工具、执行任务
  • 都支持多模态输入:语音、文字、图片都能作为输入
  • 都强调"语音驱动":降低使用门槛,让用户用说的方式完成工作


核心差异


但如果深入看,两者的定位和技术路线其实挺不一样:


省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程


简单说:


  • Manus 更像是一个"AI 助理",你给它一个复杂任务(比如"帮我分析这份财报并生成投资建议"),它会自己调用计算器、搜索引擎、数据分析工具来完成。
  • AnyGen 更像是一个"内容生成器",你给它原料(语音、文字、图片),它帮你加工成成品(文档、PPT、故事书)。


为什么字节没做成 Manus?


这可能跟字节的技术积累和战略选择有关:


1. 方向选择:字节在内容生成领域有深厚积累(剪映、即梦、豆包),做内容生成类工具更顺手。而 Manus 的核心是 Agent 编排,这需要不同的技术栈。

2. 市场策略:AnyGen 选择海外免费试水,降低用户门槛。Manus 则是订阅制,走高端路线。

3. 产品基因:字节有飞书(协作)+ 豆包(大模型)的基础,把这些能力整合到 AnyGen 里,比从零做一个 Agent 编排系统更快。


字节的 AI 办公版图


AnyGen 不是字节在 AI 办公领域的第一次尝试。如果把字节的产品线拉出来看,能看到一个逐渐清晰的版图。


省下 3000 万?字节版 Manus 突然免费上线,全网都在求教程

字节产品战略布局


三条产品线


1. 飞书(Lark):企业协作平台

• 定位:对标 Slack、Microsoft Teams

• 现状:国内发展不错,但海外表现平平

• 问题:缺少差异化竞争力

2. 豆包:对话式 AI

• 定位:C 端 AI 助手

• 数据:DAU 已突破 1 亿大关,是字节历史上推广费用最少的破亿产品

• 市场:主要在国内

3. AnyGen:AI 办公工具

• 定位:语音驱动的内容生成工具

• 市场:主要面向海外

• 策略:限时免费,快速获取用户


战略意图


从这三条线可以看出字节的意图:


  • 补齐海外 AI 办公短板:飞书在海外没做起来,AnyGen 想换个角度切入——不做复杂的企业协作,而是做简单易用的个人效率工具。
  • 对标 NotebookLM、Gamma.app:这两款产品在海外很火,都是用 AI 做内容生成。AnyGen 的功能和它们有重叠,但加上了字节擅长的语音交互。
  • 利用内容生成优势:字节有剪映(视频剪辑)、即梦(AI 绘画)的产品经验,这些能力可以直接复用到 AnyGen 里。


面临的挑战


当然,AnyGen 要真正做起来,还有不少挑战:


1. 海外竞争激烈:OpenAI、Google、Notion AI 都在做类似的事,而且有更强的品牌认知度。

2. 免费策略能否持续:现在是限时免费,但如果后续转成付费,用户会不会买单?Manus 能做到 ARR 破亿,是因为它真的解决了专业用户的刚需。AnyGen 能不能找到自己的刚需场景?

3. 如何差异化竞争:语音输入不是独家能力,Google、OpenAI 也有。AnyGen 需要找到自己的护城河——可能是更好的中文支持?更低的使用门槛?还是和飞书、豆包的深度整合?


现在免费,抓紧试用


如果你想体验 AnyGen,现在是个好时机——限时免费,不用付费就能试完整功能。


访问地址https://www.anygen.io/home?invitation_code=Z5BMA0IHK0C95W6(需外网环境)


建议先从简单的场景试起:


  • 录一段语音,让它生成文档
  • 上传一张数据表格,看看它能不能做出可视化
  • 试试让它做一份 PPT


找到适合自己的使用场景,然后再决定要不要长期用。


最后问个问题:你觉得 AnyGen 能成为下一个爆款 AI 工具吗?还是说它只是字节在海外市场的又一次试水?欢迎评论区聊聊你的看法。


我是AIGC 胶囊,在这个快节奏的AI时代,我想陪你走得稳一点。不分享我没用过的,不推荐我没验证的。我把踩过的坑填平,把验证过的路铺好,只为了让你在应用AI时,少走弯路,多拿结果。


文章来自于“AIGC胶囊”,作者 “AI探路者”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
OpenManus

【开源免费】OpenManus 目前支持在你的电脑上完成很多任务,包括网页浏览,文件操作,写代码等。OpenManus 使用了传统的 ReAct 的模式,这样的优势是基于当前的状态进行决策,上下文和记忆方便管理,无需单独处理。需要注意,Manus 有使用 Plan 进行规划。

项目地址:https://github.com/mannaandpoem/OpenManus


3
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


4
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

7
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

8
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0