讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新
8828点击    2025-07-23 11:35
全技术栈开发,让更多的想象力成真了。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


进入 2025 这个被誉为「Agent 元年」的下半场,我们见证着一众 AI Agent 的智能水平正朝着同一个新目标快速发展:


用全技术栈把创意直接变成可运行的产品。


就在上周,有媒体报道 AI 独角兽 MiniMax 完成了新一轮融资,公司估值突破 40 亿美元关卡。这家成立三年多的「年轻」公司再一次获得资本青睐。


而就在上个月的 MiniMax Week,他们做了一系列开源动作:从超长上下文的 MiniMax-M1 推理模型,再到 AI 视频模型 Hailuo 02、MiniMax Agent 、Hailuo Video Agent、Voice Design,在各个技术社区引起了广泛关注。


30 天前,MiniMax Agent 产品刚上线时,我们就做了第一时间的全面测评:《MiniMax 的 Agent 做得怎么样?|我们实测了 7 个案例,给出 3 点思考》


之后我们一直在跟进这款 Agent 产品的更新和迭代。


现在,这位拥有完整 AI 技术栈的实力玩家 MiniMax,又让他们的 AI 原生 Agent 产品完成了一次关键升级——全栈开发能力正式上线。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


🚥


接下来的部分,我们将分享完整的评测报告,以及对Agent全技术栈能力的2个核心洞察。


全栈开发让更多的想象力成真了


1)来打造一个「十字路口 Crossroads」播客社区吧!


亮点:深度搜索、视觉识别、支持 Supabase、会员系统、Stripe 付费


MiniMax Agent 现在支持全栈开发,也就是说,前端界面和后端功能可以一起搞


比如我们想做个几乎涵盖所有基础功能的「十字路口 Crossroads」播客社区,就可以输入:


打造「十字路口 Crossroads」播客社区(支持 MiniMax MCP + Stripe 支付) 你是一名全栈开发者,目标是开发一个类似 Spotify 的播客社区平台,命名为「十字路口 Crossroads」。该平台通过调用 MiniMax MCP 接口,将用户上传的播客文稿自动生成语音内容,构建一个围绕播客内容的听、评、聊、付费下载的一站式社区。 🎯 核心目标: • 支持上传播客文稿 → 自动生成 AI 音频 → 发布为可播放内容; • 听是免费的,但下载每个音频需支付 5 美元(通过 Stripe); • 平台具备基础社区互动功能和内容审核机制。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


这个时候,MiniMax 会提醒你去 Supabase 注册一下,这是一个 「开源版 Firebase」的系统,可以快速构建后端,不需要自己搭建服务器、数据库和认证系统。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


注册流程很简单,MiniMax Agent 会自动提醒并给出网址:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


在 Supabase 注册完成后,创建一个项目,剩下的事情就完全不用管了——Agent 会自动处理所有技术对接。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新

Supabase


我整理了下开发播客社区平台「十字路口 Crossroads」的完整流程,大致分为四个阶段:


第一阶段就是后端搭建,Agent 会自动创建数据库结构,配置文件存储等基础功能。整个过程有详细的执行日志,可以看到每一步在做什么。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


剩下三个阶段就是前端开发,用户系统与支付功能,功能完善与上线部署。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


任务流程上,我很明显地感受到新版本 MiniMax Agent 现在的「反思」能力更全面了。即使网站已经部署完成,Agent 还会继续优化,添加更多社区互动功能,力求做到完美。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


在完成构建并部署上线后,MiniMax Agent 还会进行端到端测试与总结。


可以说,MiniMax Agent 这回最大的特点就是它「端到端」能力提升了一大截:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


最后,MiniMax Agent 给出的是一套「前端 + 后端 + 数据库/存储 + 边缘函数 + 支付集成」的完整全栈项目。


你可以下载所有代码文件,也可以将成品网站 Share 给他人(亲测有效):


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


下面来让我们看看 MiniMax 生成的播客社区,功能有多完整。


首先是网站首页,基本上该有的要素都有了,每一个模块都连接着后台数据库,全部可互动:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


MiniMax Agent 提供的这个创建账户功能并不只是个模拟器或者是前端展示,它背后连接了 Supabase,能完整实现注册、激活、登录的全套流程。


比如说,我们可以直接在和 MiniMax Agent 聊天时,把自己的邮箱设为管理员,注册完就能管理整个网站后台了。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


当你在上面这个页面系统里注册账户后,会收到来自 Supabase 的邮件,点进去就等于激活账户:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


最能体现 MiniMax Agent 全栈能力的就是它提供了完整的后台。


在「个人主页」里,你可以重新设置账号、名称、收藏夹等等;在「上传播客」页面可以完整地上传音频文件。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


在「管理后台」的总览页面,我们能看到有多少用户登录了播客社区,还有订单购买时间、收入等数据,全都是实时更新的。


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


新版 MiniMax Agent 与提示词的一致性更好了。


比如,你如果在提示词里设置一句「登录账户,才可以评论」的功能,出来的成品里就会出现这个新功能,而且所有匿名用户的评论也同样会被记录在网站里:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


当然,页面的美观度还有改进空间。


这时候我们可以发挥想象力,一次性给整个网站换个全新风格,比如:


任天堂复古游戏风,低分辨率,黑色背景


MiniMax Agent 的「端到端」能力,让它能够保持极佳的一致性,迅速地为整个网站规划元素相似的风格:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


与此同时,我还为这个「十字路口 Crossroads 播客社区」的用户设了一个规则,每个播客售价 5¥:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


为了实现付费功能,需要接入 Stripe 支付平台(一家全球在线支付处理平台)的接口。设置过程很简单,MiniMax Agent 会直接给出注册网址,进去注册就行了。


像是下面这样:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


这样一来,所有用户登录网站后必须付费才能下载播客音频。


我录制了一段 Gif 展示了具体测试的过程。


当你点击付款按钮后,如果账户余额足够成功支付的话,才可以去下载音频,整个流程很流畅,没有出现功能衔接不了的情况:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


我也把这段音频放上来了,是关于「Koji 与鸭哥」的一段访谈内容:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


用下来感觉 MiniMax Agent 的工作流程越来越熟练了。主要是因为它的任务起点是「深度搜索」,信息储备很充分,所以最终输出的结果一致性很高。


它能以极快的速度从 0 到 0.99,构建一个完整的平台。


我再举个例子,只是简单输入一段这样的提示词:


把这个播客社区转换成 Spotify 风格,简洁有美感。


MiniMax Agent 在几分钟内就做出了一个工业美学风的播客台:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


里面很多元素的一致性非常非常高,且每个播客栏目的封面图与标题之间的协调度也很好。


像是「海洋诗篇」、「街道故事」栏目等等,很文艺:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


在实际体验过程中,我还发现 MiniMax Agent 在批量搜索图片和视觉识别方面越来越得心应手了。以前让它做这类任务,它只是按量完成,现在则是追求更高的完成度。


大概就是之前求「做完就行」,而现在是「求精、求好」:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


2)一句话就可以构建的「 AI 算命 MCP 」


亮点:搭建可复用 MCP、接入大模型 API


现在,MiniMax Agent 支持一句 Prompt 直接构建 MCP,还能保存到本地或者直接在聊天框里重复使用,甚至保存到工具栏里随时调用。


比如,我想做个「算命服务」MCP:让我输入任何内容,它用「算命大师」的语气来回答,背后调用 MiniMax 的 API 来支持。


就可以输入下面这段提示词,需要的朋友可以直接 Copy:


你是一位全能AI开发助手,请为我创建一个基于MCP协议的“算命服务”MCP服务器。

1. 使用 Python 编写;

2. 支持运行于MCP框架中(例如MiniMax Agent平台);

3. 实现一个名为 fortune_telling 的MCP操作; 4. 用户输入一段描述内容,系统将其作为 user_input 传入;

5. 后端调用大模型,使用如下 prompt: “你是一位通晓命理、星象、八字与塔罗的算命大师,请根据以下内容进行命理解析,要求包含:①性格分析②当前运势③建议,风格神秘隐晦,不给具体时间,只谈趋势,语言富有象征性,不使用现代词汇。用户内容为:{{user_input}}”; 6. 将生成的内容作为 output 返回。 后端调用大模型MiniMax的API,(API Key为______)


MiniMax Agent 几乎简化了中间需要人力操作的复杂步骤。


比如以前最让新手头疼的就是「工具调试」,现在它会自动测试,运行自己做好的 MCP 工具,看结果是否成功输出了:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


完成后,你只需要输入几个字和 API Key,就能保存到 MiniMax Agent 里,以后随时复用,这点做的还是挺贴心的:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


有了趁手的 MCP 后,我们就可以基于它「随意」开发了。


比如最简单的就是让它做一个前端界面,将 MCP 嵌入其中,构建一个完整的「天机占卜」网站。


提示词如下:


请创建一个充满东方古韵的算命网页前端,用户输入提示词,你调用「算命服务」MCP服务器,输出结果,字体为宋体,体现中华传统文化的深厚底蕴和古典美学:


一个「探天机·观人生·知命运」的古风网站就很迅速地完成了,你可以提问多种类型的问题:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


这种一句话就能构建出来的可复用且非常成熟的 MCP,确实为「灵敏开发者」们提供了更多的想象空间。


3)定时全网搜索的「AI 初创公司融资新闻站」


亮点:Cron job 自动运行、全网搜索


MiniMax Agent 现在还支持 Cron job (定时任务),能够更灵活地设定时间间隔,自动运行脚本或命令。


像是,我想用它做一个 AI 初创公司融资信息新闻站,1 分钟更新一次,就可以输入下面这段提示词:


每隔 60 秒自动调用一次 Serper API 使用关键词如 “AI 初创公司融资” 或相关短语进行搜索 从 API 返回结果中提取最新的一条新闻:标题、摘要、来源链接 在页面上显示最新新闻内容,无需手动刷新 页面应自动更新:旧内容被最新内容替换(或可选择以列表形式累积展示)


这里,你需要去 Serper[1] 注册一下拿到 API,这是一个为开发者提供 Google 搜索相关 API 接口的平台,注册完后就可以随时调用它的搜索能力了:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


大概几分钟过后,一个比较有科技感又富有动态交互效果的 AI Funding News 网站就顺利建好。


进入这个网站,一开始会有「最新 AI News 雷达搜索」效果的展示。


等它搜索完毕后,来自全网多个信息来源的 AI 初创新闻都被完整地列好,并且每 60 秒可以更新一次:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


像是我点击 Reuters(路透社)的一条「美国人工智能初创公司融资激增,数据显示更多风投基金融资受阻」新闻,它会自动跳转到该条新闻所在的网站,整个过程很流畅:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


4)高度一致性的「彩虹小熊」PPT


亮点:图片生成、高一致性 PPT


与上回我们介绍 MiniMax Agent 的流程一样。


这回我在试用时,发现它做 PPT 的效果还不错,所以我就准备让它用「彩虹小熊」风格,来给自己的工作流程创建一个完整的 PPT。


提示词如下:


基于我上传的MiniMax Agent工作流程Word文档,创建一个完整的PPT演示文稿,将文档内容进行可视化呈现。 PPT里所有的图片全部用自己生成的可爱彩虹小熊,生成一个萌宠环游世界的主题海报,绘制一系列萌宠在世界各地标志性建筑或风景前的可爱插画。 每一张PPT用一张小熊的插画,如萌宠在埃及金字塔旁玩耍、于中国长城上漫步等,通过色彩鲜艳、形象生动的画面来直观呈现主题;或者设计以萌宠环游世界为主题的海报、贴纸、动画等,在画面中融入地图、飞机、行李箱等旅行元素与萌宠形象相结合,突出主题的趣味性和活力感,吸引观众的目光。


看一看 MiniMax Agent 的效果吧,是不是非常可爱,每一张 PPT 的一致性都很高。


这一整套「MiniMax Agent 智能工作流程」涵盖了它工作时的六个阶段,甚至自动总结出了它的实际案例、功能和技术栈:


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


整个使用过程非常流畅。虽然复杂任务需要注册一些第三方平台(如Supabase、Stripe),但 MiniMax Agent 会明确告诉你需要哪一步,提供注册地址,让整个流程很清晰。


全技术栈的 Agent 有什么吸引力?


1)技术门槛正在消失,创意与生产力直接挂钩


我还依稀记得几年前,如果想要做个「凑合能用」的网站,你得找前端工程师负责用户看到的页面,找后端工程师处理数据逻辑,还要有人搞定数据库存储。一个简单的网站,可能需要 3-4 个技术人员配合,花费几个月时间。


当 Agent 能够以全技术栈进行 Vibe 开发时,现在只要会说话,说「自然语言」就行,靠感觉、靠想法来开发。

像是一句「做个播客社区」,几分钟后就有了包含用户系统、支付功能、内容管理的完整平台。这不是演示,是真能用的产品。


这种变化最直观的体现就是:想法验证的时间被大幅压缩了。一个有想法的普通人,他的能力被 AI 成倍放大了。


「1 个人的公司」正在快速成真,技术壁垒在消失,但是这同样意味着使用相同 AI 工具可能导致创业者们的产品同质化,如何差异化成为关键。


创意和市场洞察变得比以往任何时候都更重要。


2)端到端能力的需求,比以往任何时候都重要


当市面上出现如此多的 Agent 产品后,用户的品味早已经变得挑剔。AI Agent 不应再满足于「做完就行」,而是追求「做好做精」。


以前的 AI 工具更像个实习生,交代什么做什么。现在更应像个有经验的员工,不仅完成任务,还会主动优化、反思改进。


可以说,「端到端能力」是 Agent 的新 Benchmark(基准测试)。


比如播客平台做完后,它还会自动进行端到端测试,确保每个功能都能正常使用,甚至「是否达到生产级标准」。


什么样的 AI Agent 最会被喜爱?我们总结了下:


【1】Agent 能够在过程中主动进行优化,承认自己做的「不足」,在生成的过程中自动测试各种功能,尽量别麻烦用户;


【2】Agent 需要保持风格统一,换个主题能保持整体设计协调。就像一个有经验的设计师,知道怎么在变化中保持统一感。


🚥


前几天,OpenAI 终于正式展示了他们的 Agent 产品,把 ChatGPT、DeepResearch、Operator 这些技术都封装整合进了一起。


这正好说明,AI Agent 的「故事主线」才刚起了个头。


接下来估计还会有更多公司加入这场「AI Agent」的竞赛,展现他们谁更懂技术、更有品味、更了解用户需求。


不过,大家的终极目标都非常美好:


让有想法的人终于不用再等别人来帮忙实现了。


那么,你想解决什么有创意的问题?又想为谁创造温暖的价值呢?


讲真,这次真的碾压了OpenAI!|MiniMax Agent 发布30天后,迎来首个重大更新


参考资料


[1]Serper: https://serper.dev/


文章来自于“十字路口Crossing”,作者“镜山”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0