过去两周,AI圈正在发生诡异的局部通胀。
各家大模型在玩命卷,开发者们在后台看着账单倒吸凉气。
在这个全员Agent时代,Token消耗量高得令人窒息,产品还没公测,账单就先把你送走。
虽然AI巨头都在烧token,但免费开放API的几乎没有。
就在这个背景下,6月1日,全球模型榜单前十的顶级AI Lab——Agnes AI宣布:面向全球开发者与创作者,无限期免费开放旗下核心全模态模型API。
这其中包括:
-文本模型: Agnes-2.0-Flash
-图片模型: Agnes-Image-2.1-Flash
-视频模型: Agnes-Video-2.0
注意,这不是限时体验,是真真正正的免费。
这个消息宣布后,用户热情瞬间被点燃。
也有人质疑:这么大方,不是在拿残血版模型骗注册的吧?
结果短短半个月过去,Agnes AI交出了第二周的最新统计数据,直接把所有质疑声彻底砸碎!
3.12T的周总调用量,
是谁在疯狂薅羊毛?
这一次,Agnes全模态模型的调用数据再次刷新了历史纪录:全模态总Token周调用量疯狂飙升至3.12T(万亿)!

其中,文本模型(Agnes-2.0-Flash)独自贡献了约1.9T的调用量。
图片与视频模型(Agnes-Image-2.1-Flash + Agnes-Video-2.0),合计贡献了高达1.2T的调用量。
3.12T的周调用量,完全超越了Claude Opus 4.7在OPenRouter上的周调用量,可比肩前5!

要知道,在行业里,视觉API一向是奢侈品。当Agnes把视觉模型免费,这部分调用量直接井喷。
它直接反映出:全模态的免费政策,瞬间解放了视觉内容创作和批量创意测试的生产力。
这群被高昂成本憋坏了的创作者和开发者,正在用几万亿的Token狂欢证明:不是大家没有全模态创新的点子,大家以前只是单纯的用不起。
降价不降智:省钱的底层,是「真能打」
在AI圈,免费和便宜往往容易让人联想到低质。
但Agnes AI之所以能让开源社区集体倒戈,是因为它在省钱的同时,把底座能力顶到了全球前列。
我们可以来看一张硬核的评测与定价对比表:

作为模型排行榜全球前十的AI Lab,Agnes的核心逻辑非常简单粗暴:省钱,绝对不省能力。
哪怕在它免费之前,它的价格也只有同类主流商业模型的一半左右。而现在,当全模态矩阵把价格抹到零时,直接就形成了降维打击!
本周升级:
1M上下文灰度上线+ 4K超高清亮相
如果说前两周的免费策略是发福利,那么本周三,Agnes AI即将完成的一波产品升级,则是直接丢下重磅炸弹。
不用改任何现有代码,不用多花一分钱,Agnes直接在原有的免费框架下,给开发者全面解锁了两个高阶模型能力。
升级点 A:Agnes-2.0-Flash 1M 原生超长上下文将落地
本周内,文本模型将原生支持 1M Token的超长上下文窗口,已灰度上线50%,近期更新完毕。
在API层面,不需要任何复杂配置变更,只要保证API请求中messages数组的总内容量在1M Token范围内,就能直接白嫖这个百万级的超长记忆体。
1M上下文的核心价值,绝对不仅仅是能往里塞更多字,它的本质是抹平由于文档分段、切片以及重复传递上下文带来的信息断层和开发硬成本。
在1M的超大口袋里,下面这些原本属于奢侈级的场景,直接变成了免费的标配。
1.真正的代码库与项目级理解
以前你让AI帮你改Bug,你只能一段一段贴代码,现在,你可以把一整个中大型软件项目的源代码、配置文件、依赖项、项目文档一次性打包塞给Agnes-2.0-Flash。
它能帮你一眼看清整个项目的架构关系,做全局的代码审查,甚至帮你直接定位跨文件调用的隐藏漏洞。
2.长文档与复杂材料的「免切片」通读
无论是整本长篇小说、大型设备的几十万字技术手册、复杂的法律合同,还是多篇互相关联的科研论文,你都不再需要费尽心思去搭复杂的RAG切片算法。
直接丢进去,让它做整本书的细节问答、跨章节信息关联分析。
3.超长周期的Agent长对话记忆
这就解决了企业客服、虚拟助手在聊到第100轮时突然「失忆」或者角色设定漂移的痛点。
升级点 B:Agnes-Image-2.1-Flash 4K超高清文生图全量解锁
以前在画图API里,1K分辨率是常态,想上高清就得加钱,或者在后台自己用其他超分模型再跑一遍。
这次升级后,Agnes-Image-2.1-Flash直接解锁了4K(最高可达 4096×4096) 的超高清图像输出能力!
并且,它一口气原生支持了市面上几乎所有主流的宽高比:1:1、3:4、4:3、16:9、9:16、2:3、3:2、21:9。
大到电商主图、自媒体封面、产品海报,小到局部精修,都能轻松覆盖。



这直接解锁了更多玩法。
比如,一句话让模糊图片变4K高清大图,还能图生图生成全新高清场景:
纽约曼哈顿城市天际线的超宽幅高空全景,从高层观景台俯拍,帝国大厦位于画面中央偏右,远处可见世贸中心一号楼,下曼哈顿天际线延伸至地平线,前景是密集的摩天大楼和历史高层建筑,建筑窗户与屋顶细节清晰,远景带有浅蓝色大气雾霾,空间层次丰富,晴朗淡蓝天空,少量细长卷云和飞机尾迹,明亮自然日光,冷蓝色电影调色,真实建筑摄影,广角镜头,深景深,HDR,高锐度,照片级写实,专业城市风光摄影,4K超高清画质,极致细节
一座未来感城市的夜景,高楼霓虹灯,雨后街道反光,电影级光影,超清细节,4K,高质量


原生4K,赋予电商主图电影级广告的庄重与诗意,让购物充满质感与秩序的仪式感。

Agnes-Image-2.1-Flash这次的4K升级,可实现照片级写实,生成的人物肖像细节清晰,清晰对焦:

Agnes-Image升级后,带来的不止是清晰度提升,细节质感直接提升。

最绝的是,它的接入方式顺滑到了极致。
你原先调用1K图片的请求长这样:

现在你想体验4K的高清细节和细腻纹理?只需要把 "size": "1K" 改成 "size": "4K"。
代码不用动,响应依然支持url链接和b64_json,最核心的是,生成4K和生成1K的扣费完全一样——依然是零。
这对有批量生图、电商换景、高质量素材测试需求的设计师和创业团队来说,简直是生产力层面的解放。
本周五,语音全模态链路即将补齐!
另外,Agnes 还提前放出了一个重磅消息:预计本周五(6月19日)左右,TTS(语音合成)能力将正式开启灰度测试。
首版提供 20 种高品质音色,覆盖不同性别、年龄段和风格,并支持中英文双语生成。
对开发者和创作者来说,这意味着更完整的语音创作能力正变得触手可及。

而这块拼图的落定,也标志着 Agnes 全模态自动化闭环的正式合拢——从文本到图片,从视频到语音,整条链路终于全线贯通。
你可以用文本大模型写剧本,用图片模型拆解分镜,用视频模型直接生成带音效的画面,最后再用 TTS 配上恰到好处的人声旁白。一整条 AI 内容生产线,不再需要东拼西凑,全流程都能在 Agnes 的免费全模态矩阵里一站完成。
打开 GitHub,
开源社区已经把 Agnes 「玩坏了」
大模型到底好不好用,还得看开发者。
在Agnes宣布免费开放API后,开源社区的反应速度快得惊人。
如今去GitHub上搜一圈,已经有大批热心网友和硬核开发者,自发地围绕Agnes AI制作了大量的公开Skill、工具和适配项目。

https://github.com/lj1270998580-crypto/Agnes-help-skill
GitHub生态,热心网友提供的教程和多模态skill:

https://github.com/Yacey/agnes-ai-generation-skill
Agnes的使用正在以肉眼可见的速度,深度渗透进真实的开发者生态里。
现在,你可以在各种主流的AI工具链里,无缝把底层大模型替换成Agnes。
在AI自动编程上,已经有开发者为主流的自动化编程代理平台(如Codex、Claude Code、OpenClaw、OpenCode)编写了Agnes的适配器。
配合即将上线的1M长上下文,直接让AI在你的本地项目里vibe coding,连续通宵干活。
包括Hermes、WorkBuddy在内的自动化工作流平台,以及大量先进的MCP(Model Context Protocol)服务,已经被社区开发者自发适配并构建出Agnes多模态 Skil。
并且,在大热的ComfyUI节点社区里,已经出现了专属的Agnes 4K生图与Agnes-Video-2.0视频工作流节点。
这些在社区里疯狂滋生的开源项目和教程,正在帮Agnes建立起一种稳固的信任资产:它是真免费,而且是真的可以用来干脏活累活的生产力工具。
让世界级 AI,属于每一个人
Agnes AI的品牌愿景是:「让世界级AI属于每一个人。」
这不止是一句口号。在全球模型榜单前十的AI Lab中,Agnes是极少数在Claw-Eval和Artificial Analysis双榜同时上榜的全模态AI Lab。
当他们选择把全球前十的Agent-native全模态模型API无限期免费开放时,这场关于技术平权的变革就已经悄然开始了。
它让那些兜里没有几百万美金预算的独立开发者,也有机会去跟行业巨头站在同一起跑线上拼创意。
它让每一个普通的长视频创作者、电商创业者,都能无负担地享受到全模态技术带来的红利。
这一波全模态的羊毛,你打算怎么薅?
文章来自于微信公众号 “新智元”,作者 “新智元”
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales