刚刚,又一个中国血统智能体,让歪果仁大呼“疯狂”。
现在,制作一条这样的ins做饭视频,你猜需要几个步骤?
答案是,告诉Agent“帮我制作一条如何制作金桔开心果脆皮鳕鱼的视频”,然后就可以坐等结果了。
全程无需自己动手打开任何一个视频编辑软件,零帧起号不是梦(doge)。
这个智能体名叫Genspark超级智能体,刚一推出,就在智能体基准测试GAIA上击败了Manus和OpenAI Deep Research。
关键是,它不要邀请码,免!费!就能玩!
于是乎,歪果友人的反应be like:
新的最佳Agent来了!再次来自中国。
比赛完全没有放缓的迹象。
细究起来,Genspark倒并非新面孔,其背后公司,是前百度高管、小度之父景鲲的创业公司MainFunc。
去年(2024年)6月,MainFunc官宣成立即推出首款产品Genspark。
不过当时,他们剑指的还是AI搜索,并凭此在种子轮融了6000万美元(约合4.35亿人民币),投后估值突破18亿人民币。
如此看来,此番超级智能体新亮相,还意味着景鲲团队的彻底掉头转向。
还是先来看看Genspark超级智能体的更多能力细节。
如名称所见,Genspark超级智能体是一个通用AI智能体,能够自主思考、规划并调用工具来帮助人们完成一些日常任务。
官方表示,和以往的智能体相比,这款工具主打实时交互、幻觉和错误率更少,以及允许用户中途改进调整。
在更多演示demo中,Genspark能一口气将5小时左右的youtube视频转换为10页PPT。
最终结果be like:
又或者让它自己找一些可以绘制成3D模型的数学公式,并创建一个可交互网站。
悄悄吐槽,要是当年我们也有这种工具,学数学那还不是手拿把掐。(bushi
当然鉴于篇幅原因,更多例子在此不再展开。官网上,这家公司这次一次性放出了11个demo,涵盖日常电话订餐、专业海报设计、日常shopping等等。
归纳起来,目前他们主要有以下这些“各有所长”的智能体:
不过嘛,虽然演示demo确实让人眼前一亮,但还是要经过实践检验才行。
如开头所言,Genspark超级智能体目前免费,所以我们立马试玩了一下。
写一个类似于Flappy Bird的闯关游戏
首先,Genspark正确理解了任务要求,并反馈自己将创建一个HTML游戏页面。
然后它开始唰唰唰写代码,仅花了2分钟时间就完成了开发。
在这之后,Genspark还为我们详细介绍了关卡设置和游戏指南,可谓非常贴心了。
最终我们也简单试玩了一下,这个小游戏确实能成功跑起来。
除了我们的实测,许多外国网友们也火速体验了一把。
比如1~2分钟生成个人介绍网页:
还有懒人版,直接复现“扔一个油管链接,分分钟制作PPT”的玩法:
那么,Genspark超级智能体到底是如何做到的呢?
按照官方介绍,这主要得益于3大部分的相互配合:
当中值得一提的是,Genspark支持自动整合最适合处理某项任务的AI模型,其中还有DeepSeek V3和R1。
Genspark背后公司MainFunc,曝光于2024年6月。由前百度集团副总裁、小度科技CEO景鲲携手前小度CTO朱凯华联合创立,总部位于加州帕洛阿尔托和新加坡。
景鲲在2014年加入百度,曾任大搜索总产品架构师。技术职级据说已经到了百度天花板T11。
2018年百度成立智能生活事业群组(SLG)后,景鲲进入管理序列,被任命为SLG总经理,
全面负责小度助手与小度系列硬件的产品、研发、运营、销售和商务等工作。2020年9月小度科技成立后,景鲲出任小度CEO,直至2024年10月宣布辞任。
朱凯华在百度的职级也是T11,是语音交互方向技术委员会主席。在加入百度前,曾任Google主任架构师,是Google Panda等一系列核心算法的创造者。
Genspark也随公司成立消息即时推出。不过,在一开始的定位中,Genspark被描述为AI Agent搜索产品,旨在“用AI智能体引擎,重新发明搜索”。
该产品主要面向海外市场。
进入到2025年,耐人寻味的是,Genspark的宣发重点,开始偏离搜索,更多地向智能体集中,
包括集成DeepSeek R1的智能体深入研究功能、能调用多模生图生视频的Mixture-of-Agent……
3月初,该公司宣布完成A轮融资,新筹1亿美元(约合7.27亿人民币),估值来到5.3亿美元(约合38.52亿人民币)。
这时候还提到了“Reinvent Search(重新发明搜索)”的slogan。
但到了3月31日,画风就变成了:
我们将在3天后告别AI搜索。
这并非愚人节玩笑。Genspark官推还透露了一个信息:他们需要更多的服务器空间。
于是立即有网友猜测:这是要搞大事的节奏啊。
10小时之后,谜底揭开——景鲲亲自上镜,官宣Genspark超级智能体,“适用于每个人和所有日常任务”。
如此转向,是初创公司灵活性的体现,也多多少少映射了一些产业趋势。
实际上,作为大模型应用的第一站试验田,搜索最先被AI重塑,AI搜索的竞争也最先白热化。
一方面,如Perplexity的头部公司估值屡创新高。另一方面,资源和用户也正在向头部企业集中。
量子位智库的数据监控就显示,在国内,AI搜索的流量主要集中在百度AI搜、秘塔AI搜索和知乎直答上。
随着智能体的再一次火热,对于创业者们而言,或许又到了一次关键选择的时候。
Genspark地址:
https://www.genspark.ai/
参考链接:
[1]https://x.com/genspark_ai/status/1907460319976534169
[2]https://www.genspark.ai/agents
[3]https://x.com/rowancheung/status/1907506848808448337
[4]https://mainfunc.ai/blog/genspark_super_agent
文章来自于微信公众号 “量子位”,作者 :鱼羊 一水
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】metaso-free-api是一个逆向秘塔AI搜索的开源项目,它支持超强检索超长输出,支持高速流式输出、超强的联网搜索以及零配置部署。
项目地址:https://github.com/LLM-Red-Team/metaso-free-api