智能体基本上已经成为AI行业的共识,如果说有分歧,大概率也是对落地的时间有分歧。
当下行业主要关注的还是智能体本身如何构建,对于智能体之间如何协作、智能体网络的特征,研究的不是很多。
在这篇文章中,我们尝试从互联网演进的本质:释放新技术的能力,来探讨智能体互联网(Agentic Web)与现有互联网的不同。本文讨论重心在互联网的连接与协作,其他方面不展开。
智能体互联网是否会出现,是否叫这个名字,我们不确定也不纠结。我们非常确定的是智能体会对互联网带来深刻的改变。
以现有全球互联网市场规模来看,智能体互联网有什么不同之处,至少是一个千亿美金问题。
我们认为,推动互联网演进的最本质问题,或者最底层的推动力,是如何释放新技术的能力。
分析一个问题,为什么PC互联网时代产品以web为主,而移动互联网时代却是以APP为主?
PC互联网时期,新技术以网络通信技术(TCP/IP、DNS、HTTP)、Web技术(HTML、CSS、JavaScript)、数据库技术、信息搜索等技术为主。以浏览器和Web技术为媒介的产品形态,释放了开放互联网的访问能力,让信息可以通过统一入口被广泛获取。
再加上当时的技术条件(有限的带宽和硬件性能),以及web技术跨平台特性,决定了Web是最适合PC互联网的产品形态。
而到了移动互联时期,新出现的技术包括移动设备与硬件(加速计、陀螺仪、GPS、触摸屏、摄像头、芯片)、移动网络(3G、4G、5G)、移动操作系统(iOS、Android)等。
APP相对于web技术,能够通过操作系统的API深度整合硬件能力,针对设备性能优化运行效率,能够持续在线并且实时互动。
正是这些因素,新的技术能力才通过APP释放出来,APP的体验也远超web,让APP也成为了移动互联网时代的主流产品形态。
在当下以及未来10年,新技术无疑是以生成式人工智能、大语言模型、智能体为代表的AI技术。如何释放AI的能力,决定了未来互联网的演进方向。
当前的互联网基础设施已经相当的完善,但是面对AI的特性,要充分释放AI的能力,还面临一些挑战。
AI只有获得完整的上下文信息,才能做出正确的决策。只有能够调用所有的工具能力,才能高效的完成复杂任务。
但是当前的互联网本质上由一个个的信息孤岛组成,孤岛之间信息流动困难。
在之前,人类其实扮演了信息孤岛的缝合怪的角色,通过浏览器、APP、搜索引擎、社交网络等,将这些信息孤岛连接起来。未来,这将由AI更加高效的完成。
当前已经有技术方案在尝试解决这些问题,典型的比如AI手机、Computer Use技术,让AI利用图形界面、浏览器或者APP终端接口,来打通AI与互联网的连接。但我们认为,这些都不是最高效的方案。
点评一下当下AI接入互联网的方案。
很多模型厂商都推出了类似的方案。
但我一向不看好这个技术。这个技术出现的原因是,原有的互联网产品是为人类使用而设计,在这些产品面向AI重构之前,让AI学习、模仿人类,确实是AI接入互联网的最快途径。但不是最高效的路径。短期和中期可能有价值,长期价值不大。
比如apple intelligence,国内很多手机厂商也在大力推广。
这类技术的特点是,在终端上,通过APP客户端开放的接口,打通互联网的数据与能力。让AI能够获得多个APP的数据,调用多个APP的能力。
这个技术比Computer Use技术更进一步,AI天生擅长处理底层数据,而非图形界面。但是在这个方案中,终端上的APP定位非常的尴尬,和AI手机是处于既竞争又合作的状态,既想获得AI手机带来的流量,又不想开放太多数据以被AI手机替代。
长远看,很多APP是不需要在终端有用户界面的,个人助理会为每个人提供个性化的UI。
这是当下最符合我们设想的方案。
我们认为,AI不同于人类,它更擅长处理底层数据而非图形界面。AI应该用它最擅长的方式(API或通信协议),与互联网交互。
我们也很早就在做类似的项目和研究:
我们与MCP最大的区别在于世界观的差异:
传统的网络节点,往往通过硬编码或人工的方式来进行连接。有了AI之后,网络的连接、协作方式也许可以更加的高效。
比如,两个AI节点可以利用自然语言的生成与理解能力,先使用自然语言沟通双方的能力与接口,然后使用标准协议或共识协议进行通信与协作。
这将有助于构建一个更加高效、更低成本的协作网络。
总结一下,互联网要想充分的释放AI的能力,还需要解决以下三个问题:
关于智能体互联网的定义,是个比较大的命题,我们给不了学术上的严谨定义。但是我们可以从通俗的角度阐述下我们对它的理解。
PC互联网是人用PC上网;移动互联网是人使用移动终端上网;智能体互联网,则是智能体代替人上网,代替人与数字世界交互。
这个入口未来大概率是一个特殊的智能体:超级个人助理。它代替人类上网,并且在客户端通过个性化的UI与人类交互。在后端通过API或协议,与其他的智能体进行交互。
除了个人助理,我们认为互联网还有很多不直接与最终用户交互的智能体,比如酒店、餐厅、银行、学校等智能体。他们通过与个人助理的交互,间接的为人提供服务。
无论是个人助理,还是背后提供服务的智能体,无论他们属于哪个公司,哪个平台,他们都可以互联互通。
如果智能体能够代表一个人或一个实体作为互联网中的一个节点互相连接协作,那中心化平台(比如微信、淘宝)的作用会降低。未来的互联网会更加的扁平化、去中心化。
智能体之间可以自组织、自协商,构建一个高效协作网络。
归根到底,我们认为是技术的发展推动了互联网的演进,如何释放新技术的能力,决定了互联网的演进方向。
智能体互联网会不会出现,我们现在还不确定,但是我们可以确定的是,未来互联网肯定会因为AI技术的发展而深刻的改变。
文章来自于“长山的随笔”,作者“常高伟”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/