谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!
8467点击    2025-12-22 20:30

过去两年,我们几乎默认了一件事:


人和 AI 的交互就只能靠文本框和语音。


不管是 GPT、DeepSeek、Claude,还是各种音视频 Agent,核心入口几乎清一色是一个聊天框。


但只要你真正做过 AI 应用,就会很快发现一个现实问题:


  • 真实任务往往不是一句话能完成的
  • 用户输入经常不完整、不规范、缺关键信息
  • 单靠「再问一句」对话,体验很容易崩。


比如这些场景:


  • 订机票要选日期、舱位、乘客
  • 填订单要地址、手机号、发票信息
  • 企业客服要订单号、时间范围、商品规格


你让用户靠「多轮对话」一点点补齐这些结构化信息,显然即使能顺利执行下来,步骤及体验也是相当差的。


Google 开发团队显然也意识到了这一点。就在这两天,他们开源了 A2UI


谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!


它并不是一个“UI 框架”,而是一种基于代理的接口协议,负责 AI Agent 和用户界面之间的中间层协议与实现。


而核心目标就是让 Agent 能够使用 GUI(图形用户界面)与人类交流,就像它使用自然语言一样自然。


谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!


谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!


主要原理


谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!


A2UI,让 AI 用 JSON 描述 UI,由客户端原生渲染交互界面。


是的,它的核心主张就是这个,声明式 JSON


AI 不用写什么前端代码,只输出「我需要什么 UI」即可。


以下是一个简化的 JSON 消息示例(定义用户界面):


{
 "surfaceUpdate": {
  "surfaceId": "main",
  "components": [
   {
    "id": "header",
    "component": {
     "Text": {
      "text": {"literalString": "Book Your Table"},
      "usageHint": "h1"
     }
    }
   },
   {
    "id": "date-picker",
    "component": {
     "DateTimeInput": {
      "label": {"literalString": "Select Date"},
      "value": {"path": "/reservation/date"},
      "enableDate": true
     }
    }
   },
   {
    "id": "submit-btn",
    "component": {
     "Button": {
      "child": "submit-text",
      "action": {"name": "confirm_booking"}
     }
    }
   },
   {
    "id": "submit-text",
    "component": {
     "Text": {"text": {"literalString": "Confirm Reservation"}}
    }
   }
  ]
 }
}


它定义了界面的 UI 组件:文本标题、日期选择器和按钮。


AI 只关心意图和结构,而不是 UI 细节。


还有一个关键核心:客户端原生渲染(安全关键)


UI 不是 AI 直接生成 HTML/JS,而是:客户端 + 用受控组件库 + 再根据 JSON 渲染。


这样做的好处是:


  • 安全(避免注入)
  • 风格统一
  • 移动端/Web/桌面端一致
  • 可控权限和交互逻辑


这也是 A2UI 能适应企业级场景的关键。


A2UI 能力一览


1、Widget Gallery:现成可用的交互组件库


A2UI 自带一个 Widget Gallery,包含大量常用 UI 小部件:


  • 表单输入
  • 日期选择
  • 下拉选项
  • 状态展示


所有组件:


  • 都有现成示例
  • 支持直接使用或二次定制
  • 界面与源码可实时切换查看


这点对开发者非常友好。


2、Material Icons:开箱即用的设计语言


内置 100 个常用 Material Icons,保证:


  • 风格统一
  • 不用额外处理设计资源


3、基于 CopilotKit,天然适合 AI 系统


A2UI 构建在 CopilotKit 之上,因此天然支持:


  • 聊天式交互
  • AI 生成内容
  • Agent 驱动 UI 更新


这让它非常适合用在:


“对话 + 操作 + 界面”混合型 AI 系统


快速入手


环境要求:Node.js(版本>=18)、Gemini API


克隆代码


git clone https://github.com/google/a2ui.git

cd a2ui


设置API密钥


export GEMINI_API_KEY="your_gemini_api_key_here"


切换目录至 Lit Client


cd samples/client/lit


安装运行


npm install

npm run demo:all


最后打开 http://localhost:5173 就能在浏览器中看到网页应用。


在网页应用中,尝试以下提示:


  • “预订一张两人桌” ——观看客服人员生成预订表格
  • “查找附近的意大利餐厅” - 查看动态搜索结果
  • “你们的工作时间是什么时候?” - 体验针对不同意图的不同用户界面布局。


其幕后执行流程:


谷歌重磅开源 A2UI,这将会是2026年Agentic UI的王炸级标准!


  • 首先通过网页用户界面发送消息。
  • A2A代理收到对话后,会将对话内容发送给Gemini。
  • Gemini 生成描述用户界面的 A2UI JSON 消息。
  • A2A代理会将这些消息流式传输回Web应用程序。
  • A2UI渲染器将它们转换为原生Web组件
  • 最后在浏览器中看到渲染后的用户界面。


写在最后


A2UI 传递出的一个强烈信号:未来的 AI 系统,交互不再只有「说话」,而是「会生成界面」。


这意味着:


• AI 不只是回答问题

• 而是能主动设计“如何与人协作”


从这个角度看,A2UI 解决的,并不是 UI 好不好看,而是一个更底层的问题:


复杂任务,应该如何让 AI 和人高效协作?


当 Agent 能根据任务需要,动态生成最合适的交互界面,很多原本“只能 Demo”的 AI 应用,才真正有机会进入生产环境。


如果你正在做 AI Agent、智能客服或企业 AI 系统,这个项目,非常值得你花时间研究一下。


文章来自于微信公众号 “开源星探”,作者 “开源星探”

关键词: AI新闻 , A2UI , Agentic , 谷歌AI , AI标准
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md