AI资讯新闻榜单内容搜索-GUI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GUI
AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体

AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体

AI 开始「自由玩电脑」了!吉大提出「屏幕探索者」智能体

迈向通用人工智能(AGI)的核心目标之一就是打造能在开放世界中自主探索并持续交互的智能体。随着大语言模型(LLMs)和视觉语言模型(VLMs)的飞速发展,智能体已展现出令人瞩目的跨领域任务泛化能力。

来自主题: AI技术研报
6118 点击    2025-06-28 11:18
模型即 Agent 的含金量:Kimi深度研究功能详评

模型即 Agent 的含金量:Kimi深度研究功能详评

模型即 Agent 的含金量:Kimi深度研究功能详评

大家好,我是歸藏(guizang),今天给大家带来 Kimi 的深度研究能力体验和介绍。

来自主题: AI产品测评
7540 点击    2025-06-24 14:44
AI操作有了“紧急刹车”!通义&自动化所AI决策诊断模型,GUI智能体纠错正确率SOTA

AI操作有了“紧急刹车”!通义&自动化所AI决策诊断模型,GUI智能体纠错正确率SOTA

AI操作有了“紧急刹车”!通义&自动化所AI决策诊断模型,GUI智能体纠错正确率SOTA

GUI智能体总是出错, 甚至是不可逆的错误。 即使是像GPT-4o这样的顶级多模态大模型,也会因为缺乏常识而在执行GUI任务时犯错。在它即将执行错误决策时,需要有人提醒它出错了。

来自主题: AI资讯
8192 点击    2025-06-17 16:59
AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

AI真有希望考清北了!豆包1.6多模态推理发威,闯关数理化带图大题

豆包大模型1.6惊艳亮相,成为国内首款多模态SOTA模型,256k对话窗口,深度思考最长上下文。它不仅能看会想,还能动手操作GUI,国内最有潜力考清北。

来自主题: AI技术研报
6271 点击    2025-06-12 17:04
微软开源浏览器Agent,可实时跟踪、控制智能体,超4000颗星

微软开源浏览器Agent,可实时跟踪、控制智能体,超4000颗星

微软开源浏览器Agent,可实时跟踪、控制智能体,超4000颗星

微软在官网开源了一个专用于浏览器网络任务的Agent——Magentic-UI。Magentic-UI是基于微软曾经开源的 Magentic-One基础之上开发而成,并支持人机协同的控制方法来提升智能体的执行效率和准确率。

来自主题: AI资讯
7972 点击    2025-05-27 10:46
a16z聊AI编程:别担心被取代,新玩家、新范式带来的是「很多」机会

a16z聊AI编程:别担心被取代,新玩家、新范式带来的是「很多」机会

a16z聊AI编程:别担心被取代,新玩家、新范式带来的是「很多」机会

AI Coding 目前是第二大 AI 市场,仅次于 Chatbot,甚至有可能成为最大的单一市场。这是 a16z 的播客中,三位投资合伙人 Matt Bornstein、Yoko Li 和 Guido Appenzeller 的观点。

来自主题: AI资讯
6735 点击    2025-05-23 13:59
全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

全球爆火的Manus背后,一款关键的AI产品,让AI Agent像人一样操作浏览器

2025年初,随着Manus的火爆,其背后的“黑科技”Browser Use也同样引起了人们的关注。Browser Use专为解决上述痛点而设计,强调将AI agents与网页连接,实现对浏览器的自动化操作。它支持AI agents自动轮换,单次登录即可实现持久会话,据TechCrunch报道,Browser Use是Manus用来执行各种任务的组件之一,例如点击网站菜单和填写表格。

来自主题: AI资讯
7168 点击    2025-05-19 10:18