一句指令自动玩手机,网上冲浪神器Mobile-Agent来了
一句指令自动玩手机,网上冲浪神器Mobile-Agent来了随着多模态大语言模型(Multimodal Large Language Model,MLLM)的快速发展,以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中,这使得借助多模态 agent 实现手机操作助手成为了可能。
随着多模态大语言模型(Multimodal Large Language Model,MLLM)的快速发展,以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中,这使得借助多模态 agent 实现手机操作助手成为了可能。
但实际上,AI Agent即将进入我们的日常生活,将会在我们工作、学习中扮演着越来越重要的角色。
一直以来,让 AI 成为手机操作助手都是一项颇具挑战性的任务。在该场景下,AI 需要根据用户的要求自动操作手机,逐步完成任务。
新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。
每隔一段时间,关于「新社交大战」的话题就会在中文互联网的语境中再度涌现,不是关于「字节放不下社交」,就是创业者们所显露出的「成为下一个抖音、微信」的野心。 新技术、新需求与新产品形态总会书写新一轮的社交竞争格局,这一次尝试改变的是来自AI。
GPT-4再次重磅更新,推出了整合了画图、插件、代码等所有工具的All Tools功能。
直至2023年,大模型提出“重做一遍”的口号,将创业者拉回2015年遍地黄金时代,这是所有人的机会,也是时代再造英雄的时刻。
距离上次推出的 v0.4.0 大版本的三周后,我们又再次迎来了重大的更新 — v0.5.0!在这个最新版本中,我们隆重推出了 AI Agent 能力。
2023年11月,OpenAI在首届开发者大会上推出了GPTs和Assitant API,不仅改写了AI Agent的构建范式,也把AI智能体的应用推向一个新高潮。
Sam Altman认为AGI很快就会降临,但若是没有感官兼备的AI何以称为智能?最近,UCLA等机构研究人员提出多模态具身智能大模型MultiPLY,AI可以知冷知热、辨音识物。