
一句指令自动玩手机,网上冲浪神器Mobile-Agent来了
一句指令自动玩手机,网上冲浪神器Mobile-Agent来了随着多模态大语言模型(Multimodal Large Language Model,MLLM)的快速发展,以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中,这使得借助多模态 agent 实现手机操作助手成为了可能。
随着多模态大语言模型(Multimodal Large Language Model,MLLM)的快速发展,以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中,这使得借助多模态 agent 实现手机操作助手成为了可能。
但实际上,AI Agent即将进入我们的日常生活,将会在我们工作、学习中扮演着越来越重要的角色。
一直以来,让 AI 成为手机操作助手都是一项颇具挑战性的任务。在该场景下,AI 需要根据用户的要求自动操作手机,逐步完成任务。
Bard又双叒升级了!谷歌正式解禁Bard生图能力,文生图Imagen 2模型加持,效果对标DALL·E。
新的Agent打破了APP的界限,能够跨应用完成任务,成为了真·超级手机助手。
每隔一段时间,关于「新社交大战」的话题就会在中文互联网的语境中再度涌现,不是关于「字节放不下社交」,就是创业者们所显露出的「成为下一个抖音、微信」的野心。 新技术、新需求与新产品形态总会书写新一轮的社交竞争格局,这一次尝试改变的是来自AI。
2024 年 1 月 29 日,波形智能(AIWaves)于杭州举办首个技术开放日(AIWaves DevDay),正式发布新一代自主研发的中文内容创作垂域 SOTA 大模型「Weaver」,及由其驱动的面向用户写作类 Agent 产品「蛙蛙写作 1.0」。
1 月 24 日,Nature Machine Intelligence 杂志在《Anniversary AI reflections》(周年人工智能反思)专题中,再次联系并采访了近期在期刊发表评论和观点文章的作者,请他们从各自所在领域中举例说明人工智能如何改变科学过程。
欢迎再次加入我们的“RAG 系统高级掌握”系列!我们将深入了解构建企业级 RAG (Retrieval-Augmented Generation) 系统的复杂世界。
GPT-4再次重磅更新,推出了整合了画图、插件、代码等所有工具的All Tools功能。