
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述
引领人机交互革命?微软研究团队发布80页的大模型GUI智能体综述图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。
图形用户界面(Graphical User Interface, GUI)作为数字时代最具代表性的创新之一,大幅简化了人机交互的复杂度。
1 月 18 日,北京,聊聊 2025 如何加入技术开发? AI 科技评论消息称,前微软亚洲研究院视觉计算组首席研究员胡瀚,不久前加入腾讯,接替已离职的前腾讯混元大模型技术负责人之一的刘威,负责多模态大模型的研发工作。
微软对 Windows 系统中的 Copilot 实现方式进行了又一次更新。
Sora、Genie等模型会都用到的Tokenizer,微软下手了—— 开源了一套全能的Video Tokenizer,名为VidTok。
微软下一代14B小模型Phi-4出世了!仅用了40%合成数据,在数学性能上击败了GPT-4o,最新36页技术报告出炉。
12 月 11 日消息,谷歌正式向美国联邦贸易委员会(FTC)提出要求,希望终止微软与 OpenAI 之间的独家云服务协议。微软与OpenAI的合作始于2019年,当时,微软向OpenAI投资10亿美元,并达成多年合作协议,其中包括独家云服务协议。根据协议,微软Azure成为OpenAI的独家云服务提供商。而微软和OpenAI的合作,也形成了当今AI圈里的“超级同盟”。
AI驱动的智能助手将拥有更高的自主性,能够执行更多任务,从而简化你的家居生活和职场工作。在全球舞台上,AI将助力我们找到应对诸多重大挑战的新途径,这些挑战从气候危机到医疗服务获取问题,不一而足。
昨天,就在 OpenAI 12 天连发的第一天发布火遍全网的同时,微软也发布了一款重量级 AI 产品:Copilot Vision。这是一款集成在 Edge 浏览器中的 AI 助手,可以与你实时「协作上网」,并能随时提供帮助。
对于LLM来说,人类语言可能不是最好的交流媒介,正如《星战》中的机器人有自己的一套语言,近日,来自微软的研究人员改进了智能体间的交互方式,使模型的通信速度翻倍且不损失精度。
就在刚刚,微软公布了世界最大AI Agent生态系统:现在,已经有十万家企业通过Copilot Studio创建智能体了。