AI资讯新闻榜单内容搜索-通义实验室

阿里开源AI手机的“灵魂”，GUI智能体2B到235B四个版本全，端云协同成功率暴涨33%

AI手机的“灵魂”GUI智能体，就这么全套开源了。

来自主题: AI技术研报

8245 点击 2025-12-31 14:37

周靖人署名，通义实验室开源智能体自进化系统：让模型学会“自我反思”，14B也能越级打怪

智能体自进化，阿里开源了新成果。

来自主题: AI技术研报

9511 点击 2025-11-19 16:39

GUI智能体训练迎来新范式！半在线强化学习让7B模型媲美GPT-4o

浙江大学与通义实验室Mobile-Agent团队在UI-R1的基础上，推出全新研究成果——UI-S1，提出了一种名为半在线强化学习（Semi-online Reinforcement Learning）的创新训练范式。

来自主题: AI技术研报

7314 点击 2025-09-24 09:49

刚刚！阿里发新模型，幻觉率爆降70%

智东西9月15日报道，今天，阿里巴巴通义实验室推出了FunAudio-ASR端到端语音识别大模型。这款模型通过创新的Context模块，针对性优化了“幻觉”、“串语种”等关键问题，在高噪声的场景下，幻觉率从78.5%下降至10.7%，下降幅度接近70%。

来自主题: AI技术研报

8611 点击 2025-09-16 11:23

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

覆盖桌面、移动和 Web，7B 模型超越同类开源选手，32B 模型挑战 GPT-4o 与 Claude 3.7，通义实验室全新 Mobile-Agent-v3 现已开源。

来自主题: AI技术研报

7914 点击 2025-09-03 10:47

通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA

WebAgent 续作《WebShaper: Agentically Data Synthesizing via Information-Seeking Formalization》中

来自主题: AI资讯

7090 点击 2025-07-30 11:26

速递｜前通义视觉负责人薄列峰加盟腾讯混元，字节和腾讯紧盯阿里AI核心

据 AI 科技评论报道，前阿里通义实验室视觉负责人薄列峰已正式加盟腾讯混元大模型团队，直接向腾讯副总裁、混元项目负责人蒋杰汇报，主要负责多模态方向的技术攻坚。早在今年4月30日，薄列峰从阿里离职，外界曾一度传出他将赴美加入某大型科技公司，统筹多模态AI研发。如今尘埃落定，他最终选择落脚深圳，加入国内多模态竞争最激烈的战场之一。

来自主题: AI资讯

9359 点击 2025-07-27 20:07

感知错误率降低30.5%：隐式感知损失让模型主动“睁大眼睛” | UIUC＆阿里通义

让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校（UIUC）与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。

来自主题: AI技术研报

7721 点击 2025-07-11 16:23

通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代

作者介绍：本文作者来自通义实验室 RAG 团队，致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报

7676 点击 2025-06-12 15:24

AI资讯新闻榜单内容搜索-通义实验室

阿里开源AI手机的“灵魂”，GUI智能体2B到235B四个版本全，端云协同成功率暴涨33%

周靖人署名，通义实验室开源智能体自进化系统：让模型学会“自我反思”，14B也能越级打怪

GUI智能体训练迎来新范式！半在线强化学习让7B模型媲美GPT-4o

刚刚！阿里发新模型，幻觉率爆降70%

性能逼近闭源最强，通义实验室开源Mobile-Agent-v3刷新10项GUI基准SOTA

最新智能体自动操作手机电脑，10个榜单开源SOTA全拿下｜通义实验室

通义实验室大火的 WebAgent 续作：全开源模型方案超过GPT4.1 , 收获开源SOTA

速递｜前通义视觉负责人薄列峰加盟腾讯混元，字节和腾讯紧盯阿里AI核心

感知错误率降低30.5%：隐式感知损失让模型主动“睁大眼睛” | UIUC＆阿里通义

通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代