
速递|前通义视觉负责人薄列峰加盟腾讯混元,字节和腾讯紧盯阿里AI核心
速递|前通义视觉负责人薄列峰加盟腾讯混元,字节和腾讯紧盯阿里AI核心据 AI 科技评论报道,前阿里通义实验室视觉负责人薄列峰已正式加盟腾讯混元大模型团队,直接向腾讯副总裁、混元项目负责人蒋杰汇报,主要负责多模态方向的技术攻坚。早在今年4月30日,薄列峰从阿里离职,外界曾一度传出他将赴美加入某大型科技公司,统筹多模态AI研发。如今尘埃落定,他最终选择落脚深圳,加入国内多模态竞争最激烈的战场之一。
据 AI 科技评论报道,前阿里通义实验室视觉负责人薄列峰已正式加盟腾讯混元大模型团队,直接向腾讯副总裁、混元项目负责人蒋杰汇报,主要负责多模态方向的技术攻坚。早在今年4月30日,薄列峰从阿里离职,外界曾一度传出他将赴美加入某大型科技公司,统筹多模态AI研发。如今尘埃落定,他最终选择落脚深圳,加入国内多模态竞争最激烈的战场之一。
编程Agent王座,国产开源模型拿下了!就在刚刚,阿里通义大模型团队开源Qwen3-Coder,直接刷新AI编程SOTA——不仅在开源界超过DeepSeek V3和Kimi K2,连业界标杆、闭源的Claude Sonnet 4都比下去了。
7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。7月11日晚间,阿里通义千问团队宣布,对其人工智能聊天产品Qwen Chat进行重大更新,在优化用户交互体验的同时,还新增了多项实用功能。
让大模型在学习推理的同时学会感知。伊利诺伊大学香槟分校(UIUC)与阿里巴巴通义实验室联合推出了全新的专注于多模态推理的强化学习算法PAPO(Perception-Aware Policy Optimization)。
在互联网信息检索任务中,即使是很强的LLM,有时也会陷入“信息迷雾”之中:当问题简单、路径明确时,模型往往能利用记忆或一两次搜索就找到答案;但面对高度不确定、线索模糊的问题,模型就很难做对。
AI音效已经进化成这样了吗??
在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。
腾讯的CodeBuddy、字节的Trea、现在阿里的通义灵码,中国互联网的三大巨头在AI编程领域集结完毕,明显就是要从老美的Cursor手中抢回中国客户。
为提升大模型“推理+搜索”能力,阿里通义实验室出手了。
既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。