
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research
阿里智能体多轮推理超越GPT-4o,开源模型也能做Deep Research能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。
来自主题: AI技术研报
6336 点击 2025-06-06 16:31
能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。
如果要问近期最火热的AI硬件品类是什么,AI眼镜一定榜上有名。
夸克,最近有点火。
在数字化时代,视觉信息在知识传递和决策支持中的重要性日益凸显。然而,传统的检索增强型生成(RAG)方法在处理视觉丰富信息时面临着诸多挑战。一方面,传统的基于文本的方法无法处理视觉相关数据;另一方面,现有的视觉 RAG 方法受限于定义的固定流程,难以有效激活模型的推理能力。
大模型时代,没人愿意缺席AI+医疗。
腾讯的CodeBuddy、字节的Trea、现在阿里的通义灵码,中国互联网的三大巨头在AI编程领域集结完毕,明显就是要从老美的Cursor手中抢回中国客户。
为提升大模型“推理+搜索”能力,阿里通义实验室出手了。
既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。
大厂AI高层大换血,字节阿里招猛将
国补后7649(原价8999),雷鸟正式发布了带有定制大模型和全彩显示的AI眼镜——X3 Pro。