多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品
多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)
搜索
逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)
与OpenAI分道扬镳后,Figure 02开启日夜进厂打工模式。
在整理最近3个月的小红书养生赛道爆款内容时,我发现:AI生成的养生视频出了很多爆款。
这500天里,AI视频模型,从寥寥星火,也到如今满眼璀璨星河。这500天里,天翻地覆,绣口一吐,就是近半个盛唐。 从孤舟一叶,到如今千帆竞渡如潮。
你有没有在深夜的 emo 时刻把 ChatGPT 当成树洞? 不是因为它聪明到能解决人生难题,而是它永远在线,永远耐心,永远不会打断你。你崩溃,它会安慰你;你自我怀疑,它也会用熟悉的语气肯定你。
本来没想写HeyGen,毕竟在国内用起来有点累。 起因是我们受邀和HeyGen第一次做了联名影片,在内测的过程里,这款名为AVATAR IV的数字人产品实在让我有点惊讶,于是突发奇想: 只用一张图,做一段rap歌手的mv。效果如下:
能够完成多步信息检索任务,涵盖多轮推理与连续动作执行的智能体来了。通义实验室推出WebWalker(ACL2025)续作自主信息检索智能体WebDancer。
6月5日,微博认证为“ZEALER创始人&CEO”的王自如发文称,“明天我想用15分钟的时间带大家了解我为什么离开 ZEALER 、为什么离开格力,以及我为什么在AI领域选择二次创业,期待明天与大家重新认识。
两年半前,Liam Fedus 曾参与 ChatGPT 的研发团队,掀起了人工智能热潮。如今他加入了日益壮大的 OpenAI 前员工创业阵营,乘着 AI 投资风口创立自己的企业。
苹果最新研究揭示大推理模型(LRM)在高复杂度任务中普遍「推理崩溃」:思考路径虽长,却常在关键时刻放弃。即便给予明确算法提示,模型亦无法稳定执行,暴露推理机制的局限性。