细粒度视觉推理链引入数学领域,准确率暴涨32%,港中文MMLab打破多模态数学推理瓶颈
细粒度视觉推理链引入数学领域,准确率暴涨32%,港中文MMLab打破多模态数学推理瓶颈思维链(Chain of Thought, CoT)推理方法已被证明能够显著提升大语言模型(LLMs)在复杂任务中的表现。而在多模态大语言模型(MLLMs)中,CoT 同样展现出了巨大潜力。
思维链(Chain of Thought, CoT)推理方法已被证明能够显著提升大语言模型(LLMs)在复杂任务中的表现。而在多模态大语言模型(MLLMs)中,CoT 同样展现出了巨大潜力。
百川智能、零一万物、智谱核心高管出走,京东悄悄挖人。 智东西6月16日报道,今年上半年,“大模型六小虎”中的智谱、MiniMax、零一万物、百川智能、阶跃星辰5家企业,共被曝13位AI高管变动,其中有12位出走、1位新入职
从数字工具到数字队友的进化之路 神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。
推箱子、俄罗斯方块……这些人类的经典怀旧小游戏,也成大模型benchmark了。 o3-pro刚刚也挑战了这两款游戏,而且表现还都不错,直接突破了benchmark上限
上上周的 2025 高考已经落下了帷幕!在人工智能领域,各家大模型向数学卷发起了挑战。
地铁站,老人方言购票秒出;医院里,医生病历书写时间压缩至1h。这家深耕AI的先锋长跑13年,如今即将叩响港交所大门。这条路没有捷径,只是把「人的需求」作为终点,或许这才是AI最本真的温度。
开发一个网站出海赚美金,是AI能带来的2025年最大的「时代红利」之一。
AI两天爆肝12年研究,精准吊打人类!多大、哈佛MIT等17家机构联手放大招,基于GPT-4.1和o3-mini,筛选文献提取数据,效率飙3000倍重塑AI科研工作流。
短视频平台熬夜冲浪的我突然发现,AI ASMR突然火了?!