
对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”
对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。
大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。
20万次模拟实验,耗资5000美元,证实大模型在多轮对话中的表现明显低于单轮对话!一旦模型的第一轮答案出现偏差,不要试图纠正,而是新开一个对话!
五天,两万多行代码,重构三次。
近年来,大语言模型(LLMs)以及多模态大模型(MLLMs)在多种场景理解和复杂推理任务中取得突破性进展。
RNN太老,Transformer太慢?谷歌掀翻Transformer王座,用「注意力偏向+保留门」取代传统遗忘机制,重新定义了AI架构设计。全新模型Moneta、Yaad、Memora,在多个任务上全面超越Transformer。这一次,谷歌不是调参,而是换脑!
6 月 6 日,小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源了文本大模型 dots.llm1,采用 MIT 许可证。
6月6日, 由中共重庆市委金融委员会办公室、重庆市商务委员会、重庆两江新区管理委员会共同指导,由消费金融服务联盟、打击金融领域黑产联盟(AIF)联合主办,马上消费等19家金融机构、重庆广播电视(总台)第1眼TV等协办的“2025消费金融生态大会”在重庆举行。
AI 开始从理解文字,全面进化到建模世界、操控实体、模拟大脑、解构分子。
自ChatGPT问世,李明顺成了“网红”。他没有下场做大模型,而是密集地通过短视频平台输出对AI的看法。
逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)