
扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升
扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中国人民大学高瓴人工智能学院的博士生,导师为李崇轩副教授。
6 月 6 日,小红书 hi lab(Humane Intelligence Lab,人文智能实验室)团队首次开源了文本大模型 dots.llm1,采用 MIT 许可证。
6月6日, 由中共重庆市委金融委员会办公室、重庆市商务委员会、重庆两江新区管理委员会共同指导,由消费金融服务联盟、打击金融领域黑产联盟(AIF)联合主办,马上消费等19家金融机构、重庆广播电视(总台)第1眼TV等协办的“2025消费金融生态大会”在重庆举行。
AI 开始从理解文字,全面进化到建模世界、操控实体、模拟大脑、解构分子。
在文本推理领域,以GPT-o1、DeepSeek-R1为代表的 “慢思考” 模型凭借显式反思机制,在数学和科学任务上展现出远超 “快思考” 模型(如 GPT-4o)的优势。
逻辑推理是人类智能的核心能力,也是多模态大语言模型 (MLLMs) 的关键能力。随着DeepSeek-R1等具备强大推理能力的LLM的出现,研究人员开始探索如何将推理能力引入多模态大模型(MLLMs)
苹果最新研究揭示大推理模型(LRM)在高复杂度任务中普遍「推理崩溃」:思考路径虽长,却常在关键时刻放弃。即便给予明确算法提示,模型亦无法稳定执行,暴露推理机制的局限性。
相信大家已经听过很多 AI 在生命科学领域的一次次革命性进展,甚至 2024 年的诺贝尔化学奖都颁给了计算生物学领域的科学家们。
肾病防治迈向智能化、精准化:北大第一医院发布“肾说”大模型,医疗科技的不断创新,正在为患者提供更加高效、便捷的医疗服务。
AI模型用于工业异常检测,再次取得新SOTA!