
比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临
比自回归更灵活、比离散扩散更通用,首个纯Discrete Flow Matching多模态巨兽降临王劲,香港大学计算机系二年级博士生,导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。
王劲,香港大学计算机系二年级博士生,导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作发表于 ICML、CVPR、ICCV、ECCV 等国际学术会议。
AI大模型正在医疗服务行业中扎根。 “我们医院在科研平台上已经接入使用了DeepSeek。”北京某三甲医院相关负责人对光锥智能说道,“形式类似于AI助理,能提供科研政策问答、查询、常用文件下载等功能。”
大模型≠随机鹦鹉!Nature子刊最新研究证明: 大模型内部存在着类似人类对现实世界概念的理解。
知识库成为大模型落地的热门场景,现实中却走入了 “技术炫酷却用不起来” 的窘境。
让推理模型针对风险指令生成了安全输出,表象下藏着认知危机: 即使生成合规答案,超60%的案例中模型并未真正理解风险。
6月7日,上海财经大学匡时财经教育大模型发布会暨数智新财经论坛在校举办,上海财经大学校长刘元春、上海市教育委员会副主任赵震、上海市杨浦区副区长刘晋元出席并致辞,中国移动上海公司党委书记、董事长、总经理楼向平,蚂蚁集团副总裁、财富保险事业群CTO尹俊,上海库帕思科技有限公司董事长山栋明等企业代表以及学校相关部门负责人参会。发布会由上海财经大学副校长靳玉英主持。
奥特曼使用大模型的方法,竟然是错的?
Time-R1通过三阶段强化学习提升模型的时间推理能力,其核心是动态奖励机制,根据任务难度和训练进程调整奖励,引导模型逐步提升性能,最终使3B小模型实现全面时间推理能力,超越671B模型。
学会“适当暂停与总结”,大模型终于实现无限推理。
6月6日-7日,2025 北京智源大会召开。作为全球具身智能领域最具影响力的学术与产业双栖盛会,本次大会汇聚了顶尖科研机构、技术领军企业和开源社群。