AI资讯新闻榜单内容搜索-大模型

破解多模态大模型“选择困难症”！内部决策机制首次揭秘：在冲突信息间疯狂"振荡"

多模态大语言模型（MLLMs）在处理来自图像和文本等多种来源的信息时能力强大。然而，一个关键挑战随之而来：当这些模态呈现相互冲突的信息时（例如，图像显示一辆蓝色汽车，而文本描述它为红色），MLLM必须解决这种冲突。模型最终输出与某一模态信息保持一致的行为，称之为“模态跟随”（modality following）

来自主题: AI技术研报

7941 点击 2025-11-14 13:54

太卷了！专属Coding的新一代Arena榜单来了，有国产模型登上榜首

大模型编程最近太猛了。

来自主题: AI资讯

10789 点击 2025-11-14 10:59

一个模型读懂所有医学数据，Hulu-Med探索医学大模型开源新范式 | 浙大x上交xUIUC

从影像诊断到手术指导，从多语言问诊到罕见病推理—— 医学AI正在从“专科助手”进化为“全能型选手”。

来自主题: AI技术研报

9009 点击 2025-11-14 09:40

【首发】医疗大模型企业全诊医学获1亿元B轮融资，创投行业期待中国的Abridge

中国最早进行医疗大模型后训练的创新企业之一 ——杭州全诊医学科技有限公司（以下简称“全诊医学”）正式宣布完成1亿元B轮融资：2024年4季度由A股上市公司“创新医疗”(SZ.002173)完成战略轮投资；2025年2季度由中国医药工业百强“好医生集团”完成B轮投资，探针资本担任本轮融资的独家财务顾问。

来自主题: AI资讯

6529 点击 2025-11-13 16:46

微软AI掌门直击AI乱象！AI意识纯属危言耸听，机器觉醒歧途一条

微软AI负责人Mustafa Suleyman表示，只有生物体才能具备意识，开发者和研究人员应该停止追求让AI具有意识。

来自主题: AI资讯

7503 点击 2025-11-13 14:51

罗福莉C位亮相小米，离职DeepSeek后首次官宣

就在今天，罗福莉以C位之姿，首次对外官宣了小米任职。刚刚，罗福莉在X上高调宣布——正式加入小米，出任MiMo团队负责人。智能的进化必然会从语言世界走向物理世界，解锁多模态的空间智能——具备感知、推理、生成与行动的能力，这是实现真正通用人工智能（AGI）的关键一步。

来自主题: AI资讯

8195 点击 2025-11-12 19:07

NeurIPS 25开新坑：145万个图文对，覆盖八种主流水下理解任务

华中科技大学团队推出首个水下多模态大模型NAUTILUS，支持8种水下场景理解任务，并开源145万图文对的NautData数据集。模型通过视觉特征增强模块解决水下图像模糊和颜色失真问题，性能超越现有模型，恶劣环境下表现更佳。

来自主题: AI技术研报

10655 点击 2025-11-12 17:16

上交×蚂蚁发布 DiagGym：以世界模型驱动交互式医学诊断智能体

临床诊断并非一次性的「快照」，而是一场动态交互、不断「探案」的推理过程。然而，当下的大模型大多基于静态数据训练，难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查，并一步步抽丝剥茧，迈向正确诊断？

来自主题: AI技术研报

8484 点击 2025-11-12 10:24

开源又赢闭源！商汤8B模型空间智能碾压GPT-5，AI看懂世界又进了一步

昨晚，商汤正式发布并开源SenseNova-SI系列空间智能大模型，涵盖2B与8B两个版本。该系列模型在多个空间智能基准测试中均表现突出，其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩

来自主题: AI资讯

9158 点击 2025-11-11 19:45

打破数据质量鸿沟！清华腾讯Bee项目发布1500万高质量数据集，刷新MLLM全栈开源SOTA

全开源多模态大模型（MLLM）的性能，长期被闭源和半开源模型“卡脖子”。

来自主题: AI技术研报

7553 点击 2025-11-11 16:39