AI资讯新闻榜单内容搜索-模型

华为刚投的物理AI：首家国产世界模型公司

华为在世界模型上又有新动作：投了一家物理AI公司。

来自主题: AI资讯

10895 点击 2025-11-12 16:23

医疗AI质变时刻来临！国产医疗AI率先突破，临床诊疗能力问鼎全球

“我最近喉咙像刀割一样痛，还伴随鼻塞，但没有咳嗽……这是染上流感，还是又中招了？”

来自主题: AI资讯

9536 点击 2025-11-12 16:22

打破显存墙：谢赛宁团队提出CLM，单卡RTX 4090「撬动」1亿高斯点

3D Gaussian Splatting (3DGS) 是一种日益流行的新视角合成方法，给定 3D 场景的一组带位姿的图像（即带有位置和方向的图像），3DGS 会迭代训练一个场景表示，该表示由大量各向异性 3D 高斯体组成，用以捕捉场景的外观和几何形状。

来自主题: AI技术研报

11368 点击 2025-11-12 10:51

上交×蚂蚁发布 DiagGym：以世界模型驱动交互式医学诊断智能体

临床诊断并非一次性的「快照」，而是一场动态交互、不断「探案」的推理过程。然而，当下的大模型大多基于静态数据训练，难以掌握真实诊疗中充满不确定性的多轮决策轨迹。如何让AI学会「追问」、选择检查，并一步步抽丝剥茧，迈向正确诊断？

来自主题: AI技术研报

8883 点击 2025-11-12 10:24

ICCV 2025 Highlight | 大规模具身仿真平台UnrealZoo

你是否曾为搭建具身仿真环境耗费数周学习却效果寥寥？是否因人工采集海量交互数据需要高昂成本而望而却步？又是否因找不到足够丰富真实的开放场景让你的智能体难以施展拳脚？

来自主题: AI技术研报

10953 点击 2025-11-12 09:32

从VLA到RoboOmni，全模态具身新范式让机器人察言观色、听懂话外音

复旦⼤学、上海创智学院与新加坡国立⼤学联合推出全模态端到端操作⼤模型 RoboOmni，统⼀视觉、⽂本、听觉与动作模态，实现动作⽣成与语⾳交互的协同控制。开源 140K 条语⾳ - 视觉 - ⽂字「情境指令」真机操作数据，引领机器⼈从「被动执⾏⼈类指令」迈向「主动提供服务」新时代。

来自主题: AI技术研报

9537 点击 2025-11-12 09:29

MIT融合新旧视觉技术，破解救援机器人导航瓶颈，无需标定，数秒生成3D场景

在一场矿难救援中，时间意味着生命。想象一台搜救机器人在部分坍塌的矿井中穿行：浓烟、碎石、扭曲的金属梁。它必须在险象环生的环境中迅速绘制地图，识别路径，并精准定位自己的位置。

来自主题: AI技术研报

8715 点击 2025-11-12 08:51

翻译界的ChatGPT时刻！Meta发布新模型，几段示例学会冷门新语言

在7000多种人类语言中，只有少数被现代语音技术听见，如今这种不平等或将被打破。Meta发布的Omnilingual ASR系统能识别1600多种语言，并可通过少量示例快速学会新语言。以开源与社区共创为核心，这项技术让每一种声音都有机会登上AI的舞台。

来自主题: AI资讯

9203 点击 2025-11-12 08:38

看图写代码，3毛钱开发一个网页！字节AI Coding新模型真卷麻了

编程模型最新卷王来了。就在今天，火山引擎推出了面向Agentic编程任务深度优化的全新代码模型Doubao-Seed-Code。价格，调用价格国内最低，火山引擎还配套推出9块9套餐，一杯咖啡钱，就能搞定各种摸鱼小游戏——比如办公室躲老板（doge）。

来自主题: AI资讯

10424 点击 2025-11-11 19:56

开源又赢闭源！商汤8B模型空间智能碾压GPT-5，AI看懂世界又进了一步

昨晚，商汤正式发布并开源SenseNova-SI系列空间智能大模型，涵盖2B与8B两个版本。该系列模型在多个空间智能基准测试中均表现突出，其中SenseNova-SI-8B模型在VSI-Bench、MMSI-Bench、MindCube-Tiny与ViewSpatial四个核心任务上获得60.99的平均成绩

来自主题: AI资讯

9682 点击 2025-11-11 19:45