AI资讯新闻榜单内容搜索-香港

ICCV 2025 | 浙大、港中文等提出EgoAgent：第一人称感知-行动-预测一体化智能体

在今年的国际计算机视觉大会（ICCV 2025）上，来自浙江大学、香港中文大学、上海交通大学和上海人工智能实验室的研究人员联合提出了第一人称联合预测智能体 EgoAgent。

来自主题: AI技术研报

8410 点击 2025-10-18 11:48

CAIR开源发布超声基座大模型EchoCare“聆音”，10余项医学任务性能登顶

2025年9月17日，中国科学院香港创新研究院人工智能与机器人创新中心（CAIR）在香港正式开源发布其最新科研成果——EchoCare“聆音”超声基座大模型（简称“聆音”）。该模型基于超过450万张、涵盖50多个人体器官的大规模超声影像数据集训练而成，在器官识别、器官分割、病灶分类等10余项典型超声医学任务测试中表现卓越，性能全面登顶。

来自主题: AI技术研报

9595 点击 2025-10-06 15:53

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组（后简称“团队”）推出PromptCoT 2.0，要在大模型下半场押注任务合成。实验表明，通过“强起点、强反馈”的自博弈式训练，PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果，达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

来自主题: AI技术研报

8583 点击 2025-10-01 17:12

首次实现第一视角视频与人体动作同步生成！新框架攻克视角-动作对齐两大技术壁垒

AI生成第三视角视频已经驾轻就熟，但第一视角生成却仍然“不熟”。为此，新加坡国立大学、南洋理工大学、香港科技大学与上海人工智能实验室联合发布EgoTwin ，首次实现了第一视角视频与人体动作的联合生成。

来自主题: AI技术研报

10045 点击 2025-10-01 11:43

AI能「拍」好电影？五部短片亮相釜山电影节，答案出乎意料

去年九月，中国香港动画公司 ManyMany Creations Limited 的几位年轻主创立下了一个几乎「逆天」的目标—— 拍一部真正的剧情短片，至少十五分钟长，而且每个镜头都必须由 AI 生成。

来自主题: AI资讯

8738 点击 2025-09-28 17:58

震撼！AI物理「双修」：亥姆霍兹方程嵌进生成器，伪影当场消失

抢滩6G前夜，AI加物理正在重塑无线电地图产业格局。香港科技大学（广州）等机构联手重磅发布PhyRMDM框架，打破认知盲区，将物理约束与生成模型能力融合一体，显著提升高精度无线电地图的生成质量与稳定性。这一成果已被顶会ACM MM 2025接收。

来自主题: AI技术研报

8044 点击 2025-09-25 15:29

把上万个AI丢在一个小镇里打工，会发生什么?

不管是让 AI 去赚钱养家，还是让它出去和其他 AI 到处勾搭。全都在我们这些碳基上帝的、一念之间。这就是香港科技大学开放的实验项目 —— Aivilization，一个模拟 AI 生活、社会演化与经济体系的开放式 AI 沙盒实验世界。

来自主题: AI资讯

9166 点击 2025-09-22 08:39

网络顶会获奖！华为提出端网协同RDMA传输架构，解决大规模AI集群网络可扩展性问题

近日，全球网络通信顶会 ACM SIGCOMM 2025 在葡萄牙落幕，共 3 篇论文获奖，华为网络技术实验室与香港科技大学 iSING Lab 合作的 DCP 研究成果，获本届大会 Best Student Paper Award (Honorable Mention)，成为亚洲地域唯一获奖的论文。

来自主题: AI资讯

8295 点击 2025-09-17 09:41

前商汤AI团队创业做了一款AI版抖音+Onlyfans，擦边内容和手势互动定义AI社交新物种

近期，一款名为 TipTap AI 的应用在海外市场爆火。它的背后是前商汤AI团队的余锋伟和宋广录。根据公开信息，TipTap AI归属于Vivix Group Limited，公司注册于香港，旗下控股杭州和上海维悦时刻科技，由余锋伟和宋广录担任法人。

来自主题: AI资讯

12384 点击 2025-09-10 15:22

空间智能新高度：港科大谭平团队SAIL-Recon突破万帧级图像大规模3D场景重建Transformer

香港科技大学谭平教授团队与地平线（Horizon Robotics）团队最新发布了一项 3D 场景表征与大规模重建新方法 SAIL-Recon，通过锚点图建立构建场景全局隐式表征，突破现有 VGGT 基础模型对于大规模视觉定位与 3D 重建的处理能力瓶颈，实现万帧级的场景表征抽取与定位重建，将空间智能「3D 表征与建模」前沿推向一个新的高度。

来自主题: AI技术研报

8741 点击 2025-09-08 10:19