AI资讯新闻榜单内容搜索-香港

Agent学会“预测同伴”，神经网络里涌现出了类社会位置细胞

近日，香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索，只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作，还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”，甚至发明了一套只有它们才懂的秘密语言。

来自主题: AI资讯

8935 点击 2026-01-29 14:57

一张图生成任意场景3D模型，部分遮挡也不怕｜IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架，有望攻克这一问题。它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础，实现了从任意开放世界图像（室内/室外/合成图等）到带Mesh的3D场景的完整重建。

来自主题: AI技术研报

7880 点击 2026-01-26 10:16

我 Vibe Coding 一周，做了个桌面 Agent

复盘一下我vibe coding 一周，开发 WorkAny 的过程，很有意思。 1. 上周三在香港办卡，临时起意想做个桌面 Agent 项目，对标 cowork，晚上回到广州开始写代码 2. 初期目标是快速发布，没时间去研究哪个 Agent 框架好用了，看很多人在用 claude agent sdk，先用这个吧

来自主题: AI资讯

9403 点击 2026-01-24 18:43

AI for Science开年新突破：中科大实现多尺度结构逆向设计128倍加速，登上Nature子刊

近日，中国科学技术大学（USTC）联合新疆师范大学、中关村人工智能研究院、香港理工大学，在数据驱动的多功能双连通多尺度结构逆向设计领域取得重要突破。

来自主题: AI技术研报

7042 点击 2026-01-22 10:12

解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估

香港大学（The University of Hong Kong）与 Adobe Research 联合发布 Self-E（Self-Evaluating Model）：一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接：让同一个模型在极少步数也能生成语义清晰、结构稳定的图像，同时在 50 步等常规设置下保持顶级质量，并且随着步数增加呈现单调提升。

来自主题: AI技术研报

8146 点击 2026-01-18 14:57

DeepSeek-OCR是「长文本理解」未来方向？中科院新基准VTCBench给出答案

近期，DeepSeek-OCR 凭借其创新的「视觉文本压缩」（Vision-Text Compression, VTC）范式引发了技术圈的高度关注。为了解答这一疑问，来自中科院自动化所、中国科学院香港创新研究院等机构的研究团队推出了首个专门针对视觉 - 文本压缩范式的基准测试 ——VTCBench。

来自主题: AI技术研报

7097 点击 2026-01-11 10:01

CaveAgent让LLM学会了“跑代码”，你能把Agent变成Jupyter里的“老司机”

CaveAgent的核心思想很简单：与其让LLM费力地去“读”数据的文本快照，不如给它一个如果不手动重启、变量就永远“活着”的 Jupyter Kernel。这项由香港科技大学（HKUST）领衔的研究，为我们展示了一种“Code as Action, State as Memory”的全新可能性。它解决了所有开发过复杂Agent的工程师最头疼的多轮对话中的“失忆”与“漂移”问题。

来自主题: AI技术研报

8228 点击 2026-01-09 14:34