AI资讯新闻榜单内容搜索-香港

ICLR 2026 | 把视频扩散模型压到4bit，还能接近满血效果？ QVGen让「超低比特视频生成量化」真正可用

香港科技大学 & 北航 & 商汤等提出了一个专门面向视频生成扩散模型的 QAT 范式 ——QVGen，在 3-bit / 4-bit 都能把质量拉回来，并且让 4-bit 首次接近全精度表现成为现实。该论文现已被 ICLR 高分接收：rebuttal 前 88666（top 1.4%），rebuttal 后 88886 （top 0.5%）。

来自主题: AI技术研报

8537 点击 2026-02-28 15:12

ICLR 2026 | 数据缺少标注，RL还能稳定诱导模型推理吗？Co-rewarding提供自监督RL学习方案！

针对这一挑战，来自香港浸会大学和上海交通大学的可信机器学习和推理组提出了一个全新的自监督 RL 框架 ——Co-rewarding。该框架通过在数据端或模型端引入互补视角的自监督信号，稳定奖励获取，提升 RL 过程中模型奖励投机的难度，从而有效避免 RL 训练崩溃，实现稳定训练和模型推理能力的诱导。

来自主题: AI技术研报

8387 点击 2026-02-24 15:16

具身大模型LaST₀：双臂/移动/灵巧手全面新SOTA，首次引入隐空间时空思维链

LaST₀团队投稿量子位 | 公众号 QbitAI 近日，至简动力、北京大学、香港中文大学、北京人形机器人创新中心提出了一种名为LaST₀的全新隐空间推理VLA模型，在基于Transformer混

来自主题: AI技术研报

6651 点击 2026-02-08 11:50

三个月完成两轮融资！前蚂蚁大模型首席架构师创业，发布行业首款 GEO 产品化 AI Agent

营销，正式进入 AI 时代。近日，专注于答案引擎优化（AEO）的 AI Agent 平台 PallasAI 宣布完成数千万人民币融资，由香港上市公司有赞（8083.HK）独家投资。这是该公司三个月内

来自主题: AI资讯

9499 点击 2026-02-07 14:22

原蚂蚁班底组队创业，打造GEO AI Agent，3个月内再融数千万

智东西2月6日报道，据Z Finance独家获悉，近日，答案引擎优化（AEO）AI Agent平台PallasAI完成数千万人民币的天使轮融资，由香港上市公司有赞独家投资。这是PallasAI三个月内获得的第二笔投资。

来自主题: AI资讯

10102 点击 2026-02-07 14:19

Agent学会“预测同伴”，神经网络里涌现出了类社会位置细胞

近日，香港城市大学博士生方政儒和所在团队让一群智能体在虚拟迷宫里共同探索，只给它们一个极其简单的目标——那就是学会预测同伴下一秒会看到什么以及会走到哪里。结果发现这些智能体不仅学会了高效合作，还在自己的“大脑”里自发形成了类似动物大脑中的“地图细胞”，甚至发明了一套只有它们才懂的秘密语言。

来自主题: AI资讯

9733 点击 2026-01-29 14:57

一张图生成任意场景3D模型，部分遮挡也不怕｜IDEA x 光影焕像联合开源

IDEA研究院张磊团队与香港科技大学谭平团队联合推出SceneMaker框架，有望攻克这一问题。它以视启未来的万物检测模型DINO-X与光影焕像的万物3D生成模型Triverse为基础，实现了从任意开放世界图像（室内/室外/合成图等）到带Mesh的3D场景的完整重建。

来自主题: AI技术研报

8735 点击 2026-01-26 10:16

我 Vibe Coding 一周，做了个桌面 Agent

复盘一下我vibe coding 一周，开发 WorkAny 的过程，很有意思。 1. 上周三在香港办卡，临时起意想做个桌面 Agent 项目，对标 cowork，晚上回到广州开始写代码 2. 初期目标是快速发布，没时间去研究哪个 Agent 框架好用了，看很多人在用 claude agent sdk，先用这个吧

来自主题: AI资讯

10340 点击 2026-01-24 18:43

AI for Science开年新突破：中科大实现多尺度结构逆向设计128倍加速，登上Nature子刊

近日，中国科学技术大学（USTC）联合新疆师范大学、中关村人工智能研究院、香港理工大学，在数据驱动的多功能双连通多尺度结构逆向设计领域取得重要突破。

来自主题: AI技术研报

7713 点击 2026-01-22 10:12

解锁任意步数文生图，港大&Adobe全新Self-E框架学会自我评估

香港大学（The University of Hong Kong）与 Adobe Research 联合发布 Self-E（Self-Evaluating Model）：一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接：让同一个模型在极少步数也能生成语义清晰、结构稳定的图像，同时在 50 步等常规设置下保持顶级质量，并且随着步数增加呈现单调提升。

来自主题: AI技术研报

8984 点击 2026-01-18 14:57