AI资讯新闻榜单内容搜索-框架

扩散语言模型推理太慢？北大团队提出ODB-dLLM框架，破解计算访存双重瓶颈

基于扩散的大语言模型 (dLLM) 凭借全局解码和双向注意力机制解锁了原生的并行解码和受控生成的潜力，最近吸引了广泛的关注。例如 Fast-dLLM 的现有推理框架通过分块半自回归解码进一步实现了 dLLM 对 KV cache 的支持，挑战了传统自回归 LLMs 的统治地位。

来自主题: AI技术研报

6705 点击 2025-12-11 10:42

告别专家依赖，让机器人学会自我参考，仅需200步性能飙升至99.2%

你是否想过，机器人也能像人一样，从失败中学习，不断自我提升？

来自主题: AI技术研报

10710 点击 2025-12-11 10:08

一手实测 | 智谱AutoGLM重磅开源： AI手机的「安卓时刻」正式到来

具体来说，Open-AutoGLM 由一个手机端智能助手框架 Phone Agent 和一个 9B 大小的模型 AutoGLM-Phone-9B 共同组成。这次开源对行业的影响力，核心来自这次智谱开源的不是一个普通的 GUI agent 模型，而可能是行业最好的模型。

来自主题: AI产品测评

10258 点击 2025-12-10 14:40

深大团队让机器人听懂指令精准导航！成功率可达72.5%，推理效率提升40%|AAAI2026

深圳大学李坚强教授团队最近联合北京理工莫斯科大学等机构，提出视觉-语言导航（VLN）新框架——UNeMo。让机器人听懂指令，精准导航再升级！

来自主题: AI技术研报

7184 点击 2025-12-10 14:34

2比特复数模型媲美全精度！北大通用框架让大模型在手机上也能流畅运行

近日，北京大学团队提出一个直接基于已有预训练模型进行极低比特量化的通用框架——Fairy2i。该框架通过广泛线性表示将实数模型无损转换为复数形式，再结合相位感知量化与递归残差量化，实现了在仅2比特的情况下，性能接近全精度模型的突破性进展。

来自主题: AI技术研报

8047 点击 2025-12-10 14:28

Light-X来了！全球首个「镜头×光照」双控4D视频生成框架，单目视频秒变电影级

仅凭一段随手拍摄的单目视频，是否能够让镜头在空间中自由飞行，让光线随意变换，让原本固定的真实场景在全新的视角与照明条件下被再次「拍摄」？这一过去被视作科幻设想的问题，如今迎来了明确答案。

来自主题: AI技术研报

9854 点击 2025-12-10 10:21

Snapchat提出Canvas-to-Image：一张画布集成 ID、姿态与布局

Canvas-to-Image 是一个面向组合式图像创作的全新框架。它取消了传统「分散控制」的流程，将身份参考图、空间布局、姿态线稿等不同类型的控制信息全部整合在同一个画布中。用户在画布上放置或绘制的内容，会被模型直接解释为生成指令，简化了图像生成过程中的控制流程。

来自主题: AI技术研报

11016 点击 2025-12-09 14:40

谷歌秀肌肉了：披露Gemini 3.0为啥过目不忘越用越好用，Titans的惊喜度+Miras框架

最近，Google Research 发布了一篇 Blog《Titans + MIRAS：帮助人工智能拥有长期记忆》。它们允许 AI 模型在运行过程中更新其核心内存，从而更快地工作并处理海量上下文。

来自主题: AI技术研报

10613 点击 2025-12-08 14:41

DeepSeek、Gemini谁更能提供情感支持？趣丸×北大来了波情绪轨迹动态评估

近日，由趣丸科技与北京大学软件工程国家工程研究中心共同发表的《Detecting Emotional Dynamic Trajectories: An Evaluation Framework for Emotional Support in Language Models（检测情感动态轨迹：大语言模型情感支持的评估框架）》论文，获 AAAI 2026 录用。

来自主题: AI技术研报

9378 点击 2025-12-08 14:13

亚马逊Agent克服遗忘的“秘诀”，被中国团队掌握，让大模型遗忘率趋近于0

国内记忆框架首开源，企业实战已上线运行。在海外巨头已经将“记忆系统”提升到基础设施层的同时，红熊AI便是其中之一。公司成立于2024年，围绕多模态大模型与记忆科学开展研发，并将这些能力用于为企业提供智能客服、营销自动化与AI智能体服务。

来自主题: AI资讯

8019 点击 2025-12-08 09:49