AI资讯新闻榜单内容搜索-训练

大模型的第一性原理：（一）统计物理篇

白铂博士，华为 2012 实验室理论研究部主任信息论首席科学家

来自主题: AI技术研报

11457 点击 2025-12-12 08:57

你的Agent可能设计错了：UIUC & 斯坦福等联合发文，重构Agent适配2X2

随着基础模型的日益成熟，AI领域的研发重心正从“训练更强的模型”转移到“构建更强的系统”。在这个新阶段，适配（Adaptation）成为了连接通用智能与垂直应用的关键纽带。

来自主题: AI技术研报

9325 点击 2025-12-12 08:53

全球首个太空AI诞生，H100在轨炼出！马斯克爆赞

见证历史！今天，首个由H100太空GPU训出LLM诞生了，它基于Karpathy nano-GPT训练。不仅如此，谷歌Gemma也在太空成功运行，向世界发出首句问候：地球人，你好。

来自主题: AI资讯

10463 点击 2025-12-11 16:27

MIT最新发现：这十年，算法进步被高估了

在过去十年中，AI 的进步主要由两股紧密相关的力量推动：迅速增长的计算预算，以及算法创新。

来自主题: AI技术研报

10768 点击 2025-12-11 14:36

向量数据库新范式：分层存储，让数据从全量加载到按需加载 | Milvus Week

本文为Milvus Week系列第7篇，该系列旨在把Zilliz团队过去半年多积累的先进的技术实践和创新整理成多篇干货深度文章发布。

来自主题: AI技术研报

10778 点击 2025-12-11 14:35

Meta公开抄阿里Qwen作业，还闭源了...

Meta的开源时代，要结束了。彭博社爆料，明年春季，Meta将发布一款代号为「Avocado（牛油果）」的模型。而这款新模型，很可能是「闭源」的。但如果仅仅是闭源，还不至于如此引人注目。真正让市场炸裂的是另一条更劲爆的消息：这款闭源模型，竟然在训练过程中使用了阿里巴巴的AI。

来自主题: AI资讯

8537 点击 2025-12-11 11:55

微软发布首个测试时扩展大规模研究，还给出了终极指南

如果说大模型的预训练（Pre-training）是一场拼算力、拼数据的「军备竞赛」，那么测试时扩展（Test-time scaling, TTS）更像是一场在推理阶段进行的「即时战略游戏」。

来自主题: AI技术研报

7934 点击 2025-12-11 11:27

允许AI自我进化，人类将迅速灭亡！Anthropic创始人警告

Anthropic联合创始人兼首席科学官Jared Kaplan，认为在2027-2030年期间，我们将不得不做出是否允许 AI 自我进化的抉择，而允许的话很可能导致AI失控，毁灭全人类。Anthropic在迅速提升AI模型性能不断逼近AGI奇点的同时，也在同时让「9人特种部队」用1.4万字的「AI宪法」防范AI失控。

来自主题: AI资讯

10807 点击 2025-12-11 11:26

扩散语言模型推理太慢？北大团队提出ODB-dLLM框架，破解计算访存双重瓶颈

基于扩散的大语言模型 (dLLM) 凭借全局解码和双向注意力机制解锁了原生的并行解码和受控生成的潜力，最近吸引了广泛的关注。例如 Fast-dLLM 的现有推理框架通过分块半自回归解码进一步实现了 dLLM 对 KV cache 的支持，挑战了传统自回归 LLMs 的统治地位。

来自主题: AI技术研报

6878 点击 2025-12-11 10:42

LLM距离AGI只差一层：斯坦福研究颠覆「模式匹配」观点

有关大语言模型的理论基础，可能要出现一些改变了。

来自主题: AI技术研报

10587 点击 2025-12-11 10:10