AI资讯新闻榜单内容搜索-Scaling

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Scaling

AI大厦需要新的地基！

AI大厦需要新的地基！

AI大厦需要新的地基！

「Scaling Law 即将撞墙。」这一论断的一大主要依据是高质量数据不够用了

来自主题: AI资讯

7056 点击 2025-05-19 14:03

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

7331 点击 2025-05-15 17:12

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

突破大模型推理瓶颈！首篇「Test-Time Scaling」全景综述，深入剖析AI深思之道

当训练成本飙升、数据枯竭，如何继续激发大模型潜能？

来自主题: AI技术研报

5909 点击 2025-05-13 14:48

只有通过海量测试才能抓住泛化性的本质吗？

只有通过海量测试才能抓住泛化性的本质吗？

只有通过海量测试才能抓住泛化性的本质吗？

当以端到端黑盒训练为代表的深度学习深陷低效 Scaling Law 而无法自拔时，我们是否可以回到起点重看模型表征本身——究竟什么才是一个人工智能模型的「表征质量」或者「泛化性」？我们真的只有通过海量的测试数据才能抓住泛化性的本质吗？或者说，能否在数学上找到一个定理，直接从表征逻辑复杂度本身就给出一个对模型泛化性的先验的判断呢？

来自主题: AI技术研报

7795 点击 2025-05-11 14:35

机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

机器人的「物理图灵测试」，英伟达Jim Fan 17分钟演讲揭秘具身Scaling Law

Jim Fan，英伟达机器人部门主管和杰出科学家、GEAR 实验室联合领导人、OpenAI 的首位实习生，最近在红杉资本主办的 AI Ascent 上做了一场 17 分钟的演讲

来自主题: AI技术研报

6902 点击 2025-05-10 15:59

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

北大、清华、UvA、CMU等联合发布：大模型逻辑推理能力最新综述

当前大模型研究正逐步从依赖扩展定律（Scaling Law）的预训练，转向聚焦推理能力的后训练。鉴于符号逻辑推理的有效性与普遍性，提升大模型的逻辑推理能力成为解决幻觉问题的关键途径。

来自主题: AI技术研报

6787 点击 2025-05-08 10:50

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

研究揭示早融合架构在低计算预算下表现更优，训练效率更高。混合专家（MoE）技术让模型动态适应不同模态，显著提升性能，堪称多模态模型的秘密武器。

来自主题: AI技术研报

8990 点击 2025-05-06 14:41

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

后训练时代如何延续Scaling Law？这是你该读的LLM后训练综述

现如今，微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。

来自主题: AI技术研报

7355 点击 2025-05-02 14:03

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

最近，DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展（length scaling），通过强化学习（比如 PPO、GPRO）训练模型生成很长的推理链（CoT），并在奥数等高难度推理任务上取得了显著的效果提升。

来自主题: AI技术研报

5534 点击 2025-04-28 14:09

72B世界基座模型启动，小鹏的端到端智驾正在验证Scaling Laws

72B世界基座模型启动，小鹏的端到端智驾正在验证Scaling Laws

72B世界基座模型启动，小鹏的端到端智驾正在验证Scaling Laws

最近一段时间，各家新势力都在角力部署端到端的智能驾驶系统。

来自主题: AI资讯

7804 点击 2025-04-17 10:43

上一页当前第2页,共20页下一页