AI资讯新闻榜单内容搜索-模型

首个系统性工具使用奖励范式，ToolRL刷新大模型训练思路

「工欲善其事，必先利其器。」如今，人工智能正以前所未有的速度革新人类认知的边界，而工具的高效应用已成为衡量人工智能真正智慧的关键标准。

来自主题: AI技术研报

7600 点击 2025-04-28 14:53

字节Seed团队PHD-Transformer突破预训练长度扩展！破解KV缓存膨胀难题

最近，DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展（length scaling），通过强化学习（比如 PPO、GPRO）训练模型生成很长的推理链（CoT），并在奥数等高难度推理任务上取得了显著的效果提升。

来自主题: AI技术研报

7957 点击 2025-04-28 14:09

国内最早的AI大模型公司已经开始亏损了

4月25日，昆仑万维发布最新财报，2024年营收56.62亿元，同比增长15.2%，净利润亏损15.95亿元，同比下跌226.8%。这也是上市十年，昆仑万维首度亏损的一年。

来自主题: AI资讯

9305 点击 2025-04-28 09:55

不到2年，AI PPT赛道第一！像素绽放CEO赵充：今年是AI应用创业最佳时期 | 中国AIGC产业峰会

赵充是像素绽放PixelBloom(AiPPT.com) CEO，旗下产品AiPPT.com自2023年8月上线以来，已经积累2000多万用户，是大模型趋势中表现最亮眼的AI产品之一。

来自主题: AI资讯

10408 点击 2025-04-28 09:27

OpenAI没说的秘密，Meta全揭了？华人一作GPT-4o同款技术，爆打扩散王者

自回归模型，首次生成2048×2048分辨率图像！来自Meta、西北大学、新加坡国立大学等机构的研究人员，专门为多模态大语言模型（MLLMs）设计的TokenShuffle，显著减少了计算中的视觉Token数量，提升效率并支持高分辨率图像合成。

来自主题: AI技术研报

9931 点击 2025-04-28 09:16

70%大小，100%准确！完美压缩LLM性能0损失，推理速度最高飙升39倍

LLM的规模爆炸式增长，传统量化技术虽能压缩模型，却以牺牲精度为代价。莱斯大学团队的最新研究DFloat11打破这一僵局：它将模型压缩30%且输出与原始模型逐位一致！更惊艳的是，通过针对GPU的定制化解压缩内核，DFloat11使推理吞吐量提升最高38.8倍。

来自主题: AI技术研报

9358 点击 2025-04-28 09:05

AI对战略咨询公司的影响，及其应对（以麦肯锡、BCG 为例）

自 OpenAI 发布 chatgpt 以来，业内除了技术公司、媒体公司比较关注其进展以外，还有一个行业比较关注，那就是战略咨询行业。尤其是最近 GPT-4o、Claude 3.7 Sonnet 为代表的最新大模型在数据分析、内容生成、编码和复杂推理方面展现出强大能力，与战略咨询工作的核心环节高度相关。

来自主题: AI资讯

11062 点击 2025-04-28 08:58