AI资讯新闻榜单内容搜索-大模型

马斯克也拥抱C语言了！大模型训练堆栈抛弃JAX，提速一个数量级

不用JAX，SpaceX正在用C语言编写的全新堆栈训练新模型。而且马斯克本人亲口承认，Grok 5已经用的就是这个新堆栈。按马斯克的说法，这种新堆栈能让大模型训练速度提升一个数量级。

来自主题: AI资讯

7942 点击 2026-05-29 15:10

网上有条帖子炸了，稳定复现，通过 API 问 Claude Opus 4.8 你是什么模型。回答是：Qwen，或者 DeepSeek。重要的事说三遍：必须是通过 API，必须是通过 API，必须是通过 API。因为网页端有系统提示词，会做二次处理。

来自主题: AI资讯

9972 点击 2026-05-29 13:04

2026 年初，国内具身智能赛道掀起了一波开源潮，越来越多团队开始公开自己的视觉-语言-动作（VLA）模型、数据集与训练框架。与此同时，行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上，尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报

8566 点击 2026-05-29 09:19

7×24，AI也吃不消。

来自主题: AI技术研报

7859 点击 2026-05-29 09:19

过去的大模型 scaling law 通常回答的是：当模型参数量、数据量和训练计算量增加后，loss 会如何下降。

来自主题: AI技术研报

7009 点击 2026-05-29 09:19

有一个我们很少说出口的预设：AI 带来的恐慌是从下往上递减的。越底层越慌，越顶层越从容。应届生最危险，大厂高管有把握，基础模型公司的人？他们是在写未来，不是在应对它。

来自主题: AI资讯

8538 点击 2026-05-29 09:18

从数学、代码、复杂推理，到多轮工具调用，大模型的很多能力的提升都离不开 RL 后训练。但当模型规模进入 MoE 万亿参数级别之后，RL 不再只是一个算法问题，同时更加是一个系统问题。

来自主题: AI技术研报

7507 点击 2026-05-28 14:51

相信大家都有过这样的体验：同一个系列的模型，使用文本交互的时候，模型就像开启了 “最强大脑”，数学代码等各种复杂推理任务样样精通，可是一旦将其改造成语音对话模型之后，性能就猛烈下降，严重 “降智”，经常会犯很多基本的逻辑错误。

来自主题: AI技术研报

6252 点击 2026-05-28 14:51

当下视频生成模型正在快速逼近真实世界的画面质感，但一个现实瓶颈也越来越突出—— 那就是分辨率越高，生成所需要的时间就越长。

来自主题: AI技术研报

8243 点击 2026-05-28 14:50

大模型进入自动驾驶后，最直接的价值在于场景理解。它可以识别前车是否准备并线、行人是否可能横穿、施工区域是否会影响车道，也可以分析复杂路口中的让行关系。

来自主题: AI技术研报

10449 点击 2026-05-28 14:50