AI资讯新闻榜单内容搜索-GEM

DeepSeek开源通用矩阵乘法库，300行代码加速V3、R1，R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天（前两天报道见文末「相关阅读」）。今天开源的项目名叫 DeepGEMM，是一款支持密集型和专家混合（MoE）GEMM 的 FP8 GEMM 库，为 V3/R1 的训练和推理提供了支持，在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。

来自主题: AI资讯

9385 点击 2025-02-26 10:58

一文详解：DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天，带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型（MoE）计算，为 DeepSeek-V3/R1 的训练和推理提供强大支持，在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报

8784 点击 2025-02-26 10:46

字节调整AI部门Seed，刚从Gemini加盟的吴永辉成新负责人

多位接近字节的人士对硅星人透露，字节的AI核心部门Seed正在快速调整定位和调兵遣将。刚刚从谷歌加入字节跳动的AI大牛、参与了Gemini开发的Google Fellow吴永辉博士，将成为Seed新的负责人，替换原LLM团队及Seed总负责人朱文佳，团队内部正在梳理调整汇报关系。

来自主题: AI资讯

10241 点击 2025-02-22 10:26

谷歌超硬核教科书来了！Jeff Dean带货揭Gemini训练秘籍：在TPU上scaling

谷歌团队发布LLM硬核技术教科书，从「系统视图」揭秘LLM Scaling的神秘面纱。Jeff Dean强调书中藏着谷歌最强AI模型Gemini训练的更多信息。

来自主题: AI技术研报

11875 点击 2025-02-21 15:52

10年科学谜团，被谷歌“AI科学家”2天解决了

AI协作科学家在测试中提供了新颖的见解。

来自主题: AI技术研报

7155 点击 2025-02-21 09:04

AI无法攻克的235道谜题！让o1、Gemini 2.0 Flash Thinking集体挂零

Scale AI 等提出的新基准再次暴露了大语言模型的弱点。

来自主题: AI技术研报

10647 点击 2025-02-17 14:49

大模型都喜欢拍马屁，Gemini最能拍！斯坦福：这不安全、不可靠

问题挺严重，大模型说的话可不能全信。

来自主题: AI技术研报

7836 点击 2025-02-15 16:20

Gemini再度“破防”！长期记忆被黑客篡改，方法竟和一年前如出一辙

Gemini的提示词注入防线，又被黑客给攻破了。

来自主题: AI资讯

9030 点击 2025-02-14 13:03

小红书&上交多模态大模型新基准，Gemini 1.5 Pro准确率仅48%

多模态大模型理解真实世界的水平到底如何？

来自主题: AI技术研报

6287 点击 2025-02-13 09:49

8卡32B模型超越o1预览版、DeepSeek V3，普林斯顿、北大提出层次化RL推理新范式

推理大语言模型（LLM），如 OpenAI 的 o1 系列、Google 的 Gemini、DeepSeek 和 Qwen-QwQ 等，通过模拟人类推理过程，在多个专业领域已超越人类专家，并通过延长推理时间提高准确性。推理模型的核心技术包括强化学习（Reinforcement Learning）和推理规模（Inference scaling）。

来自主题: AI技术研报

7376 点击 2025-02-12 11:33