AI资讯新闻榜单内容搜索-Deep

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Deep

刚刚，Gemini 2.5 Pro升级，成编程模型新王

刚刚，Gemini 2.5 Pro升级，成编程模型新王

刚刚，Gemini 2.5 Pro升级，成编程模型新王

你的默认编程模型是什么？或许可以换一换了。刚刚，Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本：Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升，不仅在 LMArena 编程排行榜上名列第一，同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸

来自主题: AI资讯

11655 点击 2025-05-07 09:22

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

超越DeepSeek-R1，英伟达开源新王登顶！14万H100小时训练细节全曝光

超越DeepSeek-R1的英伟达开源新王Llama-Nemotron，是怎么训练出来的？刚刚放出的论文，把一切细节毫无保留地全部揭秘了！

来自主题: AI技术研报

10154 点击 2025-05-06 17:08

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

VDC+VBench双榜第一！强化学习打磨的国产视频大模型，超越Sora、Pika

随着 Deepseek 等强推理模型的成功，强化学习在大语言模型训练中越来越重要，但在视频生成领域缺少探索。复旦大学等机构将强化学习引入到视频生成领域，经过强化学习优化的视频生成模型，生成效果更加自然流畅，更加合理。并且分别在 VDC（Video Detailed Captioning）[1] 和 VBench [2] 两大国际权威榜单中斩获第一。

来自主题: AI技术研报

11202 点击 2025-05-06 15:07

「推理革命」爆发100天：DeepSeek-R1复现研究全揭秘！

「推理革命」爆发100天：DeepSeek-R1复现研究全揭秘！

「推理革命」爆发100天：DeepSeek-R1复现研究全揭秘！

本文深入梳理了围绕DeepSeek-R1展开的多项复现研究，系统解析了监督微调（SFT）、强化学习（RL）以及奖励机制、数据构建等关键技术细节。

来自主题: AI技术研报

8371 点击 2025-05-06 10:53

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

谷歌DeepMind：大模型也很任性，知道最优路径偏要撞南墙

该研究对 LLM 常见的失败模式贪婪性、频率偏差和知 - 行差距，进行了深入研究。

来自主题: AI技术研报

9318 点击 2025-05-06 09:23

DeepSeek开源的文件系统，是如何提升大模型效率的？

DeepSeek开源的文件系统，是如何提升大模型效率的？

DeepSeek开源的文件系统，是如何提升大模型效率的？

在 AI 领域里，大模型通常具有百亿甚至数千亿参数，训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。

来自主题: AI技术研报

8448 点击 2025-05-04 17:35

只要9美元！LoRA+强化学习，DeepSeek 1.5B推理性能暴涨20%

只要9美元！LoRA+强化学习，DeepSeek 1.5B推理性能暴涨20%

只要9美元！LoRA+强化学习，DeepSeek 1.5B推理性能暴涨20%

南加州大学团队只用9美元，就能在数学基准测试AIME 24上实现超过20%的推理性能提升，效果好得离谱！而其核心技术只需LoRA+强化学习，用极简路径实现超高性价比后训练。

来自主题: AI技术研报

9659 点击 2025-05-02 19:57

全网都在等梁文锋

全网都在等梁文锋

全网都在等梁文锋

这组充满悬念的组合引发科技圈热议，业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉，目前网传信息的真实性含量很低。

来自主题: AI资讯

9287 点击 2025-05-02 14:27

Anthropic Claude 发布 Advanced Research：进入你的真实世界使用私域数据进行智能协作

Anthropic Claude 发布 Advanced Research：进入你的真实世界使用私域数据进行智能协作

Anthropic Claude 发布 Advanced Research：进入你的真实世界使用私域数据进行智能协作

Anthropic 刚推出了 Integrations 和 Advanced Research 模式更新。这不仅是 Claude 在 DeepResearch 发展历程中的关键里程碑，更是 AI 协作和研究领域的一次重大飞跃

来自主题: AI资讯

11982 点击 2025-05-02 11:32

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录！7B小模型自主发现671B模型不会的新技能

DeepSeek放大招！新模型专注数学定理证明，大幅刷新多项高难基准测试。在普特南测试上，新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题，为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。

来自主题: AI技术研报

10570 点击 2025-05-01 22:52

上一页当前第89页,共187页下一页