AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: deepseek
刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

刚刚,DeepSeek首曝V3降成本秘诀!软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程,揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈,实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验,还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报
7182 点击    2025-05-15 17:12
超300家医院接入DeepSeek!清华专家顶刊文章:步子走得太快!

超300家医院接入DeepSeek!清华专家顶刊文章:步子走得太快!

超300家医院接入DeepSeek!清华专家顶刊文章:步子走得太快!

今年3月,DeepSeek迅速席卷全国医疗机构。据不完全统计,短短一个月内全国已经有 超300家 医院完成DeepSeek的本地部署,遍布北京、上海、安徽、四川、广东、河北、湖南、江苏等二十多个省市和自治区。

来自主题: AI资讯
8024 点击    2025-05-11 15:09
全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

全球首个,最接近原版DeepSeek开源复现来了!R1四个月狂飙26倍

近日,来自SGLang、英伟达等机构的联合团队发了一篇万字技术报告:短短4个月,他们就让DeepSeek-R1在H100上的性能提升了26倍,吞吐量已非常接近DeepSeek官博数据!

来自主题: AI技术研报
9011 点击    2025-05-09 12:55
DeepSeek致谢腾讯大模型网络提速技术方案贡献

DeepSeek致谢腾讯大模型网络提速技术方案贡献

DeepSeek致谢腾讯大模型网络提速技术方案贡献

最近,DeepSeek工程师在GitHub上高亮了来自腾讯的代码贡献,并用“huge speedup”介绍了这次性能提升。

来自主题: AI技术研报
4687 点击    2025-05-08 15:02
「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

「推理革命」爆发100天:DeepSeek-R1复现研究全揭秘!

本文深入梳理了围绕DeepSeek-R1展开的多项复现研究,系统解析了监督微调(SFT)、强化学习(RL)以及奖励机制、数据构建等关键技术细节。

来自主题: AI技术研报
5848 点击    2025-05-06 10:53
DeepSeek开源的文件系统,是如何提升大模型效率的?

DeepSeek开源的文件系统,是如何提升大模型效率的?

DeepSeek开源的文件系统,是如何提升大模型效率的?

在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高要求。

来自主题: AI技术研报
6089 点击    2025-05-04 17:35
全网都在等梁文锋

全网都在等梁文锋

全网都在等梁文锋

这组充满悬念的组合引发科技圈热议,业内普遍推测DeepSeek R2模型已进入发布倒计时。凤凰网科技从知情人士处获悉,目前网传信息的真实性含量很低。

来自主题: AI资讯
7163 点击    2025-05-02 14:27
DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek新数学模型刷爆记录!7B小模型自主发现671B模型不会的新技能

DeepSeek放大招!新模型专注数学定理证明,大幅刷新多项高难基准测试。在普特南测试上,新模型DeepSeek-Prover-V2直接把记录刷新到49道。目前的第一名在657道题中只做出10道题,为Kimi与AIME2024冠军团队Numina合作成果Kimina-Prover。

来自主题: AI技术研报
7720 点击    2025-05-01 22:52