AI资讯新闻榜单内容搜索-deepseek-r

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: deepseek-r
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。

来自主题: AI技术研报
5608 点击    2025-02-07 16:53
华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。在那个瞬间,模型学会了自我反思等涌现技能,帮助它进行上下文搜索,从而解决复杂的推理问题。

来自主题: AI技术研报
7678 点击    2025-02-07 15:51
再上新|来国家超算互联网DeepSeek一下!

再上新|来国家超算互联网DeepSeek一下!

再上新|来国家超算互联网DeepSeek一下!

DeepSeek-R1因其游刃有余的用户需求响应能力,尤其是其独特的“深度思考(DeepThink)”模式及卓越的推理能力,在这个春天绝响全球。为了让更多领域的用户切实便捷地开展体验,超算互联网平台第一时间上线了DeepSeek Chatbot可视化界面功能。

来自主题: AI资讯
9512 点击    2025-02-05 14:05
我们用DeepSeek分析迅雷5亿收购虎扑,结果……

我们用DeepSeek分析迅雷5亿收购虎扑,结果……

我们用DeepSeek分析迅雷5亿收购虎扑,结果……

DeepSeek、迅雷、虎扑其实都在思考同一个问题:数字时代发展到当下,科技行业应该何去何从?龙年年底,科技界和体育界分别迎来两宗大事件——2025年1月20日,DeepSeek-R1开源人工智能模型发布;2025年1月27日,迅雷宣布作价5亿元人民币收购体育媒体及数据平台虎扑。

来自主题: AI资讯
5611 点击    2025-01-29 14:20
DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

DeepSeek-R1持续震撼硅谷:跻身竞技榜前三,创始人梁文锋采访被“拿放大镜”看

“神秘东方力量”DeepSeek给硅谷带来的影响,还在不断泛起涟漪——刚刚,DeepSeek-R1跻身大模型竞技榜前三。以开源、便宜20倍的“身价”与ChatGPT-4o(2024.11.20)并列。

来自主题: AI资讯
7610 点击    2025-01-26 11:44
最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版

最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版

最壕DeepSeek玩家8台Mac跑R1,10万+元凑496GB显存才能跑4bit量化版

DeepSeek-R1,正在接受全球网友真金白银的检验。花30秒用manim代码制作解释勾股定理的动画,一次完成无错误。为了玩上这样的模型,有人花上10多万元,组7台M4 Pro Mac mini+1台M4 Max Macbook Pro的家用超算。

来自主题: AI资讯
7311 点击    2025-01-22 18:45
DeepSeek-R1 是怎么训练的|深度拆解

DeepSeek-R1 是怎么训练的|深度拆解

DeepSeek-R1 是怎么训练的|深度拆解

昨天晚上,DeepSeek 又开源了 DeepSeek-R1 模型(后简称 R1),再次炸翻了中美互联网: R1 遵循 MIT License,允许用户通过蒸馏技术借助 R1 训练其他模型。 R1 上线 API,对用户开放思维链输出 R1 在数学、代码、自然语言推理等任务上,性能比肩 OpenAI o1 正式版,小模型则超越 OpenAI o1-mini

来自主题: AI技术研报
18374 点击    2025-01-21 13:15
DeepSeek 推理模型预览版上线,解密 o1 推理过程

DeepSeek 推理模型预览版上线,解密 o1 推理过程

DeepSeek 推理模型预览版上线,解密 o1 推理过程

今天,DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。所有用户均可登录官方网页 (chat.deepseek.com),一键开启与 R1-Lite 预览版模型的超强推理对话体验。DeepSeek R1 系列模型使用强化学习训练,推理过程包含大量反思和验证,思维链长度可达数万字。

来自主题: AI资讯
9852 点击    2024-11-20 23:11