AI资讯新闻榜单内容搜索-R1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: R1
万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点。

万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点。

万物皆可接入DeepSeek,44家接入R1的国产平台超详细大盘点。

我前几天也一直在写DeepSeek的使用教程,想选出尽量最简单最好上手的方式让大家都能舒服的体验这波热潮。但是我发现,自第一天干崩硅基流动、第二天干崩秘塔AI搜索后,涌现出来的三方平台越来越多了,写不完,根本写不完。

来自主题: AI资讯
8159 点击    2025-02-10 16:45
o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

o3-mini数学推理暴打DeepSeek-R1?AIME 2025初赛曝数据集污染大瓜

就在刚刚,AIME 2025 I数学竞赛的大模型参赛结果出炉,o3-mini取得78%的最好成绩,DeepSeek R1拿到了65%,取得第四名。然而一位教授却发现,某些1.5B小模型竟也能拿到50%,莫非真的存在数据集污染?

来自主题: AI资讯
8449 点击    2025-02-10 11:21
国运级的创新?从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

国运级的创新?从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

国运级的创新?从 DeepSeek-V3 到 R1 的架构创新与误传的万字长文分析

DeepSeek 的最新模型 DeepSeek-V3 和 DeepSeek-R1 都属于 MoE(混合专家)架构,并在开源世界产生了较大的影响力。特别是 2025 年 1 月开源的 DeepSeek-R1,模型性能可挑战 OpenAI 闭源的 o1 模型。

来自主题: AI资讯
9871 点击    2025-02-09 22:14
DeepSeek流量超Gemini登顶全球第二!马斯克挟xAI更强模型宣战

DeepSeek流量超Gemini登顶全球第二!马斯克挟xAI更强模型宣战

DeepSeek流量超Gemini登顶全球第二!马斯克挟xAI更强模型宣战

DeepSeek火的一塌糊涂,其访问量暴涨614%,已成全球第二大爆火应用。马斯克剧透,xAI将发布比R1更好的模型。

来自主题: AI资讯
6938 点击    2025-02-09 21:38
DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星

DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星

DeepSeek-R1推理本地跑,7GB GPU体验啊哈时刻?GRPO内存暴降,GitHub超2万星

黑科技来了!开源LLM微调神器Unsloth近期更新,将GRPO训练的内存使用减少了80%!只需7GB VRAM,本地就能体验AI「啊哈时刻」。

来自主题: AI资讯
8340 点击    2025-02-09 21:29
腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

腾讯云X DeepSeek:API调用+联网搜索,分钟打造企业级 AI 应用

刚刚,腾讯云再放大招——不仅上线了 DeepSeek-R1 和 V3 原版模型的 API 接口,还将它们接入了大模型知识引擎,并支持联网搜索,成为国内率先实现这一能力的云厂商。

来自主题: AI资讯
7341 点击    2025-02-08 17:25
昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

昆仑万维旗下天工AI正式上线DeepSeek R1+联网搜索

2月8日,昆仑万维旗下「天工AI」正式推出PC版重大更新——上线“DeepSeek R1 + 联网搜索”功能。这一全新升级,不仅解决了用户长期以来关注的DeepSeek联网功能无法使用的问题,还优化了R1版本偶尔崩溃的困扰,为用户带来更加稳定、高效、智能的AI体验。

来自主题: AI资讯
7275 点击    2025-02-08 17:20
DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

DeepSeek R1 Zero中文复现教程来了!

各位同学好,我是来自 Unlock-DeepSeek 开源项目团队的骆师傅。先说结论,我们(Datawhale X 似然实验室)使用 3 张 A800(80G) 计算卡,花了 20 小时训练时间,做出了可能是国内首批 DeepSeek R1 Zero 的中文复现版本,我们把它叫做 Datawhale-R1,用于 R1 Zero 复现教学。

来自主题: AI技术研报
8541 点击    2025-02-07 17:54
钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹

钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹

钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹

阿里系第一个吃上DeepSeek“螃蟹”的出现了——钉钉:已经全面接入DeepSeek系列模型。现在,用户在钉钉上创建AI助理的时候,可以直接选择DeepSeek系列的R1、V3等三种模型!

来自主题: AI资讯
6927 点击    2025-02-07 17:06
DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

DeepSeek用的GRPO占用大量内存?有人给出了些破解方法

自 DeepSeek-R1 发布以来,群组相对策略优化(GRPO)因其有效性和易于训练而成为大型语言模型强化学习的热门话题。R1 论文展示了如何使用 GRPO 从遵循 LLM(DeepSeek-v3)的基本指令转变为推理模型(DeepSeek-R1)。

来自主题: AI技术研报
5949 点击    2025-02-07 16:53