AI资讯新闻榜单内容搜索-deepseek

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: deepseek
业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

业内首次! 全面复现DeepSeek-R1-Zero数学代码能力,训练步数仅需其1/10

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明,大规模强化学习已成为一种极为有效的方法,能够激发大型语言模型(LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报
6572 点击    2025-04-23 14:04
142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

142页长文揭秘DeepSeek-R1「思维大脑」!开启全新「思维链学」研究

DeepSeek-R1是近年来推理模型领域的一颗新星,它不仅突破了传统LLM的局限,还开启了全新的研究方向「思维链学」(Thoughtology)。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程,揭示了其推理链的独特结构与优势,为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报
7764 点击    2025-04-22 18:59
DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制

DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制

DeepSeek-R1「内心世界」首次曝光!AI显微镜破解R1大脑,发现神秘推理机制

推理模型与普通大语言模型有何本质不同?它们为何会「胡言乱语」甚至「故意撒谎」?Goodfire最新发布的开源稀疏自编码器(SAEs),基于DeepSeek-R1模型,为我们提供了一把「AI显微镜」,窥探推理模型的内心世界。

来自主题: AI技术研报
5643 点击    2025-04-19 15:29
动摇美国AI战略根基,特朗普拟全面封杀DeepSeek:禁止美国用户访问,并限制采购英伟达芯片

动摇美国AI战略根基,特朗普拟全面封杀DeepSeek:禁止美国用户访问,并限制采购英伟达芯片

动摇美国AI战略根基,特朗普拟全面封杀DeepSeek:禁止美国用户访问,并限制采购英伟达芯片

据《纽约时报》报道,特朗普政府正考虑对中国AI公司DeepSeek实施新的限制措施,包括禁止其采购英伟达AI芯片,并可能限制美国用户访问其AI服务。这一举措是特朗普政府加速人工智能领域中美竞争战略的一部分。自DeepSeek以破坏性创新震撼硅谷与华尔街以来,美国政府内部已开始权衡多种应对方案,旨在限制中国获取美国核心技术、以及进入美国消费者市场的能力。

来自主题: AI资讯
7719 点击    2025-04-17 22:52
压力给到梁文锋

压力给到梁文锋

压力给到梁文锋

根据DeepSeek过往的产品更新周期来看,梁文锋的主场时间又快到了。

来自主题: AI资讯
5701 点击    2025-04-17 14:36
142页重磅,DeepSeek-R1的"甜蜜点",开创了一个崭新的研究领域“思维学”。 | 最新

142页重磅,DeepSeek-R1的"甜蜜点",开创了一个崭新的研究领域“思维学”。 | 最新

142页重磅,DeepSeek-R1的"甜蜜点",开创了一个崭新的研究领域“思维学”。 | 最新

这是一份142页的研究论文,本文深入解析了大型推理模型DeepSeek-R1如何通过"思考"解决问题。研究揭示了模型思维的结构化过程,以及每个问题都存在甜蜜点"最佳推理区间"的惊人发现。这标志着"思维学"这一新兴领域的诞生,为我们理解和优化AI推理能力提供了宝贵框架。

来自主题: AI技术研报
6775 点击    2025-04-17 14:26
SOTA自动绑骨开源框架来了!3D版DeepSeek-UniRig开源月大礼包持续开箱ing

SOTA自动绑骨开源框架来了!3D版DeepSeek-UniRig开源月大礼包持续开箱ing

SOTA自动绑骨开源框架来了!3D版DeepSeek-UniRig开源月大礼包持续开箱ing

面向3D生成,来自VAST和清华大学的自动绑骨框架开源了!3D内容创作领域正经历前所未有的爆发,无论是成熟的传统工作流,还是以VAST(Tripo)为代表的AI驱动生成工具的飞速发展,都体现了市场对高质量3D资产需求的日益激增

来自主题: AI资讯
6609 点击    2025-04-12 10:47
用思维干预直接干预LRM内部推理,三种方式实现DeepSeek-R1有效控制。 | 最新

用思维干预直接干预LRM内部推理,三种方式实现DeepSeek-R1有效控制。 | 最新

用思维干预直接干预LRM内部推理,三种方式实现DeepSeek-R1有效控制。 | 最新

推理增强型大语言模型LRM(如OpenAI的o1、DeepSeek R1和Google的Flash Thinking)通过在生成最终答案前显式生成中间推理步骤,在复杂问题解决方面展现了卓越性能。然而,对这类模型的控制仍主要依赖于传统的输入级操作,如提示工程(Prompt Engineering)等方法,而你可能已经发现这些方法存在局限性。

来自主题: AI技术研报
1584 点击    2025-04-08 08:50