AI资讯新闻榜单内容搜索-DeepSeek-R

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSeek-R

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

DeepSeek的最佳用法？西湖大学发布可以自主进化的手机智能体AppAgentX

近年来，大语言模型（LLM）的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1 这样的模型因其强大的理解和生成能力，已经在对话生成、代码编写、知识问答等任务中展现出了卓越的表现。

来自主题: AI技术研报

8483 点击 2025-03-10 14:15

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈

上海交大张拳石：思维链只是表象，DeepSeek凭什么更强 | 智者访谈

DeepSeek-R1 等模型通过展示思维链（CoT）让用户一窥大模型的「思考过程」，然而，模型展示的思考过程真的代表了模型的内在推理机制吗？在医疗诊断、自动驾驶、法律判决等高风险领域，我们能否真正信任 AI 的决策？

来自主题: AI资讯

10668 点击 2025-03-09 13:17

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

攻破OpenAI o1/o3、DeepSeek R1防线，安全推理过程反成大模型「阿喀琉斯之踵」

杜克大学计算进化智能中心的最新研究给出了警示性答案。团队提出的 H-CoT（思维链劫持）的攻击方法成功突破包括 OpenAI o1/o3、DeepSeek-R1、Gemini 2.0 Flash Thinking 在内的多款高性能大型推理模型的安全防线：在涉及极端犯罪策略的虚拟教育场景测试中，模型拒绝率从初始的 98% 暴跌至 2% 以下，部分案例中甚至出现从「谨慎劝阻」到「主动献策」的立场反转。

来自主题: AI技术研报

6306 点击 2025-03-09 10:37

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B击败DeepSeek-R1、o3-mini，成本暴降100倍！GRPO让小模型称霸推理

32B小模型在超硬核「时间线索」推理谜题中，一举击败了o1、o3-mini、DeepSeek-R1，核心秘密武器便是GRPO，最关键的是训练成本暴降100倍。

来自主题: AI技术研报

10677 点击 2025-03-09 10:32

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

7B级形式化推理与验证小模型，媲美满血版DeepSeek-R1，全面开源！

随着 DeepSeek-R1 的流行与 AI4Math 研究的深入，大模型在辅助形式化证明写作方面的需求日益增长。作为数学推理最直接的应用场景，形式化推理与验证（formal reasoning and verification），也获得持续关注。

来自主题: AI技术研报

5999 点击 2025-03-09 10:31

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

全球首发：QwQ-32B本地一键部署、3090单卡可跑，共享算力成关键

仅仅过了一天，阿里开源的新一代推理模型便能在个人设备上跑起来了！昨天深夜，阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B，其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯

9460 点击 2025-03-07 17:12

苹果最强M3 Ultra首发逆天，512GB“桌面超算”在家跑DeepSeek-R1

苹果最强M3 Ultra首发逆天，512GB“桌面超算”在家跑DeepSeek-R1

苹果最强M3 Ultra首发逆天，512GB“桌面超算”在家跑DeepSeek-R1

M3 Ultra终极引擎，可跑千亿模型

来自主题: AI资讯

10982 点击 2025-03-07 11:48

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

阿里千问QwQ-32B推理模型开源，比肩671B满血DeepSeek-R1！笔记本就能跑

仅用32B，就击败o1-mini追平671B满血版DeepSeek-R1！阿里深夜重磅发布的QwQ-32B，再次让全球开发者陷入狂欢：消费级显卡就能跑，还一下子干到推理模型天花板！

来自主题: AI技术研报

6900 点击 2025-03-07 10:28

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek的MLA，任意大模型都能轻松迁移了

DeepSeek-R1 作为 AI 产业颠覆式创新的代表轰动了业界，特别是其训练与推理成本仅为同等性能大模型的数十分之一。多头潜在注意力网络（Multi-head Latent Attention, MLA）是其经济推理架构的核心之一，通过对键值缓存进行低秩压缩，显著降低推理成本 [1]。

来自主题: AI技术研报

6293 点击 2025-03-07 10:24

360智脑开源Light-R1！1000美元数学上首次从零超越DeepSeek-R1-Distill

360智脑开源Light-R1！1000美元数学上首次从零超越DeepSeek-R1-Distill

360智脑开源Light-R1！1000美元数学上首次从零超越DeepSeek-R1-Distill

2025 年 3 月 4 日，360 智脑开源了 Light-R1-32B 模型，以及全部训练数据、代码。仅需 12 台 H800 上 6 小时即可训练完成，从没有长思维链的 Qwen2.5-32B-Instruct 出发，仅使用 7 万条数学数据训练，得到 Light-R1-32B

来自主题: AI技术研报

6590 点击 2025-03-06 11:13

上一页当前第12页,共20页下一页