AI资讯新闻榜单内容搜索-DeepSeek-R

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: DeepSeek-R

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

医疗幻觉率比DeepSeek低3倍，百川循证增强大模型横扫全球医学考试！

时隔两月，Baichuan-M2 Plus重磅出世！成为业内首个循证增强的医疗大模型，幻觉要比DeepSeek-R1低3倍，可信度比肩资深临床专家。新模型将「循证医学」理念深度融入训练和推理，通过首创「六源循证范式」，模拟人类医生思维，有效辨别不同层级医学证据、评估其可靠性，并在回答中优先引用高等级证据。

来自主题: AI资讯

7616 点击 2025-10-23 12:47

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

X上63万人围观的Traning-Free GRPO：把GRPO搬进上下文空间学习

年初的 DeepSeek-R1，带来了大模型强化学习（RL）的火爆。无论是数学推理、工具调用，还是多智能体协作，GRPO（Group Relative Policy Optimization）都成了最常见的 RL 算法。

来自主题: AI技术研报

5787 点击 2025-10-23 11:41

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

全新合成框架SOTA：强化学习当引擎，任务合成当燃料，蚂蚁港大联合出品

蚂蚁通用人工智能中心自然语言组联合香港大学自然语言组（后简称“团队”）推出PromptCoT 2.0，要在大模型下半场押注任务合成。实验表明，通过“强起点、强反馈”的自博弈式训练，PromptCoT 2.0可以让30B-A3B模型在一系列数学代码推理任务上实现新的SOTA结果，达到和DeepSeek-R1-0528, OpenAI o3, Gemini 2.5 Pro等相当的表现。

来自主题: AI技术研报

6903 点击 2025-10-01 17:12

等不来DeepSeek-R2的246天：梁文锋的“三重困境”与“三重挑战”

等不来DeepSeek-R2的246天：梁文锋的“三重困境”与“三重挑战”

等不来DeepSeek-R2的246天：梁文锋的“三重困境”与“三重挑战”

时间的流逝，正在成为DeepSeek最沉重的成本

来自主题: AI资讯

9885 点击 2025-09-24 10:28

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

浙江大学联合华为发布国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型

2025年9月18日，由浙江大学计算机科学与技术学院院长、区块链与数据安全全国重点实验室常务副主任任奎教授团队联合华为技术有限公司计算产品线共同研发的国内首个基于昇腾千卡算力平台的DeepSeek-R1-Safe基础大模型在“华为全联接大会2025”正式发布。

来自主题: AI技术研报

7121 点击 2025-09-20 13:05

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

您对“思维链”（Chain-of-Thought）肯定不陌生，从最早的GPT-o1到后来震惊世界的Deepseek-R1，它通过让模型输出详细的思考步骤，确实解决了许多复杂的推理问题。但您肯定也为它那冗长的输出、高昂的API费用和感人的延迟头疼过，这些在产品落地时都是实实在在的阻碍。

来自主题: AI技术研报

8344 点击 2025-09-05 10:22

DeepSeek-V3.1震撼发布，全球开源编程登顶！R1/V3首度合体，训练量暴增10倍

DeepSeek-V3.1震撼发布，全球开源编程登顶！R1/V3首度合体，训练量暴增10倍

DeepSeek-V3.1震撼发布，全球开源编程登顶！R1/V3首度合体，训练量暴增10倍

DeepSeek-V3.1官宣了，作为首款「混合推理」模型，将开启智能体新时代。新模型共有671B参数，编码实力碾压DeepSeek-R1、Claude 4 Opus，登顶编程开源第一。

来自主题: AI资讯

8200 点击 2025-08-22 11:52

混合数学编程逻辑数据，一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据，一次性提升AI多领域强化学习能力 | 上海AI Lab

混合数学编程逻辑数据，一次性提升AI多领域强化学习能力 | 上海AI Lab

近年来，AI大模型在数学计算、逻辑推理和代码生成领域的推理能力取得了显著突破。特别是DeepSeek-R1等先进模型的出现，可验证强化学习（RLVR）技术展现出强大的性能提升潜力。

来自主题: AI技术研报

6921 点击 2025-08-16 16:45

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

冗长响应缩减80%，DeepSeek GRPO获得颠覆性改进，微软GFPO问世

用过 DeepSeek-R1 等推理模型的人，大概都遇到过这种情况：一个稍微棘手的问题，模型像陷入沉思一样长篇大论地推下去，耗时耗算力，结果却未必靠谱。现在，我们或许有了解决方案。

来自主题: AI技术研报

6399 点击 2025-08-15 11:26

爆出！DeepSeek R2预计8月发布！R2为何一直不发，内部紧急发声

爆出！DeepSeek R2预计8月发布！R2为何一直不发，内部紧急发声

爆出！DeepSeek R2预计8月发布！R2为何一直不发，内部紧急发声

GPT-5刚发布没多久，DeepSeek-R2就快来了，好热闹的8月份！ DeepSeek预计将于8月发布其新一代旗舰模型DeepSeek-R2。

来自主题: AI资讯

8216 点击 2025-08-14 12:32

上一页当前第1页,共18页下一页