AI资讯新闻榜单内容搜索-R1

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: R1

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

只用5%的参数，数学和代码能力竟然超越满血DeepSeek？

来自主题: AI资讯

7998 点击 2025-05-27 12:45

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

CoT推理大溃败？哈佛华人揭秘：LLM一思考，立刻就「失智」

DeepSeek-R1火了，推理模型火了，思维链（Chain-of-Thought，CoT）火了！

来自主题: AI技术研报

7456 点击 2025-05-21 15:28

DeepSeek们越来越聪明，却也越来越不听话了。

DeepSeek们越来越聪明，却也越来越不听话了。

DeepSeek们越来越聪明，却也越来越不听话了。

在今年，DeepSeek R1火了之后。

来自主题: AI资讯

5958 点击 2025-05-20 10:44

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

可靠的Agent该用哪个模型，LLM多轮对话中的「迷失」现象 |微软最新

微软最近与Salesforce Research联合发布了一篇名为《Lost in Conversation》的研究，说当前最先进的LLM在多轮对话中表现会大幅下降，平均降幅高达39%。这一现象被称为对话中的"迷失"。文章分析了各大模型（包括Claude 3.7-Sonnet、Deepseek-R1等）在多轮对话中的表现差异，还解析了模型"迷失"的根本原因及有效缓解策略。

来自主题: AI技术研报

7147 点击 2025-05-20 10:16

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达官宣新办公室落户中国台湾省台北市，但居然是从太空飞下来的吗？

来自主题: AI资讯

7082 点击 2025-05-19 17:31

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

「边思考、边搜索、边写作」WebThinker开启AI搜索&研究新纪元！

大型推理模型（如 OpenAI-o1、DeepSeek-R1）展现了强大的推理能力，但其静态知识限制了在复杂知识密集型任务及全面报告生成中的表现。为应对此挑战，深度研究智能体 WebThinker 赋予 LRM 在推理中自主搜索网络、导航网页及撰写报告的能力。

来自主题: AI技术研报

6073 点击 2025-05-16 11:04

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

超越OpenAI、ElevenLabs，MiniMax新一代语音模型屠榜！人格化语音时代来了

国产大模型进步的速度早已大大超出了人们的预期。年初 DeepSeek-R1 爆火，以超低的成本实现了部分超越 OpenAI o1 的表现，一定程度上让人不再过度「迷信」国外大模型。

来自主题: AI技术研报

8112 点击 2025-05-16 09:59

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

刚刚，DeepSeek首曝V3降成本秘诀！软硬协同突破Scaling天花板

DeepSeek最新论文深入剖析了V3/R1的开发历程，揭示了硬件与大语言模型架构协同设计的核心奥秘。论文展示了如何突破内存、计算和通信瓶颈，实现低成本、高效率的大规模AI训练与推理。不仅总结了实践经验，还为未来AI硬件与模型协同设计提出了建议。

来自主题: AI技术研报

7506 点击 2025-05-15 17:12

DanceGRPO：首个统一视觉生成的强化学习框架

DanceGRPO：首个统一视觉生成的强化学习框架

DanceGRPO：首个统一视觉生成的强化学习框架

R1 横空出世，带火了 GRPO 算法，RL 也随之成为 2025 年的热门技术探索方向，近期，字节 Seed 团队就在图像生成方向进行了相关探索。

来自主题: AI技术研报

7137 点击 2025-05-15 10:47

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

全球闲置算力训个模型，性能媲美R1，老黄天塌了！Karpathy曾投资它

一夜之间，老黄天塌了（doge）。

来自主题: AI技术研报

7989 点击 2025-05-13 15:30

上一页当前第7页,共33页下一页