AI资讯新闻榜单内容搜索-deepseek

从思考到行动：大模型自主工具调用能力的深度实现

GPT - 4o、Deepseek - R1 等高级模型已展现出令人惊叹的「深度思考」能力：理解上下文关联、拆解多步骤问题、甚至通过思维链（Chain - of - Thought）进行自我验证、自我反思等推理过程。

来自主题: AI技术研报

7307 点击 2025-04-17 10:00

刚刚，微信首个 AI 助手上线！为了抢流量，直接把元宝放微信对话里了！

继接入 DeepSeek 后，APPSO 发现名为「元宝」的 AI 助手目前已经正式入驻微信。现在，你可以在微信框搜索「元宝」，亦或者直接扫描二维码图片，将其添加到通讯录，即可与它展开对话。

来自主题: AI资讯

11382 点击 2025-04-16 20:34

对话猿辅导集团副总裁王向东：DeepSeek 之后，AI 学习机应该怎么做？

2024 年，是学习平板这个品类集中爆发的一年。

来自主题: AI资讯

8723 点击 2025-04-16 15:31

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

近年来，大模型（Large Language Models, LLMs）在数学、编程等复杂任务上取得突破，OpenAI-o1、DeepSeek-R1 等推理大模型（Reasoning Large Language Models，RLLMs）表现尤为亮眼。但它们为何如此强大呢？

来自主题: AI技术研报

9474 点击 2025-04-16 15:00

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了？

来自主题: AI资讯

6935 点击 2025-04-15 15:05

榨干3000元显卡，跑通千亿级大模型的秘方来了

书接上回，用几块3000元显卡作为加速主力的一体机，就能跑通671B的DeepSeek。

来自主题: AI资讯

7203 点击 2025-04-15 10:15

过程奖励模型也可以测试时扩展？清华、上海AI Lab 23K数据让1.5B小模型逆袭GPT-4o

随着 OpenAI o1 和 DeepSeek R1 的爆火，大语言模型（LLM）的推理能力增强和测试时扩展（TTS）受到广泛关注。然而，在复杂推理问题中，如何精准评估模型每一步回答的质量，仍然是一个亟待解决的难题。传统的过程奖励模型（PRM）虽能验证推理步骤，但受限于标量评分机制，难以捕捉深层逻辑错误，且其判别式建模方式限制了测试时的拓展能力。

来自主题: AI技术研报

8607 点击 2025-04-14 14:39