AI资讯新闻榜单内容搜索-LLM

校准LLM元认知能力，Agent才能清晰地向用户传达不确定性 | 重要

随着大型语言模型（LLMs）日益融入关键决策场景，其元认知能力——即识别、评估和表达自身知识边界的能力——变得尤为重要。

来自主题: AI技术研报

5914 点击 2025-04-26 13:57

AI是否能像人类一样感受世界？Anthropic最新研究揭示AI幸福感的可能性，科学家们却为此吵翻天。Anthropic专家大胆预测：Claude可能已有15%概率具有意识，五年后或将突飞猛进！

来自主题: AI资讯

7245 点击 2025-04-25 16:13

上一篇文章聊了聊 Tool、MCP 和 Agent 三者之间的关系。简单来说就是 Agent = LLM + Tools，而 MCP 统一了 Tools 开发和使用的过程。

来自主题: AI技术研报

6376 点击 2025-04-24 20:44

RL + LLM 升级之路的四层阶梯。

来自主题: AI技术研报

7953 点击 2025-04-24 18:21

在大语言模型（LLMs）竞争日趋白热化的今天，「推理能力」已成为评判模型优劣的关键指标。

来自主题: AI技术研报

6387 点击 2025-04-24 14:29

o3病毒学能力击败了94%博士级专家，准确率高达43.8%。多家研究机构联手，通过VCT测试揭示，顶尖LLM不仅能解决复杂实验难题，直接拉低了生物武器制造门槛。

来自主题: AI资讯

7880 点击 2025-04-24 08:40

OpenAI 的 o1 系列和 DeepSeek-R1 的成功充分证明，大规模强化学习已成为一种极为有效的方法，能够激发大型语言模型（LLM) 的复杂推理行为并显著提升其能力。

来自主题: AI技术研报

6811 点击 2025-04-23 14:04

Transformer作者Ashish Vaswani团队重磅LLM研究！简单指令：「Wait，」就能有效激发LLM显式反思，表现堪比直接告知模型存在错误。

来自主题: AI技术研报

6988 点击 2025-04-23 10:47

DeepSeek-R1是近年来推理模型领域的一颗新星，它不仅突破了传统LLM的局限，还开启了全新的研究方向「思维链学」（Thoughtology）。这份长达142页的报告深入剖析了DeepSeek-R1的推理过程，揭示了其推理链的独特结构与优势，为未来推理模型的优化提供了重要启示。

来自主题: AI技术研报

8023 点击 2025-04-22 18:59

论文的第一作者是香港中文大学（深圳）数据科学学院三年级博士生徐俊杰龙，指导老师为香港中文大学（深圳）数据科学学院的贺品嘉教授和微软主管研究员何世林博士。贺品嘉老师团队的研究重点是软件工程、LLM for DevOps、大模型安全。

来自主题: AI技术研报

5738 点击 2025-04-22 17:58