AI资讯新闻榜单内容搜索-思维链

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 思维链

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

田渊栋团队论文火了！连续思维链优于CoT，打开LLM推理新范式

一般而言，LLM 被限制在语言空间（language space）内进行推理，并通过思维链（CoT）来表达推理过程，从而解决复杂的推理问题。

来自主题: AI技术研报

7191 点击 2024-12-12 10:19

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

数字比你想得更复杂——一文带你了解大模型数字处理能力的方方面面

目前大语言模型（Large Language Models, LLMs）的推理能力备受关注。从思维链（Chain of Thought，CoT）技术提出，到以 o1 为代表的长思考模型发布，大模型正在展现出接近人类甚至领域专家的水平，其中数学推理是一个典型任务。

来自主题: AI技术研报

8050 点击 2024-12-12 10:06

TypedThinker框架，多维度推理Prompt让LLM推理更精准，卡梅隆和Qwen团队最新

TypedThinker框架，多维度推理Prompt让LLM推理更精准，卡梅隆和Qwen团队最新

TypedThinker框架，多维度推理Prompt让LLM推理更精准，卡梅隆和Qwen团队最新

大语言模型（LLMs）在推理任务上展现出了令人瞩目的能力，但其推理思维方式的单一性一直是制约性能提升的关键瓶颈。目前的研究主要关注如何通过思维链（Chain-of-Thought）等方法来提升推理的质量，却忽视了一个重要维度——推理类型的多样性。

来自主题: AI技术研报

8547 点击 2024-12-11 10:16

DeepSeek 推理模型预览版上线，解密 o1 推理过程

DeepSeek 推理模型预览版上线，解密 o1 推理过程

DeepSeek 推理模型预览版上线，解密 o1 推理过程

今天，DeepSeek 全新研发的推理模型 DeepSeek-R1-Lite 预览版正式上线。所有用户均可登录官方网页（chat.deepseek.com），一键开启与 R1-Lite 预览版模型的超强推理对话体验。DeepSeek R1 系列模型使用强化学习训练，推理过程包含大量反思和验证，思维链长度可达数万字。

来自主题: AI资讯

10669 点击 2024-11-20 23:11

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

北大等发布多模态版o1！首个慢思考VLM将开源，视觉推理超越闭源模型

北大等出品，首个多模态版o1开源模型来了—— 代号LLaVA-o1，基于Llama-3.2-Vision模型打造，超越传统思维链提示，实现自主“慢思考”推理。在多模态推理基准测试中，LLaVA-o1超越其基础模型8.9%，并在性能上超越了一众开闭源模型。

来自主题: AI技术研报

6206 点击 2024-11-19 21:01

17岁高中生写了个神级Prompt，直接把Claude强化成了满血o1。

17岁高中生写了个神级Prompt，直接把Claude强化成了满血o1。

17岁高中生写了个神级Prompt，直接把Claude强化成了满血o1。

这两天，我被这个Claude3.5这个神级Prompt惊呆了。佩服的五体投地。非常简单的话说，就是它用Prompt把o1级别的思维链，复刻到了Claude3.5里，而且思考逻辑更详细、更像人，甚至思考过程都跟o1一样，可以展开折叠。

来自主题: AI资讯

8483 点击 2024-11-15 20:28

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

深度揭秘CoT！普林斯顿耶鲁发布最新报告：大模型既有记忆推理、也有概率推理

研究人员通过案例研究，利用大型语言模型（LLMs）如GPT-4、Claude 3和Llama 3.1，探索了思维链（CoT）提示在解码移位密码任务中的表现；CoT提示虽然提升了模型的推理能力，但这种能力并非纯粹的符号推理，而是结合了记忆和概率推理的复杂过程。

来自主题: AI技术研报

3775 点击 2024-11-13 09:07

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

NeurIPS 2024 (Oral) | 如何量化与提升思维链的推理能力边界？

该文章的第一作者陈麒光，目前就读于哈工大赛尔实验室。他的主要研究方向包括大模型思维链、跨语言大模型等。该研究主要提出了推理边界框架（Reasoning Boundary Framework, RBF），首次尝试量化并优化思维链推理能力。

来自主题: AI技术研报

4200 点击 2024-11-10 13:50

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板

智能体首次达到Kaggle Grandmaster水平，华为用结构化推理补齐思维链短板

前些时日，AI 大模型开始掌握操作计算机的能力，但整体而言，它们与物理世界互动的能力仍处于早期阶段。

来自主题: AI技术研报

4595 点击 2024-11-08 19:23

慢思考准确率反降30%！普林斯顿揭示思维链某些任务上失效的秘密

慢思考准确率反降30%！普林斯顿揭示思维链某些任务上失效的秘密

慢思考准确率反降30%！普林斯顿揭示思维链某些任务上失效的秘密

OpenAI o1彻底带火慢思考和思维链（CoT）方法，但CoT在某些任务上反而会降低模型表现。

来自主题: AI技术研报

4764 点击 2024-11-05 09:33

上一页当前第9页,共12页下一页