AI资讯新闻榜单内容搜索-思维链

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 思维链

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

斯坦福大模型推理课免费了，谷歌推理团队创始人主讲

如何理解大模型推理能力？现在有来自谷歌DeepMind推理负责人Denny Zhou的分享了。就是那位和清华姚班马腾宇等人证明了只要思维链足够长，Transformer就能解决任何问题的Google Brain推理团队创建者。 Denny Zhou围绕大模型推理过程和方法，在斯坦福大学CS25上讲了一堂“LLM推理”课。

来自主题: AI资讯

5409 点击 2025-07-25 16:57

思维链之父跳槽Meta，不只因为1亿美元！离开OpenAI前泄天机

思维链之父跳槽Meta，不只因为1亿美元！离开OpenAI前泄天机

思维链之父跳槽Meta，不只因为1亿美元！离开OpenAI前泄天机

离开OpenAI，只是为了Meta天价薪资？Jason Wei离职博客，泄露天机：未来AI更令人向往！

来自主题: AI资讯

5838 点击 2025-07-18 11:10

Jason Wei也被小扎带走：思维链开创者、o1系列奠基人！这次真挖到OpenAI大动脉了

Jason Wei也被小扎带走：思维链开创者、o1系列奠基人！这次真挖到OpenAI大动脉了

Jason Wei也被小扎带走：思维链开创者、o1系列奠基人！这次真挖到OpenAI大动脉了

这次是真真真挖到OpenAI大动脉了。 Jason Wei，思维链的提出者、o1系列模型的关键人物，被曝也被扎克伯格请走，即将入职Meta。

来自主题: AI资讯

8323 点击 2025-07-16 16:41

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

首篇潜空间推理综述！模型思考不必依赖Token，带宽暴增2700+倍

大模型在潜空间中推理，带宽能达到普通（显式）思维链（CoT）的2700多倍？

来自主题: AI技术研报

7285 点击 2025-07-16 15:26

长思维链里的推理步骤，哪些最关键？三招锁定LLM的「命门句子」

长思维链里的推理步骤，哪些最关键？三招锁定LLM的「命门句子」

长思维链里的推理步骤，哪些最关键？三招锁定LLM的「命门句子」

思维链里的步骤很重要，但有些步骤比其他步骤更重要，尤其是在一些比较长的思维链中。找出这些步骤，我们就可以更深入地理解 LLM 的内部推理机制，从而提高模型的可解释性、可调试性和安全性。

来自主题: AI技术研报

5522 点击 2025-07-09 10:51

大模型越反思越错，原来是长链推理通过自我说服加重幻觉 | 北邮

大模型越反思越错，原来是长链推理通过自我说服加重幻觉 | 北邮

大模型越反思越错，原来是长链推理通过自我说服加重幻觉 | 北邮

当推理链从3步延伸到50+步，幻觉率暴增10倍；反思节点也束手无策。

来自主题: AI技术研报

7211 点击 2025-07-04 09:35

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

Bengio亲手戳穿CoT神话！LLM推理是假象，25％顶会论文遭打脸

原来，CoT推理竟是假象！Bengio带队最新论文戳穿了CoT神话——我们所看到的推理步骤，并非是真实的。不仅如此，LLM在推理时会悄然纠正错误，却在CoT中只字未提。

来自主题: AI技术研报

8179 点击 2025-07-03 11:09

只用2700万参数，这个推理模型超越了DeepSeek和Claude

只用2700万参数，这个推理模型超越了DeepSeek和Claude

只用2700万参数，这个推理模型超越了DeepSeek和Claude

像人一样推理。大模型的架构，到了需要变革的时候？在对复杂任务的推理工作上，当前的大语言模型（LLM）主要采用思维链（CoT）技术，但这些技术存在任务分解复杂、数据需求大以及高延迟等问题。

来自主题: AI技术研报

6041 点击 2025-07-01 10:26

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

会“思考”的目标检测模型来了！IDEA提出Rex-Thinker：基于思维链的指代物体检测模型，准确率+可解释性双突破

在日常生活中，我们常通过语言描述寻找特定物体：“穿蓝衬衫的人”“桌子左边的杯子”。如何让 AI 精准理解这类指令并定位目标，一直是计算机视觉的核心挑战。

来自主题: AI技术研报

7167 点击 2025-07-01 10:11

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

Cache Me If You Can：陈丹琦团队如何「抓住」关键缓存，解放LLM内存？

普林斯顿大学计算机科学系助理教授陈丹琦团队又有了新论文了。近期，诸如「长思维链」等技术的兴起，带来了需要模型生成数万个 token 的全新工作负载。

来自主题: AI技术研报

8250 点击 2025-06-25 10:51

上一页当前第1页,共11页下一页