AI资讯新闻榜单内容搜索-模型训练

自动调整推理链长度，SCoT来了！为激发推理能力研究还提出了一个新架构

不怕推理模型简单问题过度思考了，能动态调整CoT的新推理范式SCoT来了！

来自主题: AI技术研报

8428 点击 2025-03-13 14:58

最新研究显示，以超强推理爆红的DeepSeek-R1模型竟藏隐形危险——

来自主题: AI技术研报

10791 点击 2025-03-13 14:53

它能像人眼一样，在文本、视觉输入和无提示范式等不同机制下进行检测和分割。

来自主题: AI技术研报

11022 点击 2025-03-13 14:46

近些年，大模型的发展可谓是繁花似锦、烈火烹油。从 2018 年 OpenAI 公司提出了 GPT-1 开始，到 2022 年底的 GPT-3，再到现在国内外大模型的「百模争锋」，DeepSeek 异军突起，各类大模型应用层出不穷。

来自主题: AI技术研报

11567 点击 2025-03-13 14:41

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8877 点击 2025-03-13 14:41

在实际应用过程中，闭源模型（GPT-4o）等在回复的全面性、完备性、美观性等方面展示出了不俗的表现。

来自主题: AI技术研报

9064 点击 2025-03-13 10:15

2025 年 2 月发布的 NoLiMA 是一种大语言模型（LLM）长文本理解能力评估方法。不同于传统“大海捞针”（Needle-in-a-Haystack, NIAH）测试依赖关键词匹配的做法，它最大的特点是通过精心设计问题和关键信息，迫使模型进行深层语义理解和推理，才能从长文本中找到答案。

来自主题: AI技术研报

6196 点击 2025-03-12 15:08

这才 2 月份，深度搜索（Deep Search）就已经隐隐成为 2025 年的新搜索标准了。像谷歌和 OpenAI 这样的巨头，纷纷亮出自己的“Deep Research”产品，努力抢占这波技术浪潮的先机。（我们也很自豪，在同一天也发布了开源的node-deepresearch）。

来自主题: AI技术研报

11802 点击 2025-03-12 14:55

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

9011 点击 2025-03-12 14:53

OctoTools通过标准化工具卡和规划器，帮助LLMs高效完成复杂任务，无需额外训练。在16个任务中表现优异，比其他方法平均准确率高出9.3%，尤其在多步推理和工具使用方面优势明显。

来自主题: AI技术研报

8001 点击 2025-03-12 14:47