AI资讯新闻榜单内容搜索-模型训练

DeepSearch 与 DeepResearch 的设计和实现

这才 2 月份，深度搜索（Deep Search）就已经隐隐成为 2025 年的新搜索标准了。像谷歌和 OpenAI 这样的巨头，纷纷亮出自己的“Deep Research”产品，努力抢占这波技术浪潮的先机。（我们也很自豪，在同一天也发布了开源的node-deepresearch）。

来自主题: AI技术研报

10881 点击 2025-03-12 14:55

在 ChatGPT 爆火两年多的时间里，大语言模型的上下文窗口长度基准线被拉升，以此为基础所构建的长 CoT 推理、多 Agent 协作等类型的高级应用也逐渐增多。

来自主题: AI技术研报

8448 点击 2025-03-12 14:53

OctoTools通过标准化工具卡和规划器，帮助LLMs高效完成复杂任务，无需额外训练。在16个任务中表现优异，比其他方法平均准确率高出9.3%，尤其在多步推理和工具使用方面优势明显。

来自主题: AI技术研报

7346 点击 2025-03-12 14:47

为了解决视频编辑模型缺乏训练数据的问题，本文作者（来自香港中文大学、香港理工大学、清华大学等高校和云天励飞）提出了一个名为 Señorita-2M 的数据集。该数据集包含 200 万高质量的视频编辑对，囊括了 18 种视频编辑任务。

来自主题: AI技术研报

8122 点击 2025-03-12 14:41

大模型训练几乎消耗尽所有IT数据之后，挖掘OT数据正成为AI落地的重要方向。

来自主题: AI资讯

9201 点击 2025-03-12 14:09

大语言模型长序列文本生成效率新突破——生成10万Token的文本，传统自回归模型需要近5个小时，现在仅需90分钟！

来自主题: AI技术研报

9660 点击 2025-03-12 13:52

只要微调模型生成的前8-32个词，就能让大模型推理能力达到和传统监督训练一样的水平？

来自主题: AI技术研报

7977 点击 2025-03-12 13:41

首次将DeepSeek同款RLVR应用于全模态LLM，含视频的那种！

来自主题: AI技术研报

8598 点击 2025-03-11 17:34

挑战多图数学推理新基准，大模型直接全军覆没？！

来自主题: AI技术研报

8042 点击 2025-03-11 17:22

没有任何冷启动数据，7B 参数模型能单纯通过强化学习学会玩数独吗？

来自主题: AI技术研报

9230 点击 2025-03-11 17:03