AI资讯新闻榜单内容搜索-训练

迈向推理时代：900+篇参考文献揭示长链思维的前世今生，最全综述来了

近年来，大模型（Large Language Models, LLMs）在数学、编程等复杂任务上取得突破，OpenAI-o1、DeepSeek-R1 等推理大模型（Reasoning Large Language Models，RLLMs）表现尤为亮眼。但它们为何如此强大呢？

来自主题: AI技术研报

8208 点击 2025-04-16 15:00

视频推理R1时刻，7B模型反超GPT-4o！港中文清华推出首个Video-R1

港中文和清华团队推出Video-R1模型，首次将强化学习的R1范式应用于视频推理领域。通过升级的T-GRPO算法和混合图像视频数据集，Video-R1在视频空间推理测试中超越了GPT-4o，展现了强大的推理能力，并且全部代码和数据集均已开源。

来自主题: AI技术研报

8019 点击 2025-04-16 14:42

多模态生成框架新SOTA：文本+空间+图像随意组合，20W+数据开源，复旦腾讯优图出品

能处理任意条件组合的新生成框架来了！

来自主题: AI技术研报

6379 点击 2025-04-16 14:34

喝点VC｜a16z对话心理健康公司Slingshot AI创始人：通过AI扩大心理健康服务的可及性

作为一家公司，我们专注于三件事：预训练、微调和对齐。我们使用自有数据集进行预训练，这一点非常关键，而很多公司并不具备这样的能力。然后，我们用专家手工整理的数据进行微调。最有趣、最重要的部分在于对齐，这与简单地寻找“当前最优解”是截然不同的。

来自主题: AI资讯

5986 点击 2025-04-16 14:29

生成式 AI 引爆广告效率革命，揭秘京东大模型应用架构的实践之道

在京东广告的大模型应用架构中，召回环节至关重要。传统召回方式在规则灵活性和用户需求捕捉上存在局限，而大模型带来了新的契机，但也面临训练成本和隐私保护的挑战。

来自主题: AI技术研报

5356 点击 2025-04-16 14:27

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

让大模型进入多模态模式，从而能够有效感知世界，是最近 AI 领域里人们一直的探索目标。

来自主题: AI技术研报

6000 点击 2025-04-16 14:01

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

北京大学团队继VARGPT实现视觉理解与生成任务统一之后，再度推出了VARGPT-v1.1版本。该版本进一步提升了视觉自回归模型的能力，不仅在在视觉理解方面有所加强，还在图像生成和编辑任务中达到新的性能高度

来自主题: AI技术研报

6747 点击 2025-04-16 09:44

OpenAI姚顺雨：欢迎来到AI下半场！

要理解上半场，看看它的赢家。你认为到目前为止最有影响力的 AI 论文是哪些？我尝试了斯坦福大学 224N 课程的测验，答案并不令人惊讶：Transformer、AlexNet、GPT-3 等等。这些论文有什么共同点？它们提出了一些训练更好模型的基本突破。但同样，它们通过在一些基准测试上展示一些（显著的）改进来发表论文。

来自主题: AI技术研报

8302 点击 2025-04-16 09:24

用IBM的AutoPDL，让Agent的prompt实现数据驱动的自动优化，性能飙升68.9% |重磅

早在去年10月底IBM推出了PDL声明式提示编程语言，本篇是基于PDL的一种对Agent的自动优化方法，是工业界前沿的解决方案。当你在开发基于大语言模型的Agent产品时，是否曾经在提示模式选择和优化上浪费了大量时间？在各种提示模式（Zero-Shot、CoT、ReAct、ReWOO等）中选择最佳方案，再逐字斟酌提示内容，这一过程不仅耗时，而且常常依赖经验和直觉而非数据驱动的决策。

来自主题: AI技术研报

6094 点击 2025-04-16 09:18

英伟达含量为零！华为密集模型性能比肩DeepSeek-R1，纯昇腾集群训练

密集模型的推理能力也能和DeepSeek-R1掰手腕了？

来自主题: AI资讯

5730 点击 2025-04-15 15:05