AI资讯新闻榜单内容搜索-训练

5年白领下岗，AGI靠RL一飞冲天？网友：这是让狗学会打麻将！

只靠强化学习，AGI就能实现？Claude-4核心成员放话「5年内AI干掉白领」，却被Karpathy等联手泼冷水！持续学习真的可能吗？RL的真正边界、下一代智能的关键转折点到底在哪儿？

来自主题: AI资讯

6951 点击 2025-06-22 16:13

无需蒸馏任何大规模语言模型，小模型也能自给自足、联合提升？

来自主题: AI技术研报

6418 点击 2025-06-22 16:13

强化学习（RL）已经成为当今 LLM 不可或缺的技术之一。从大模型对齐到推理模型训练再到如今的智能体强化学习（Agentic RL），你几乎能在当今 AI 领域的每个领域看到强化学习的身影。

来自主题: AI技术研报

5808 点击 2025-06-22 16:08

尽管人工智能（AI）在飞速发展，当前 AI 开发仍严重依赖人类专家大量的手动实验和反复的调参迭代，过程费时费力。

来自主题: AI技术研报

6829 点击 2025-06-22 15:58

在 AI 领域，英伟达开发的 CUDA 是驱动大语言模型（LLM）训练和推理的核心计算引擎。

来自主题: AI资讯

6248 点击 2025-06-22 12:07

大语言模型（LLMs）在决策场景中常因贪婪性、频率偏差和知行差距表现欠佳。研究者提出强化学习微调（RLFT），通过自我生成的推理链（CoT）优化模型，提升决策能力。实验表明，RLFT可增加模型探索性，缩小知行差距，但探索策略仍有改进空间。

来自主题: AI技术研报

6158 点击 2025-06-22 11:34

这款 Agent 擅长多轮搜索和推理，平均每项任务执行 23 个推理步骤，访问超过 200 个网址。它是基于 Kimi k 系列模型的内部版本构建，并完全通过端到端智能体强化学习进行训练，也是国内少有的基于自研模型打造的 Agent。

来自主题: AI资讯

6666 点击 2025-06-21 19:42

随着 AI4Science 的浪潮席卷科研各领域，如何将强大的人工智能模型真正用于分析科学数据、构建数学模型、发现科学规律，正成为该领域亟待突破的关键问题。

来自主题: AI技术研报

5587 点击 2025-06-21 18:31

在人工智能领域，大型语言模型（LLM）的推理能力正以前所未有的速度发展。

来自主题: AI资讯

5970 点击 2025-06-21 17:58

只需修改两行代码，RAG向量检索效率暴涨30%！

来自主题: AI技术研报

5370 点击 2025-06-21 17:48