AI资讯新闻榜单内容搜索-模型训练

1亿图文对！格灵深瞳开源RealSyn数据集，CLIP多任务性能刷新SOTA

新的亿级大规模图文对数据集来了，CLIP达成新SOTA！

来自主题: AI技术研报

8582 点击 2025-04-29 15:47

首个大模型全链路安全综述！南洋理工新国立等发布LLM Safety全景图：从数据、训练到部署的全面梳理

随着人工智能技术迅猛发展，大模型（如GPT-4、文心一言等）正逐步渗透至社会生活的各个领域，从医疗、教育到金融、政务，其影响力与日俱增。

来自主题: AI技术研报

10625 点击 2025-04-29 15:27

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

多模态大模型（MLLMs）在视觉理解与推理等领域取得了显著成就。然而，随着解码（decoding）阶段不断生成新的 token，推理过程的计算复杂度和 GPU 显存占用逐渐增加，这导致了多模态大模型推理效率的降低。

来自主题: AI技术研报

8750 点击 2025-04-29 14:56

AGI幻灭，LeCun观点得证？哈佛研究实锤AI不懂因果，世界模型神话破灭

尽管LLM看似能够进行流畅推理和问题解答，但它们背后的思维链其实只是复杂的统计模式匹配，而非真正的推理能力。AI模型仅仅通过海量数据和经验法则来生成响应，而不是通过深刻的世界模型和逻辑推理来做决策。

来自主题: AI技术研报

9835 点击 2025-04-29 09:52

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

大模型之战烽火正酣，谷歌Gemini 2.5 Pro却强势逆袭！Gemini Flash预训练负责人亲自揭秘，深挖Gemini预训练的关键技术，看谷歌如何在模型大小、算力、数据和推理成本间找到最优解。

来自主题: AI技术研报

9748 点击 2025-04-29 09:43

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

通过蒙特卡洛树搜索筛选高难度样本，ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力，无需知识蒸馏，为高效训练提供了新思路。

来自主题: AI技术研报

9724 点击 2025-04-28 16:59

强化学习被高估！清华上交：RL不能提升推理能力，新知识得靠蒸馏

一项来自清华大学和上海交通大学的研究颠覆了对可验证奖励强化学习（RLVR）的认知。RLVR被认为是打造自我进化大模型的关键，但实验表明，它可能只是提高了采样效率，而非真正赋予模型全新推理能力。

来自主题: AI技术研报

8608 点击 2025-04-28 16:51

7x24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

自主通才科学家（AGS）正成为现实！

来自主题: AI技术研报

10098 点击 2025-04-28 15:57

模型压缩到70%，还能保持100%准确率，无损压缩框架DFloat11来了

大型语言模型（LLMs）在广泛的自然语言处理（NLP）任务中展现出了卓越的能力。

来自主题: AI技术研报

9056 点击 2025-04-28 15:42

首个系统性工具使用奖励范式，ToolRL刷新大模型训练思路

「工欲善其事，必先利其器。」如今，人工智能正以前所未有的速度革新人类认知的边界，而工具的高效应用已成为衡量人工智能真正智慧的关键标准。

来自主题: AI技术研报

7964 点击 2025-04-28 14:53

AI资讯新闻榜单内容搜索-模型训练

1亿图文对！格灵深瞳开源RealSyn数据集，CLIP多任务性能刷新SOTA

首个大模型全链路安全综述 ！南洋理工新国立等发布LLM Safety全景图：从数据、训练到部署的全面梳理

ICLR 2025｜首个动态视觉-文本稀疏化框架来了，计算开销直降50%-75%

AGI幻灭，LeCun观点得证？哈佛研究实锤AI不懂因果，世界模型神话破灭

52页PPT，谷歌Gemini预训练负责人首次揭秘！扩展定律最优解

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

强化学习被高估！清华上交：RL不能提升推理能力，新知识得靠蒸馏

7x24小时非人类科学家入场：当AI开始自主探索科学未知领域 | 多伦多大学

模型压缩到70%，还能保持100%准确率，无损压缩框架DFloat11来了

首个系统性工具使用奖励范式，ToolRL刷新大模型训练思路

首个大模型全链路安全综述！南洋理工新国立等发布LLM Safety全景图：从数据、训练到部署的全面梳理