AI资讯新闻榜单内容搜索-模型训练

警惕 AI“罕见”危险行为！Anthropic 发文：一次评估失败也可能造成灾难性后果

对齐科学的主要目标之一，是在危险行为发生之前，预测人工智能（AI）模型的危险行为倾向。

来自主题: AI资讯

5707 点击 2025-02-27 10:05

何恺明ResNet级神作，分形生成模型计算效率狂飙4000倍！清华校友一作

大自然的分形之美，蕴藏着宇宙的设计规则。刚刚，何恺明团队祭出「分形生成模型」，首次实现高分辨率逐像素建模，让计算效率飙升4000倍，开辟AI图像生成新范式。

来自主题: AI技术研报

10791 点击 2025-02-26 15:17

多模态大模型对齐新范式，10个评估维度全面提升，快手&中科院&南大打破瓶颈

尽管多模态大语言模型（MLLMs）取得了显著的进展，但现有的先进模型仍然缺乏与人类偏好的充分对齐。这一差距的存在主要是因为现有的对齐研究多集中于某些特定领域（例如减少幻觉问题），是否与人类偏好对齐可以全面提升MLLM的各种能力仍是一个未知数。

来自主题: AI技术研报

10901 点击 2025-02-26 14:07

千帧长视频时代到来！MIT全新扩散算法让任意模型突破时长极限

进入到 2025 年，视频生成（尤其是基于扩散模型）领域还在不断地「推陈出新」，各种文生视频、图生视频模型展现出了酷炫的效果。其中，长视频生成一直是现有视频扩散的痛点。

来自主题: AI技术研报

7700 点击 2025-02-26 13:39

何恺明开辟分形图像生成新范式！计算效率提高4000倍，首次实现高分辨率逐像素生成

何恺明再次开宗立派！开辟了生成模型的全新范式——

来自主题: AI技术研报

4117 点击 2025-02-26 13:33

DeepSeek开源通用矩阵乘法库，300行代码加速V3、R1，R2被曝五月前问世

DeepSeek 的开源周已经进行到了第三天（前两天报道见文末「相关阅读」）。今天开源的项目名叫 DeepGEMM，是一款支持密集型和专家混合（MoE）GEMM 的 FP8 GEMM 库，为 V3/R1 的训练和推理提供了支持，在 Hopper GPU 上可以达到 1350+ FP8 TFLOPS 的计算性能。

来自主题: AI资讯

8712 点击 2025-02-26 10:58

受R1启发，微软亚洲发布Logic-RL，帮助LLM通过RL解决"骑士与骗子"逻辑谜题

本文深入解析一项开创性研究——"Logic-RL: Unleashing LLM Reasoning with Rule-Based Reinforcement Learning"，该研究通过基于规则的强化学习技术显著提升了语言模型的推理能力。微软亚洲的研究团队受DeepSeek-R1成功经验的启发，利用结构化的逻辑谜题作为训练场，为模型创建了一个可以系统学习和改进推理技能的环境。

来自主题: AI技术研报

7460 点击 2025-02-26 09:56