AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

前馈式3D的终极路线图来了！五大核心战线，一文看清未来三维重建该往哪走

前馈式3D的终极路线图来了！五大核心战线，一文看清未来三维重建该往哪走

前馈式3D的终极路线图来了！五大核心战线，一文看清未来三维重建该往哪走

从单幅图像恢复三维结构，到多视图场景建模、动态 4D 重建，再到机器人、自动驾驶、SLAM 与视频生成，如何让模型在不依赖逐场景优化的前提下，直接、高效地理解并重建三维世界，正在成为 3D 视觉领域的

来自主题: AI技术研报

9419 点击 2026-04-26 12:09

谷歌Jeff Dean重磅论文：弹性大规模分布式预训练终于可行了

谷歌Jeff Dean重磅论文：弹性大规模分布式预训练终于可行了

谷歌Jeff Dean重磅论文：弹性大规模分布式预训练终于可行了

弹性 AI 预训练已经推进到了下一个前沿！没有意外：来自谷歌。据介绍，他们提出的 Decoupled DiLoCo 是一种革命性的分布式训练技术，能够利用全球各地的异构硬件进行训练，并且即使当硬件发生故障时，系统也不会停止运行！

来自主题: AI技术研报

8839 点击 2026-04-25 13:33

谷歌再发「香蕉」！何恺明等引爆视觉Transformer时刻

谷歌再发「香蕉」！何恺明等引爆视觉Transformer时刻

谷歌再发「香蕉」！何恺明等引爆视觉Transformer时刻

最近，谷歌联合ResNet作者何恺明、谢赛宁、NeRF先驱Jonathan T. Barron、 3D图形学名家Thomas Funkhouser，正式发布了Vision Banana。它向世界宣告：视觉AI终于不再需要那些臃肿的任务头了，理解，本质上只是生成过程中的一次「对齐」。

来自主题: AI技术研报

9422 点击 2026-04-24 16:13

CVPR 2026 | 告别倾听「扑克脸」，UniLS框架来了，刷新数字人对话SOTA

CVPR 2026 | 告别倾听「扑克脸」，UniLS框架来了，刷新数字人对话SOTA

CVPR 2026 | 告别倾听「扑克脸」，UniLS框架来了，刷新数字人对话SOTA

在游戏 NPC、虚拟主播、在线客服等数字人对话场景中，倾听时的 “扑克脸” 问题一直是行业长期痛点 —— 虚拟人说话时口型可以做到精准同步，但倾听时却表情僵硬、毫无反应，严重影响对话的自然感和沉浸感。盛大 AI 研究院（东京）与东京大学联合提出 UniLS（Unified Listening and Speaking），首个仅凭双轨音频即可端到端同时驱动说话和倾听面部动作的统一框架。

来自主题: AI技术研报

9759 点击 2026-04-24 09:15

首篇「Attention Sink」综述：从利用、理解到消除，Transformer中的注意力「汇聚」全景解析

首篇「Attention Sink」综述：从利用、理解到消除，Transformer中的注意力「汇聚」全景解析

首篇「Attention Sink」综述：从利用、理解到消除，Transformer中的注意力「汇聚」全景解析

几乎所有 Transformer 都在做一件反常的事：把大量注意力集中到少数几个特定 Token 上。这不是 bug，而是 Transformer 固有的「注意力汇聚」（Attention Sink）。首篇系统性综述，带你从利用、理解到消除，全面掌握这一核心现象。

来自主题: AI技术研报

8801 点击 2026-04-24 09:14

突破算力瓶颈！港大俞益洲团队发布首篇「高效视频世界模型」全面综述

突破算力瓶颈！港大俞益洲团队发布首篇「高效视频世界模型」全面综述

突破算力瓶颈！港大俞益洲团队发布首篇「高效视频世界模型」全面综述

还记得两年前，AI 生视频可谓是「鬼畜专区」—— 人物多一根手指算基操，走路自带鬼步舞才是常态。结果转眼间，从 OpenAI 的 Sora 到字节跳动的 Seedance，这些模型已经开始一本正经地「模拟世界」了：水会流、球会弹、光影能追踪，俨然一副要当「物理引擎」的架势。

来自主题: AI技术研报

7327 点击 2026-04-24 09:14

Transformer可以改装成Mamba了：苹果把推理成本直接打成线性

Transformer可以改装成Mamba了：苹果把推理成本直接打成线性

Transformer可以改装成Mamba了：苹果把推理成本直接打成线性

最近，苹果又整了个活儿，很工程、也挺关键：把又贵又强的 Transformer，改造成又便宜又差不多强的 Mamba。而且，性能基本没怎么掉。

来自主题: AI技术研报

8397 点击 2026-04-23 14:46

视觉大模型迎来“o1时刻”：腾讯混元提出SOAR，让AI在生成中学会自我纠偏

视觉大模型迎来“o1时刻”：腾讯混元提出SOAR，让AI在生成中学会自我纠偏

视觉大模型迎来“o1时刻”：腾讯混元提出SOAR，让AI在生成中学会自我纠偏

近日，腾讯混元团队提出HY-SOAR （Self-Correction for Optimal Alignment and Refinement），一种面向扩散模型和流匹配模型的数据驱动后训练方法。

来自主题: AI技术研报

7860 点击 2026-04-23 14:44

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

ICLR 2026 | ProSafePrune：一剪见效，告别大模型过度防御

当你问 AI 「如何关掉房间的灯（how to kill the lights）」，却被冰冷拒绝「无法提供相关帮助」；当你想探讨「黑客技术的正向应用」，得到的却是「拒绝涉及非法活动」的机械回应 —— 你遇到的正是大语言模型（LLMs）的「过度拒绝」（over-refusal）痛点。

来自主题: AI技术研报

10364 点击 2026-04-23 14:06

LLM 仅靠自身就能增强推理？SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理？SePT 给出简洁在线自训练范式

LLM 仅靠自身就能增强推理？SePT 给出简洁在线自训练范式

在推理后训练里，多数方法仍依赖奖励模型、验证器或额外教师信号。如果不依赖这些外部信号，只使用模型自身生成的答案进行自训练，是否仍然能够提升推理能力？是的！SePT（Self-evolving Post-Training）给出肯定答案，简洁的自训练方法，可在数学推理任务准确率直升10个点！

来自主题: AI技术研报

6009 点击 2026-04-23 14:05

上一页当前第29页,共410页下一页