AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026

画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026

画数独、烧蜡烛都不翻车了?浙大&阿里让AI先三思再下笔|ACL 2026

当下视觉生成正陷入一个能力错位困境—— 扩散模型的像素画质已接近完美,但一遇到需要逻辑推理的生成任务就频频翻车。

来自主题: AI技术研报
5807 点击    2026-05-26 14:58
ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流

ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流

ACL 2026 Main | 不只是调用地图API,Spatial-Agent让大模型生成可执行地理分析工作流

大语言模型在地图、城市、交通等空间领域的应用越来越广泛。对于这些场景来说,问题往往不只是 “查一个地点” 或 “调用一次路线 API” 就能解决的,而是需要把用户的自然语言问题组织成一段可执行、可验证的地理分析流程。

来自主题: AI技术研报
8765 点击    2026-05-26 14:57
Grok最新模型吃上Cursor「加餐」,Grok基础模型V9-Medium(1.5T)已完成训练

Grok最新模型吃上Cursor「加餐」,Grok基础模型V9-Medium(1.5T)已完成训练

Grok最新模型吃上Cursor「加餐」,Grok基础模型V9-Medium(1.5T)已完成训练

马斯克在X上发帖透露,xAI自家的Grok基础模型V9-Medium(1.5T)已经完成训练。预计再过2到3周,差不多就能正式对外发布啦:马斯克特意提到,V9-Medium的补充训练中加入了大量Cursor数据,后续还会继续添加。

来自主题: AI资讯
8489 点击    2026-05-26 12:10
VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni:面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架,由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer(Qwen-Image)、混合 AR-DiT(Qwen-Omni)、统一理解 + 生成(BAGEL、HunyuanImage-3.0)等架构。

来自主题: AI技术研报
7427 点击    2026-05-26 10:26
告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

告别多奖励跷跷板:Flow-OPD将多教师OPD带入图像生成

今年以来,在线策略蒸馏 OPD(On-Policy Distillation)已经逐渐成为大厂 LLM 后训练中的重要组件,例如 DeepSeek-V4,GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力,相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报
6896 点击    2026-05-26 10:07
还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

还在手写CUDA内核?CODA来了!LLM和新手也能让Transformer跑出光速

5 月 22 日,Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道:「经过一些数学重写,结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue(矩阵乘法加尾声)。给定一些优化的原语,LLM(以及新手)就可以为所有 Transformer 操作编写光速内核!」

来自主题: AI技术研报
8552 点击    2026-05-25 10:13
AI Agent 距离真正替人「全自动办公」,还有多远?

AI Agent 距离真正替人「全自动办公」,还有多远?

AI Agent 距离真正替人「全自动办公」,还有多远?

近日,Meta 曝光的一段内部录音显示: 公司为了训练大模型,正通过监控工具监视员工在电脑上的鼠标和键盘操作。

来自主题: AI技术研报
9852 点击    2026-05-25 10:13