AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

重写《给阿嬷的情书》结局:哈工大张民团队联合阿里开源全流程AI多智能体导演框架VideoClaw

早在 2023 年大模型快速发展期,哈工大张民教授立知大模型团队已开展多模态大模型驱动的视频内容创作智能体研究,并全球首发开源了电影制作智能体 FilmAgent 与动画片生成智能体 Anim-Director,受到国内外智能体研究者与文艺创作者的广泛关注。

来自主题: AI技术研报
7504 点击    2026-06-07 10:51
快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

快手可灵提出VLM-as-Teacher:用测试时在线优化,让视频生成模型学会按规则推理

怎么让VGM学会按规则推理?过去主要有两条路。两条路,一个不动模型,一个只写文字,都没真正解决“执行”问题。为此,城大×快手可灵提出了第三条路:VLM-as-Teacher。

来自主题: AI技术研报
7675 点击    2026-06-06 09:51
单卡10秒级!计算所联合ETH单图3D化新研究:同质量生成提速2.67倍

单卡10秒级!计算所联合ETH单图3D化新研究:同质量生成提速2.67倍

单卡10秒级!计算所联合ETH单图3D化新研究:同质量生成提速2.67倍

来自中国科学院计算技术研究所、ETH Zurich等机构的研究者提出了Fast-SAM3D。该方法直接面向SAM3D的推理链路做训练无关加速,在最大程度保持重建质量的同时,将单对象生成提速最高2.67倍,场景生成提速最高2.01倍。

来自主题: AI技术研报
7992 点击    2026-06-06 09:45
写代码不用编辑器!Transformer八子之一:单卡5090复刻Transformer所有研究!AI耗尽万亿Token学概念,正在用“外星人逻辑”泛化

写代码不用编辑器!Transformer八子之一:单卡5090复刻Transformer所有研究!AI耗尽万亿Token学概念,正在用“外星人逻辑”泛化

写代码不用编辑器!Transformer八子之一:单卡5090复刻Transformer所有研究!AI耗尽万亿Token学概念,正在用“外星人逻辑”泛化

“完全抛弃传统的代码编辑器,我直接告诉 AI 去修改代码。”

来自主题: AI资讯
7058 点击    2026-06-05 09:53
超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

超越TurboQuant:Together AI把2-bit KV Cache推向真实服务

长上下文模型越来越能“记”,但真正让它们跑到线上时,最先顶不住的往往不是算力,而是KV Cache。

来自主题: AI技术研报
5451 点击    2026-06-05 09:53
「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包

「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包

「这可能是人类写的最后一篇论文」Stanford、Michigan、CMU 等 37 位学者联手:把论文从 PDF 改写成 AI 能直接执行的研究包

我们今天以 PDF 写论文的方式,已经持续了三百多年。然而论文其实是把一段混乱反复、充满试错的真实研究,讲成一个干净利落、足以服人的完美故事。

来自主题: AI技术研报
9750 点击    2026-06-05 09:25
微软最新提出SkillOpt,用训练大模型的方法优化你的Agent Skills

微软最新提出SkillOpt,用训练大模型的方法优化你的Agent Skills

微软最新提出SkillOpt,用训练大模型的方法优化你的Agent Skills

训练大模型时,工程师绝对不会指望网络做一次前向传播就能收敛。它需要数据喂养、Batch切分、学习率控制、验证集筛选以及优化器状态的迭代试错。

来自主题: AI技术研报
9920 点击    2026-06-05 09:13
首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

首次系统定义「Token经济学」,浙大&阿里联合发布大模型Agent资源分配新范式

当大模型 Agent 从实验室加速走向金融、医疗、代码开发等高价值场景,一个隐秘却致命的瓶颈正在浮现:Token 的指数级消耗正引发算力、协作与安全的系统性危机。传统 “堆算力、加参数” 的线性优化已触及天花板,我们该如何在 “输出质量” 与 “经济成本” 之间找到可持续的最优解?

来自主题: AI技术研报
8180 点击    2026-06-04 16:38
规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

规避文献幻觉,准确率提升13.2%!细粒度检索智能体 | ACL'26

为解决科研中对单篇文献深度解析的需求,佐治亚大学团队提出IntrAgent,专注单篇内容,避免大模型幻觉。通过段落排序与迭代阅读机制,精准提取实验细节与元数据。

来自主题: AI技术研报
10145 点击    2026-06-04 16:38