AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!

刚刚,Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景,总共三款模型,三天连发:这三款模型连起来,不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。

来自主题: AI技术研报
9138 点击    2026-06-28 11:14
单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

单个tokenizer胜任图像视频理解生成!南大&腾讯混元HYDRA打通多模态统一难题

南大王利民团队&腾讯混元的HYDRA系列(HYDRA,HYDRA-X)工作挑战了这个惯例,用一个基于ViT的统一视觉Tokenizer,帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer,使其同时具有理解和生成的能力,进而同时作为理解和生成的Autoencoder,来支持原生多模态模型(Unified Multimodal Models)的训练。

来自主题: AI技术研报
8264 点击    2026-06-28 11:13
首个通用触觉基础模型FTP-1来了!Sharpa 联合清华大学等高校,用一套策略打通21种传感器与多类具身形态

首个通用触觉基础模型FTP-1来了!Sharpa 联合清华大学等高校,用一套策略打通21种传感器与多类具身形态

首个通用触觉基础模型FTP-1来了!Sharpa 联合清华大学等高校,用一套策略打通21种传感器与多类具身形态

来自 Sharpa、清华大学、UC Berkeley、上海交通大学、ETH Zurich 等机构的研究者提出了首个通用触觉基础策略 FTP-1。它基于约 3,000 小时、来自 26 个数据来源和 21 种触觉传感器的数据进行预训练

来自主题: AI资讯
9300 点击    2026-06-28 11:12
教AI玩游戏,General Intuition 完成3.2亿美元新一轮融资

教AI玩游戏,General Intuition 完成3.2亿美元新一轮融资

教AI玩游戏,General Intuition 完成3.2亿美元新一轮融资

看《堡垒之夜》的游戏录像,也能训练AI?没错,一家靠着海量游戏录像训练AI的公司General Intuition,刚刚完成3.2亿美元(约合人民币21.77亿元)融资。General Intuition公开披露的融资总额已达4.54亿美元,估值23亿美元。

来自主题: AI资讯
10171 点击    2026-06-28 00:22
大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

大模型搜索总偷懒?IQuest等联合推出FORT,30B开源搜索Agent刷新同规模SOTA

来自至知创新研究院(IQuest Research)、中国人民大学高瓴人工智能学院、KAUST等机构的研究团队提出了FORT,一个面向Deep Search Agent的shortcut-resistant training-data synthesis framework。

来自主题: AI技术研报
8750 点击    2026-06-27 11:27
SIGGRAPH 2026 | 无需训练,一段单目视频解锁任意运镜与「子弹时间」

SIGGRAPH 2026 | 无需训练,一段单目视频解锁任意运镜与「子弹时间」

SIGGRAPH 2026 | 无需训练,一段单目视频解锁任意运镜与「子弹时间」

给定一段普通单目视频,FreeOrbit4D 可沿任意指定相机轨迹「重拍」整个动态场景,包括影视级的「子弹时间」环绕镜头。

来自主题: AI技术研报
8365 点击    2026-06-25 15:01