AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”

来自主题: AI技术研报
5647 点击    2026-01-13 16:36
一个模型统一4D世界生成与重建,港科大One4D框架来了

一个模型统一4D世界生成与重建,港科大One4D框架来了

一个模型统一4D世界生成与重建,港科大One4D框架来了

近年来,视频扩散模型在 “真实感、动态性、可控性” 上进展飞快,但它们大多仍停留在纯 RGB 空间。模型能生成好看的视频,却缺少对三维几何的显式建模。这让许多世界模型(world model)导向的应用(空间推理、具身智能、机器人、自动驾驶仿真等)难以落地,因为这些任务不仅需要像素,还需要完整地模拟 4D 世界。

来自主题: AI技术研报
7959 点击    2026-01-13 16:13
拆解AI黑箱,深度解读“机制可解释性”|2026年十大突破性技术

拆解AI黑箱,深度解读“机制可解释性”|2026年十大突破性技术

拆解AI黑箱,深度解读“机制可解释性”|2026年十大突破性技术

现在,我们越来越多地将大语言模型应用于搜索、编程、内容生成和决策辅助等现实场景中。尽管每天有数百万人使用大模型,但它的问题也随之而来,例如有时会产生幻觉,甚至在特定情境下表现出误导或欺骗用户的倾向。

来自主题: AI资讯
7983 点击    2026-01-13 16:09
引入几何约束后,VLM跨越了「空间推理」的认知鸿沟

引入几何约束后,VLM跨越了「空间推理」的认知鸿沟

引入几何约束后,VLM跨越了「空间推理」的认知鸿沟

现有的视觉大模型普遍存在「语义-几何鸿沟」(Semantic-to-Geometric Gap),不仅分不清东南西北,更难以处理精确的空间量化任务。例如问「你坐在沙发上时,餐桌在你的哪一侧?」,VLM 常常答错。

来自主题: AI技术研报
5748 点击    2026-01-13 10:20
Skills的容量上限在哪里?2026单Skills组合还是多Agent好?|UCB最新

Skills的容量上限在哪里?2026单Skills组合还是多Agent好?|UCB最新

Skills的容量上限在哪里?2026单Skills组合还是多Agent好?|UCB最新

在文章开始前,请您先打开Claude code,输入/skill,检查一下您的Claude code有多少个skills?是20个?50个?还是已经突破了100个?自从Anthropic推广Agent Skills以来,我们都爱上了这种“即插即用”的模块化体验。它把臃肿的多智能体编排(MAS)变成了一组优雅的Markdown文件调用,让API账单和延迟同时暴跌了50%以上。

来自主题: AI技术研报
9747 点击    2026-01-13 09:09
不会做RAG、agent的本地数据管理?都来学Claude Code!附深度拆解

不会做RAG、agent的本地数据管理?都来学Claude Code!附深度拆解

不会做RAG、agent的本地数据管理?都来学Claude Code!附深度拆解

企业级场景中,无论是做RAG还是agent,我们都会面临一个问题:出于数据隐私以及合规要求,数据必须保留在本地。但传统的本地存储方案往往存在数据隔离性差、崩溃易丢数据、配置管理混乱、操作不可撤销等问题。

来自主题: AI技术研报
8361 点击    2026-01-13 09:07
2026年,大模型训练的下半场属于「强化学习云」

2026年,大模型训练的下半场属于「强化学习云」

2026年,大模型训练的下半场属于「强化学习云」

2024 年底,硅谷和北京的茶水间里都在讨论同一个令人不安的话题:Scaling Law 似乎正在撞墙。

来自主题: AI技术研报
8450 点击    2026-01-12 15:13
AAAI 2026 Oral|快手提出全新「检索数据引擎」CroPS,打破搜索信息茧房

AAAI 2026 Oral|快手提出全新「检索数据引擎」CroPS,打破搜索信息茧房

AAAI 2026 Oral|快手提出全新「检索数据引擎」CroPS,打破搜索信息茧房

短视频搜索业务是向量检索在工业界最核心的应用场景之一。然而,当前业界普遍采用的「自强化」训练范式过度依赖历史点击数据,导致系统陷入信息茧房,难以召回潜在相关的新鲜内容。

来自主题: AI技术研报
5344 点击    2026-01-12 14:08