AI资讯新闻榜单内容搜索-训练

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

假如你是一个致力于将 AI 引入传统行业的工程团队。现在，你有一个问题：训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业陪聊，更要能精准地识别图纸上的零件标注，或者从密密麻麻的财报截图中提取关键数据。

来自主题: AI技术研报

11141 点击 2026-01-13 16:38

向量数据库一定会消失：从 seekdb 看 OLTP 与 Vector 的原生融合。

故事得从我们那个行业交流群说起。

来自主题: AI技术研报

7426 点击 2026-01-13 16:37

华为推出软工代码智能体SWE-Lego，解锁SFT训练极致性能

“软工任务要改多文件、多轮工具调用，模型怎么学透？高质量训练数据稀缺，又怕轨迹含噪声作弊？复杂 RL 训练成本高，中小团队望而却步？”

来自主题: AI技术研报

6633 点击 2026-01-13 16:36

一个模型统一4D世界生成与重建，港科大One4D框架来了

近年来，视频扩散模型在 “真实感、动态性、可控性” 上进展飞快，但它们大多仍停留在纯 RGB 空间。模型能生成好看的视频，却缺少对三维几何的显式建模。这让许多世界模型（world model）导向的应用（空间推理、具身智能、机器人、自动驾驶仿真等）难以落地，因为这些任务不仅需要像素，还需要完整地模拟 4D 世界。

来自主题: AI技术研报

8938 点击 2026-01-13 16:13

美团龙猫LongCat技术升级！新注意力机制解码速度快10倍，还能处理1M超长文本

256K文本预加载提速超50%，还解锁了1M上下文窗口。

来自主题: AI技术研报

10094 点击 2026-01-13 16:10

拆解AI黑箱，深度解读“机制可解释性”｜2026年十大突破性技术

现在，我们越来越多地将大语言模型应用于搜索、编程、内容生成和决策辅助等现实场景中。尽管每天有数百万人使用大模型，但它的问题也随之而来，例如有时会产生幻觉，甚至在特定情境下表现出误导或欺骗用户的倾向。

来自主题: AI资讯

9091 点击 2026-01-13 16:09

引入几何约束后，VLM跨越了「空间推理」的认知鸿沟

现有的视觉大模型普遍存在「语义-几何鸿沟」（Semantic-to-Geometric Gap），不仅分不清东南西北，更难以处理精确的空间量化任务。例如问「你坐在沙发上时，餐桌在你的哪一侧？」，VLM 常常答错。

来自主题: AI技术研报

6855 点击 2026-01-13 10:20

Skills的容量上限在哪里？2026单Skills组合还是多Agent好？｜UCB最新

在文章开始前，请您先打开Claude code，输入/skill，检查一下您的Claude code有多少个skills？是20个？50个？还是已经突破了100个？自从Anthropic推广Agent Skills以来，我们都爱上了这种“即插即用”的模块化体验。它把臃肿的多智能体编排（MAS）变成了一组优雅的Markdown文件调用，让API账单和延迟同时暴跌了50%以上。

来自主题: AI技术研报

11087 点击 2026-01-13 09:09

不会做RAG、agent的本地数据管理？都来学Claude Code！附深度拆解

企业级场景中，无论是做RAG还是agent，我们都会面临一个问题：出于数据隐私以及合规要求，数据必须保留在本地。但传统的本地存储方案往往存在数据隔离性差、崩溃易丢数据、配置管理混乱、操作不可撤销等问题。

来自主题: AI技术研报

9711 点击 2026-01-13 09:07

2026年，大模型训练的下半场属于「强化学习云」

2024 年底，硅谷和北京的茶水间里都在讨论同一个令人不安的话题：Scaling Law 似乎正在撞墙。

来自主题: AI技术研报

9568 点击 2026-01-12 15:13