AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

视觉模型既懂语义，又能还原细节，南洋理工&商汤提出棱镜假说

视觉模型既懂语义，又能还原细节，南洋理工&商汤提出棱镜假说

视觉模型既懂语义，又能还原细节，南洋理工&商汤提出棱镜假说

作者来自 Nanyang Technological University（MMLab）与 SenseTime Research，提出 Prism Hypothesis（棱镜假说）与 Unified Autoencoding（UAE），尝试用 “频率谱” 的统一视角，把语义编码器与像素编码器的表示冲突真正 “合并解决”。

来自主题: AI技术研报

11165 点击 2026-01-15 09:20

端到端智驾新SOTA | KnowVal：懂法律道德、有价值观的智能驾驶系统

端到端智驾新SOTA | KnowVal：懂法律道德、有价值观的智能驾驶系统

端到端智驾新SOTA | KnowVal：懂法律道德、有价值观的智能驾驶系统

一个智能驾驶系统，在迈向高阶自动驾驶的过程中，应当具备何种能力？除了基础的感知、预测、规划、决策能力，如何对三维空间进行更深入的理解？如何具备包含法律法规、道德原则、防御性驾驶原则等知识？如何进行基本的视觉 - 语言推理？如何让智能系统具备世界观和价值观？

来自主题: AI技术研报

8624 点击 2026-01-15 09:18

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

不用额外缓存！英伟达开源大模型记忆压缩方案，128K上下文提速2.7倍

提高大模型记忆这块儿，美国大模型开源王者——英伟达也出招了。

来自主题: AI技术研报

9518 点击 2026-01-14 15:29

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

AAAI 2026｜AP2O-Coder 让大模型拥有「错题本」，像人类一样按题型高效刷题

在 AI 辅助 Coding 技术快速发展的背景下，大语言模型（LLMs）虽显著提升了软件开发效率，但开源的 LLMs 生成的代码依旧存在运行时错误，增加了开发者调试成本。

来自主题: AI技术研报

10277 点击 2026-01-14 15:28

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

Sebastian Raschka 2026预测：Transformer统治依旧，但扩散模型正悄然崛起

站在 2026 年的开端回望，LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年，Transformer 架构以绝对的统治力横扫了人工智能领域，但随着算力成本的博弈和对推理效率的极致追求，挑战者们从未停止过脚步。

来自主题: AI技术研报

10401 点击 2026-01-14 15:25

国产Nano Banana开源！用华为AI芯片训练，1张图只要1毛钱

国产Nano Banana开源！用华为AI芯片训练，1张图只要1毛钱

国产Nano Banana开源！用华为AI芯片训练，1张图只要1毛钱

今天，首个在国产芯片上完成全程训练的SOTA（最佳水平）多模态模型开源。这是智谱联合华为开源的图像生成模型GLM-Image。从数据到训练的全流程，该模型完全基于昇腾Atlas 800T A2设备和昇思MindSpore AI框架完成构建。

来自主题: AI资讯

11376 点击 2026-01-14 14:09

把RoPE扔掉，AI更能看懂长上下文！Transformer作者团队开源大模型预训练新方法

把RoPE扔掉，AI更能看懂长上下文！Transformer作者团队开源大模型预训练新方法

把RoPE扔掉，AI更能看懂长上下文！Transformer作者团队开源大模型预训练新方法

针对大模型长文本处理难题，Transformer架构的核心作者之一Llion Jones领导的研究团队开源了一项新技术DroPE。

来自主题: AI资讯

9011 点击 2026-01-14 10:49

AI4S又一瓶颈被攻克：两个AI「吵架」，让科研代码部署成功率突破95%

AI4S又一瓶颈被攻克：两个AI「吵架」，让科研代码部署成功率突破95%

AI4S又一瓶颈被攻克：两个AI「吵架」，让科研代码部署成功率突破95%

过去几十年里，科学计算领域积累了数量空前的开源软件工具。

来自主题: AI技术研报

11306 点击 2026-01-14 10:01

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

不上云、不租卡，如何优雅地在本地微调Qwen-VL-30B？

假如你是一个致力于将 AI 引入传统行业的工程团队。现在，你有一个问题：训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业陪聊，更要能精准地识别图纸上的零件标注，或者从密密麻麻的财报截图中提取关键数据。

来自主题: AI技术研报

11585 点击 2026-01-13 16:38

向量数据库一定会消失：从 seekdb 看 OLTP 与 Vector 的原生融合。

向量数据库一定会消失：从 seekdb 看 OLTP 与 Vector 的原生融合。

向量数据库一定会消失：从 seekdb 看 OLTP 与 Vector 的原生融合。

故事得从我们那个行业交流群说起。

来自主题: AI技术研报

7696 点击 2026-01-13 16:37

上一页当前第96页,共430页下一页