AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
这家创业公司发现了大模型的一个根本性缺陷

这家创业公司发现了大模型的一个根本性缺陷

这家创业公司发现了大模型的一个根本性缺陷

你有没有想过,我们每天用的 AI 大模型,可能在某些词汇上天生就有缺陷?不是因为训练数据不够,不是因为算力不足,而是因为语言本身的规律——那些用得少的词,模型就是学不好。更让人意外的是,这个问题早在 2025 年就被一家中国创业公司系统性地发现并解决了。

来自主题: AI技术研报
6994 点击    2026-05-28 09:52
Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

Token账单爆炸?用「TELOS」强制命中缓存,一键剩下90%的账单!

就在几天前(5月22日),DeepSeek官方扔出了一枚重磅炸弹:DeepSeek-V4-Pro将在5月底结束优惠后,永久降价至原价的四分之一。各大媒体瞬间被诸如“白菜价”、“夯爆了”的标题刷屏。看看这组惊人的新定价:每百万Token输出6元,输入(缓存未命中)3元,而输入(缓存命中)仅仅只要0.025元!

来自主题: AI技术研报
7255 点击    2026-05-28 09:51
双榜SOTA!微软ACL2026新作重新定义AI长记忆

双榜SOTA!微软ACL2026新作重新定义AI长记忆

双榜SOTA!微软ACL2026新作重新定义AI长记忆

随着大语言模型在各类应用中加速落地,一个核心技术瓶颈日益凸显——AI始终缺乏真正的长期记忆能力。当前主流的RAG(检索增强生成)方案依赖语义相似度检索历史信息,但“语义相似”并不等于“真正相关”,常常出现检索结果不完整、无法区分信息相关性、缺乏推理能力等问题。

来自主题: AI技术研报
8695 点击    2026-05-28 09:50
Z Tech|对话Andrew Dai:14年DeepMind生涯,见证PaLM到Gemini,下一站押注视觉推理

Z Tech|对话Andrew Dai:14年DeepMind生涯,见证PaLM到Gemini,下一站押注视觉推理

Z Tech|对话Andrew Dai:14年DeepMind生涯,见证PaLM到Gemini,下一站押注视觉推理

过去十年,大模型世界里很多最关键的技术路线背后,都能看到Andrew Dai的身影。从早期预训练与监督微调,到后来主流的MoE(Mixture of Experts)架构;从Google Brain最初只有几十人的研究时代,到后来支撑Gemini的大规模数据体系,这位在 Google 工作超过14年的研究科学家,几乎站在了大模型时代每一次关键转折的现场。

来自主题: AI资讯
9056 点击    2026-05-27 16:31
CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿

CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿

CVPR 2026 | 1000万段驾驶视频,教会模型如何估计相机位姿

不用百万级 3D 标注,模型也能从普通驾驶视频中学会「自己是怎么动的」。Wayve 的 LA-Pose 试图把未标注视频里的运动信号,转化为自动驾驶系统所需的相机位姿估计能力。

来自主题: AI技术研报
6931 点击    2026-05-27 16:10
从Foundation Model到Physical AI,三星「杀入」大模型核心战场

从Foundation Model到Physical AI,三星「杀入」大模型核心战场

从Foundation Model到Physical AI,三星「杀入」大模型核心战场

过去几年,大模型竞争主要发生在 AI 公司之间。但随着 AI 开始从数字世界进入真实设备与物理世界,竞争逻辑正在发生变化。

来自主题: AI技术研报
5415 点击    2026-05-27 16:09