AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
百度最强模型来了!五大场景深度实测,搜索能力突出

百度最强模型来了!五大场景深度实测,搜索能力突出

百度最强模型来了!五大场景深度实测,搜索能力突出

今日,百度推出新一代基础模型文心5.1。百度称,文心5.1将总参数压缩至约1/3、激活参数压缩至约1/2,使用业界同规模模型约6%的预训练成本,实现同级别模型基础效果领先。不过,百度并未明确说明这一“6%成本”的具体对标模型范围与口径。

来自主题: AI资讯
8475 点击    2026-05-09 21:29
不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件

不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件

不更新参数就能强化学习!OpenAI翁家翌提出新范式:决策只需AI手搓一个.py 文件

没有训练梯度的AI,打破了Atari游戏满分纪录。OpenAI核心研究员翁家翌提出了一个强化学习新范式——启发式学习(Heuristic Learning, HL)。

来自主题: AI技术研报
8312 点击    2026-05-09 16:19
AI在偷偷选「自己人」,这是2026最离谱的求职歧视

AI在偷偷选「自己人」,这是2026最离谱的求职歧视

AI在偷偷选「自己人」,这是2026最离谱的求职歧视

如果你这周自己写了求职信,你输给的并不是更好的候选人。你输给了一个更差的候选人,他花了 20 美元给 OpenAI。 今年初,马里兰大学、新加坡国立大学和俄亥俄州立大学的三位研究者从 LiveCare

来自主题: AI技术研报
8380 点击    2026-05-09 13:47
AI时代,HTML才是你所需要的一切?!

AI时代,HTML才是你所需要的一切?!

AI时代,HTML才是你所需要的一切?!

刚刚,在X上Claude Code工程师Thariq的一篇分享——他几乎停止使用 Markdown,转而使用 Claude Code 生成 HTML 文件。在短短几个小时里,这篇帖子的浏览量就突破了 200 万。

来自主题: AI技术研报
8873 点击    2026-05-09 13:20
xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了

xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了

xAI再失华人大将:预训练负责人已离职,马斯克又留不住人了

刚刚,xAI再失一名华人大将。就在今天,预训练负责人庄钧堂官宣了自己的离职消息。此前,庄钧堂已经在xAI工作了两年。这期间,他主导了从Grok 2到Grok 5的全系列预训练,同时负责Grok在X和Tesla上的语音模型及xAI企业API模型。

来自主题: AI资讯
8042 点击    2026-05-09 13:17
大模型不认识马嘉祺?我们做了一次全链路排查

大模型不认识马嘉祺?我们做了一次全链路排查

大模型不认识马嘉祺?我们做了一次全链路排查

MiniMax M2 系列受到了开发者社区的广泛关注,不少用户在深度使用中发现了一些个例问题,其中“模型无法说出马嘉祺”这个问题引发了较多讨论。 我们也注意到,社区中有不少开发者对这个现象进行了高质量

来自主题: AI技术研报
8840 点击    2026-05-09 10:35
破案了!为啥ChatGPT老想着「稳稳地接住你」

破案了!为啥ChatGPT老想着「稳稳地接住你」

破案了!为啥ChatGPT老想着「稳稳地接住你」

其中,大家「讨伐」声量最大的莫过于 ChatGPT 了,从 AI 味儿熏人的经典破折号、「不是 A,而是 B」句式,以及前段时间间歇性出现的「哥布林」,再到如今充满青春伤痛文学矫情劲儿的「我会稳稳接住你」,用户快要被折磨疯了:我们关系可以亲密,但没必要这么亲密。

来自主题: AI资讯
8254 点击    2026-05-08 15:31
ACL 2026|告别冗长思维链!Laser用「概率叠加」重塑多模态大模型隐式推理

ACL 2026|告别冗长思维链!Laser用「概率叠加」重塑多模态大模型隐式推理

ACL 2026|告别冗长思维链!Laser用「概率叠加」重塑多模态大模型隐式推理

为了解决这一痛点,由 MBZUAI、复旦大学、中国人民大学高瓴人工智能学院以及哈佛大学联合组成的研究团队,提出了一种名为 Laser 的全新隐式视觉推理范式。该研究从认知心理学中汲取灵感,引入了 “Forest-before-Trees” 的认知机制,通过动态窗口对齐学习(DWAL),首次实现了在隐空间中维持视觉特征的 “概率叠加” 状态。

来自主题: AI技术研报
6417 点击    2026-05-08 14:07
万帧照片级仿真,打通视觉机器人学习的感知与物理鸿沟:国产仿真器GS-Playground入选RSS 2026

万帧照片级仿真,打通视觉机器人学习的感知与物理鸿沟:国产仿真器GS-Playground入选RSS 2026

万帧照片级仿真,打通视觉机器人学习的感知与物理鸿沟:国产仿真器GS-Playground入选RSS 2026

近日,清华大学智能产业研究院(AIR)DISCOVER Lab 联合谋先飞技术、原力灵机、求之科技和地瓜机器人,提出了新一代高通量视觉高保真仿真器 GS-Playground。该成果已被机器人领域国际顶级学术会议 RSS 2026(Robotics: Science and Systems)录用,标志着国内具身智能仿真基础设施在视觉保真度与训练吞吐量两个维度上同时取得了国际领先水平的突破。

来自主题: AI技术研报
7321 点击    2026-05-08 14:06
token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

token级,精准控制生成长度:3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别,开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型;相同token预算下推理准确率提升10倍(63% vs 6%);沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报
5659 点击    2026-05-08 14:06