AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
谷歌给「AI解数学题」神话降温:能摘低垂果实,但过程依然痛苦

谷歌给「AI解数学题」神话降温:能摘低垂果实,但过程依然痛苦

谷歌给「AI解数学题」神话降温:能摘低垂果实,但过程依然痛苦

刚刚,谷歌发布了一项新的研究进展:他们用 Gemini 做了一次系统性的数学攻关实验,把目标对准了著名的 Erdős Problems 数据库里 700 个仍被标注为 open(未解决)的猜想。

来自主题: AI技术研报
9675 点击    2026-02-04 17:24
致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

致敬Kimi K2:基于slime的全流程INT4量化感知RL训练

受 Kimi K2 团队启发,SGLang RL 团队成功落地了 INT4 量化感知训练(QAT) 流程方案。通过 “训练端伪量化 + 推理端真实量化(W4A16)” 的方案组合,我们实现了媲美 BF16 全精度训练的稳定性与训推一致性,

来自主题: AI技术研报
6297 点击    2026-02-04 16:32
ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

ICLR 2026 | Rebuttal 是一场「带着镣铐的舞蹈」?港科 RebuttalAgent 用心智理论「读懂」审稿人

面对同行评审,许多作者都有过这样的经历:明明回答了审稿人的每一个问题,态度也足够谦卑,为什么最终还是没能打动对方?

来自主题: AI技术研报
7184 点击    2026-02-04 16:30
刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习

刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习

刚刚,腾讯姚顺雨署名首篇论文发布,「下半场」先搞上下文学习

不久前在 AGI-Next 前沿峰会上,姚顺雨曾分享过一个核心观点:模型想要迈向高价值应用,核心瓶颈就在于能否「用好上下文(Context)」。

来自主题: AI技术研报
6723 点击    2026-02-04 16:26
像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

像开发软件一样造世界,Agent2World来了,把世界模型做成可运行的符号环境

让模型真正 “能行动”,往往需要一个可执行、可验证的符号世界模型(Symbolic World Model):它不是抽象的文字描述,而是能被规划器或执行器直接调用的形式化定义 —— 例如 PDDL 领域 / 问题,或可运行的环境代码 / 模拟器。

来自主题: AI技术研报
6637 点击    2026-02-03 09:11
Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档

Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档

Clawdbot 如何搭建永久记忆管理系统:全靠 MD 文档

Clawdbot(现改名为 OpenClaw) 体验下来,持久的记忆管理系统很是让人惊艳——全天候保持上下文,无限期地记住对话并在此基础上持续深化互动。

来自主题: AI技术研报
7096 点击    2026-02-03 08:45
OpenClaw们狂奔,谁来焊死安全车门?

OpenClaw们狂奔,谁来焊死安全车门?

OpenClaw们狂奔,谁来焊死安全车门?

OpenClaw、Moltbook彻底火了。

来自主题: AI资讯
10015 点击    2026-02-03 08:43