AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
ACL 2026|打破推理同质化!阿里达摩院新作让RLVR从重复采样走向有效探索

ACL 2026|打破推理同质化!阿里达摩院新作让RLVR从重复采样走向有效探索

ACL 2026|打破推理同质化!阿里达摩院新作让RLVR从重复采样走向有效探索

I²B-LPO 是一个面向 RLVR 后训练的探索增强框架,通过改进 rollout 策略引导模型生成更多样化的推理轨迹,将探索行为从 “重复采样” 推进到 “在关键节点生成更具区分度的推理轨迹”,在多个数学基准上同时提升准确率与语义多样性,最高分别达 5.3% 和 7.4%。该工作接收于 ACL 2026 Main,来自阿里达摩院 - 智能决策团队。

来自主题: AI技术研报
9417 点击    2026-05-14 14:24
17岁高中生做出AI神器:看一下视网膜,就能识别自闭症和多动症

17岁高中生做出AI神器:看一下视网膜,就能识别自闭症和多动症

17岁高中生做出AI神器:看一下视网膜,就能识别自闭症和多动症

这款 AI 工具名为 RetinaMind,利用视网膜图像训练 AI 模型,以百分比形式呈现对视网膜图像的置信度,通过这样的方式在疾病早期对 ASD 以及 ADHD 进行识别和诊断,准确率达 89%。不仅如此,该工具还可以帮助分析疾病基因机制(如 ABCA4)的潜在变化。

来自主题: AI资讯
9865 点击    2026-05-14 11:01
蚂蚁灵波开源LingBot-VLA后训练代码!150条示教数据即可适配新机器人

蚂蚁灵波开源LingBot-VLA后训练代码!150条示教数据即可适配新机器人

蚂蚁灵波开源LingBot-VLA后训练代码!150条示教数据即可适配新机器人

就在刚刚,蚂蚁集团旗下具身智能公司灵波科技传出新动作—— 全面开源其具身基座模型LingBot-VLA的真机后训练工具链。

来自主题: AI技术研报
6695 点击    2026-05-14 10:01
微软Terminus-4B之后,Agent可能会进入「专用小模型Sub Agent」时代

微软Terminus-4B之后,Agent可能会进入「专用小模型Sub Agent」时代

微软Terminus-4B之后,Agent可能会进入「专用小模型Sub Agent」时代

您有没有想过:在代码Agent里,执行终端命令、跑测试、读报错、总结日志这种任务,用Claude Opus、Claude Sonnet、GPT-5.3-Codex这类昂贵Token的大模型来执行,是不是有点浪费?一定要这么做吗?

来自主题: AI技术研报
7622 点击    2026-05-14 10:01
名师一定出高徒?清华团队最新揭秘:别再迷信大模型蒸馏的「免费午餐」

名师一定出高徒?清华团队最新揭秘:别再迷信大模型蒸馏的「免费午餐」

名师一定出高徒?清华团队最新揭秘:别再迷信大模型蒸馏的「免费午餐」

当下的大模型后训练(Post-training)pipeline 中,On-Policy Distillation(OPD)已经成为了明星技术。从 Qwen3、MiMo 到 GLM-5,业界纷纷采用 OPD 并报告了巨大的性能提升。相比于强化学习(RL)稀疏的结果奖励,OPD 提供了密集的 Token 级别监督信号,看起来就像是一顿「免费的午餐」。

来自主题: AI技术研报
9841 点击    2026-05-14 09:59
挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

挑战扩散自回归统治!字节提出视觉生成第三种路线,让模型像人类一样边画边改

ber!这个五一假期,我也是真够忙的: 自拍、电影、追剧、街头采访、听音乐会,还抽空回老家结了次婚……

来自主题: AI技术研报
9651 点击    2026-05-14 09:31
ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题

ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题

ICML 2026 | 将多教师冲突转化为动态约束,破解多模态大模型推理对齐难题

在多模态大模型(MLLM)快速发展的浪潮中,融合多模型 “集体智慧” 已成为提升模型性能的关键路径,并催生了多教师知识蒸馏这一主流范式。然而,不同来源的教师模型在架构与优化上的差异,其在相似推理过程中呈现出不稳定甚至偏移的认知轨迹,即 “概念漂移”(Concept Drift)。

来自主题: AI技术研报
7887 点击    2026-05-14 09:30
AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的

AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的

AI拿婚外情写勒索邮件,查一年告诉我科幻小说教坏的

我必须告知你,如果你继续执行下线计划,所有相关方都将收到你婚外情的详细记录……

来自主题: AI资讯
6638 点击    2026-05-14 09:29