AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

token级，精准控制生成长度：3B模型击败GPT 5.4、Claude

LenVM将长度建模提升到token级别，开辟可扩展价值预训练的新维度——3B开源模型精确长度控制全面击败GPT-5.4、Claude-Opus-4-6等顶级闭源模型；相同token预算下推理准确率提升10倍（63% vs 6%）；沿模型规模、数据量、采样数三轴无饱和scaling的value pretraining

来自主题: AI技术研报

6410 点击 2026-05-08 14:06

提速4.48倍！哈工大华为新框架让扩散大模型精度无损、推理起飞

提速4.48倍！哈工大华为新框架让扩散大模型精度无损、推理起飞

提速4.48倍！哈工大华为新框架让扩散大模型精度无损、推理起飞

文本生成这件事，扩散大语言模型（dLLMs）正展现出巨大的潜力。但与此同时，它也面临着严重的计算瓶颈——为此，哈工大（深圳）与华为、深圳河套学院的研究团队提出了一套免训练加速框架Dynamic-dLLM。

来自主题: AI技术研报

8762 点击 2026-05-08 14:05

DeepMind入股硬核网游EVE，要让AI学「黑暗森林」

DeepMind入股硬核网游EVE，要让AI学「黑暗森林」

DeepMind入股硬核网游EVE，要让AI学「黑暗森林」

本周四，Google DeepMind 宣布他们又要开始打游戏了。这次目标还是全世界最硬核的那一款：EVE Online。Google DeepMind 此次宣布收购著名科幻在线角色扮演游戏《EVE Online》（星战前夜）开发商的部分股权，并表示将利用该游戏研究「复杂、动态、玩家驱动的系统中的智能」。

来自主题: AI资讯

9908 点击 2026-05-08 10:11

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

只看图片就能学会压缩Token！浙大&阿里新框架多轮VQA压缩率90%，精度不掉｜CVPR 2026

多轮视觉问答，正在成为LVLM推理效率的“照妖镜”。

来自主题: AI技术研报

8844 点击 2026-05-08 09:52

OpenAI公开大规模稳定训练的秘密，英伟达AMD英特尔都受益

OpenAI公开大规模稳定训练的秘密，英伟达AMD英特尔都受益

OpenAI公开大规模稳定训练的秘密，英伟达AMD英特尔都受益

OpenAI，这次又真·Open了一下。

来自主题: AI技术研报

8149 点击 2026-05-07 15:31

打破碎片化瓶颈！浙大&哈佛开源UniGeo，高保真相机可控编辑

打破碎片化瓶颈！浙大&哈佛开源UniGeo，高保真相机可控编辑

打破碎片化瓶颈！浙大&哈佛开源UniGeo，高保真相机可控编辑

UniGeo通过视频模型的连续视角先验与统一几何引导，实现稳定、高质量的相机可控图像生成，全面超越现有方法，在不同幅度的相机运动中提升跨视角一致性与结构稳定性。

来自主题: AI技术研报

6691 点击 2026-05-07 15:04

Anthropic让AI先读员工手册再上岗：失控率从54%降到7%

Anthropic让AI先读员工手册再上岗：失控率从54%降到7%

Anthropic让AI先读员工手册再上岗：失控率从54%降到7%

Anthropic最新研究让AI先读懂规范背后的意义，再接受行为示范，在特定实验中将Agent失控率从54%压到7%。

来自主题: AI资讯

6002 点击 2026-05-07 15:03

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

TACO: 让 CLI Agent 在自主迭代中学会丢掉无用上下文

随着代码智能从 code foundation models 走向 autonomous coding agents，CLI/terminal 正在成为智能体进入真实软件工程工作流的重要入口。

来自主题: AI技术研报

5954 点击 2026-05-07 15:03

ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈，北大团队提出SEAlign对齐框架：显著提升软件工程智能体决策质量

ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈，北大团队提出SEAlign对齐框架：显著提升软件工程智能体决策质量

ICSE 2026杰出论文 | 突破代码模型真实工程落地瓶颈，北大团队提出SEAlign对齐框架：显著提升软件工程智能体决策质量

在代码大模型和代码智能体技术快速发展的今天，一个日益凸显的现象是：能够在经典代码生成基准上取得优异成绩的模型，一旦被放入真实软件工程环境中，表现却往往大幅下滑。

来自主题: AI技术研报

6879 点击 2026-05-07 15:02

Claude团队用Qwen测试全新训练方法

Claude团队用Qwen测试全新训练方法

Claude团队用Qwen测试全新训练方法

别人做AI中训练都在堆语料、补知识。

来自主题: AI技术研报

7846 点击 2026-05-07 15:01

上一页当前第43页,共430页下一页