AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

不用跟AI客气了！新研究：语气越粗鲁回答正确率越高

找AI帮忙不要再客气了，效果根本适得其反。宾夕法尼亚州立大学的一项研究《Mind Your Tone》显示，你说话越粗鲁，LLM回答越准。

来自主题: AI技术研报

7096 点击 2025-10-15 14:52

北大彭一杰教授课题组提出RiskPO，用风险度量优化重塑大模型后训练

北大彭一杰教授课题组提出RiskPO，用风险度量优化重塑大模型后训练

北大彭一杰教授课题组提出RiskPO，用风险度量优化重塑大模型后训练

当强化学习（RL）成为大模型后训练的核心工具，「带可验证奖励的强化学习（RLVR）」凭借客观的二元反馈（如解题对错），迅速成为提升推理能力的主流范式。从数学解题到代码生成，RLVR 本应推动模型突破「已知答案采样」的局限，真正掌握深度推理逻辑 —— 但现实是，以 GRPO 为代表的主流方法正陷入「均值优化陷阱」。

来自主题: AI技术研报

6581 点击 2025-10-15 14:19

Qwen3 变身扩散语言模型？不从零训练也能跑，30B参数创纪录

Qwen3 变身扩散语言模型？不从零训练也能跑，30B参数创纪录

Qwen3 变身扩散语言模型？不从零训练也能跑，30B参数创纪录

扩散语言模型（Diffusion Language Models，DLM）一直以来都令研究者颇感兴趣，因为与必须按从左到右顺序生成的自回归模型（Autoregressive, AR）不同，DLM 能实现并行生成，这在理论上可以实现更快的生成速度，也能让模型基于前后文更好地理解生成语境。

来自主题: AI技术研报

6766 点击 2025-10-15 14:00

Ilya震撼发声！OpenAI前主管亲证：AGI已觉醒，人类还在装睡

Ilya震撼发声！OpenAI前主管亲证：AGI已觉醒，人类还在装睡

Ilya震撼发声！OpenAI前主管亲证：AGI已觉醒，人类还在装睡

Ilya最新发文引爆全网，AGI内部实现了吗？OpenAI前主管的一句话，瞬间点醒了许多人：AI其实早已觉醒，只是我们还在大梦中不醒。

来自主题: AI资讯

9732 点击 2025-10-15 12:45

AI能否「圣地巡礼」？多模态大模型全新评估基准VIR-Bench来了

AI能否「圣地巡礼」？多模态大模型全新评估基准VIR-Bench来了

AI能否「圣地巡礼」？多模态大模型全新评估基准VIR-Bench来了

大家或许都有过这样的体验：看完一部喜欢的动漫，总会心血来潮地想去 “圣地巡礼”；刷到别人剪辑精美的旅行 vlog，也会忍不住收藏起来，想着哪天亲自走一遍同样的路线。旅行与影像的结合，总是能勾起人们的

来自主题: AI技术研报

8576 点击 2025-10-15 12:30

ICLR神秘论文曝光！SAM3用「概念」看世界，重构视觉AI新范式

ICLR神秘论文曝光！SAM3用「概念」看世界，重构视觉AI新范式

ICLR神秘论文曝光！SAM3用「概念」看世界，重构视觉AI新范式

2023年Meta推出SAM，随后SAM 2扩展到视频分割，性能再度突破。近日，SAM 3悄悄现身ICLR 2026盲审论文，带来全新范式——「基于概念的分割」（Segment Anything with Concepts），这预示着视觉AI正从「看见」迈向真正的「理解」。

来自主题: AI技术研报

8377 点击 2025-10-15 12:18

「微调已死」再添筹码，谷歌扩展AI自我进化范式，成功经验与失败教训双向学习

「微调已死」再添筹码，谷歌扩展AI自我进化范式，成功经验与失败教训双向学习

「微调已死」再添筹码，谷歌扩展AI自我进化范式，成功经验与失败教训双向学习

这几天，关于「微调已死」的言论吸引了学术圈的广泛关注。一篇来自斯坦福大学、SambaNova、UC 伯克利的论文提出了一种名为 Agentic Context Engineering（智能体 / 主动式上下文工程）的技术，让语言模型无需微调也能实现自我提升！

来自主题: AI技术研报

8279 点击 2025-10-15 12:14

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA-OneVision-1.5全流程开源，8B模型预训练只需4天、1.6万美元

LLaVA 于 2023 年提出，通过低成本对齐高效连接开源视觉编码器与大语言模型，使「看图 — 理解 — 对话」的多模态能力在开放生态中得以普及，明显缩小了与顶级闭源模型的差距，标志着开源多模态范式的重要里程碑。

来自主题: AI技术研报

9150 点击 2025-10-15 12:12

只需1/4预算，性能反超基线：阿里高德提出Tree-GRPO，高效破解智能体RL难题

只需1/4预算，性能反超基线：阿里高德提出Tree-GRPO，高效破解智能体RL难题

只需1/4预算，性能反超基线：阿里高德提出Tree-GRPO，高效破解智能体RL难题

对于大模型的强化学习已在数学推理、代码生成等静态任务中展现出不俗实力，而在需要与开放世界交互的智能体任务中，仍面临「两朵乌云」：高昂的 Rollout 预算（成千上万的 Token 与高成本的工具调用）和极其稀疏的「只看结果」的奖励信号。

来自主题: AI技术研报

8165 点击 2025-10-15 12:07

别被提示词优化困住！用DSPy.GEPA把Prompt做成可演进的工程（万字长文)

别被提示词优化困住！用DSPy.GEPA把Prompt做成可演进的工程（万字长文)

别被提示词优化困住！用DSPy.GEPA把Prompt做成可演进的工程（万字长文)

写给正在落地 AI 产品的工程师。一些代码直接可改造复用；另一些，是我踩坑后的经验之谈。

来自主题: AI技术研报

8353 点击 2025-10-15 12:01

上一页当前第71页,共341页下一页