AI资讯新闻榜单内容搜索-BAGE

谷歌Gemma4-12B怎么用最好？16G显存轻薄本也能跑起本地多模态SubAgent

过去一年，开源模型的发布节奏已经快到让人麻木。每次发布，伴随的永远是一组跑分、一张能力雷达图，以及几个“超越某某”的结论。

来自主题: AI技术研报

7805 点击 2026-06-11 10:18

Coding Agent 技术全景图：Context Engineering、Subagents 与 Harness，一年范式转移全解析

一年前，行业还在为“从自动补全到 Agent”的进化感到兴奋。然而一年过去，我们不难发现单纯靠“Vibe Coding”和“Prompt 调优”，面对非确定性模型带来的风险和成本问题，显然无法撑起企业级软件开发。

来自主题: AI技术研报

6482 点击 2026-06-09 09:37

VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer（Qwen-Image）、混合 AR-DiT（Qwen-Omni）、统一理解 + 生成（BAGEL、HunyuanImage-3.0）等架构。

来自主题: AI技术研报

7501 点击 2026-05-26 10:26

深度｜AI互动内容的分水岭时刻，AI娱乐应用贝果要搞一场万人直播挑战极限

李诞带火了一个AI娱乐应用贝果，带着好奇，我第一时间通过内部朋友要到了内测资格。最上头的是贝果的“现实 Online”这个产品。它的玩法听上去极其简单：拿起手机，随手一扫，但就在这短短几秒钟里，整个办公室瞬间就被改造成了一个可以实时探索的游戏空间。

来自主题: AI资讯

9706 点击 2026-05-22 15:46

再不怕乱引文献！绕过付费墙，BibAgent把学术核验转为证据链

大模型正在批量生成「看起来很像真的」学术论述，但这些论述背后的引用，真的成立吗？更关键的是：当被引论文被付费墙锁住、原文根本读不到时，自动化核验是否就注定失效？

来自主题: AI技术研报

10235 点击 2026-04-08 16:29

架构解耦是统一多模态模型所必须的吗？全新AIA损失：No

近一年以来，统一理解与生成模型发展十分迅速，该任务的主要挑战在于视觉理解和生成任务本身在网络层间会产生冲突。早期的完全统一模型（如 Emu3）与单任务的方法差距巨大，Janus-Pro、BAGEL 通过一步一步解耦模型架构，极大地减小了与单任务模型的性能差距，后续方法甚至通过直接拼接现有理解和生成模型以达到极致的性能。

来自主题: AI技术研报

9031 点击 2025-12-02 15:17

首篇WebAgents综述：大模型赋能AI Agent，实现下一代Web自动化

互联网技术的发展极大地便利了我们的生活，但许多网络任务重复繁琐，降低了效率。为了解决这一问题，研究人员正在开发基于大型基础模型（LFMs）的智能体——WebAgents，通过感知环境、规划推理和执行交互来完成用户指令，显著提升便利性。香港理工大学的研究人员从架构、训练和可信性等角度，总结了WebAgents的代表性方法，全面梳理了相关研究进展。

来自主题: AI技术研报

8983 点击 2025-08-09 11:24