AI资讯新闻榜单内容搜索-模型训练

ICLR 2026 oral | AI代码真能进生产环境？SwingArena：从「写对代码Commit」到「通过CI审查」

过去一年，大模型写代码的能力几乎以肉眼可见的速度提升。从简单脚本到完整功能模块，GPT、Claude、DeepSeek 等模型已经能够在几秒钟内生成看起来相当 “专业” 的代码。

来自主题: AI技术研报

8531 点击 2026-02-12 14:56

UIUC开源的智能模型路由框架LLMRouter可以自动为大模型应用选择最优模型，提供16+路由策略，覆盖单轮选择、多轮协作、个性化偏好和Agent式流程，在性能、成本与延迟间灵活权衡。

来自主题: AI技术研报

10292 点击 2026-02-12 14:55

最强的大模型，已经把scaling卷到了一个新维度：百万级上下文。

来自主题: AI技术研报

11059 点击 2026-02-12 10:35

在量化金融的底层，Alpha因子本质上是一段可执行的代码逻辑，它们试图将嘈杂的市场数据映射为精准的交易信号。

来自主题: AI技术研报

11234 点击 2026-02-12 10:34

扩散语言模型（dLLM），这个曾被认为是「小众赛道」的研究方向，如今终于迎来了质变。

来自主题: AI技术研报

9865 点击 2026-02-11 15:26

思考token在精不在多。Yuan 3.0 Flash用RAPO+RIRM双杀过度思考，推理token砍75%，网友们惊呼：这就是下一代AI模型的发展方向！

来自主题: AI技术研报

11280 点击 2026-02-11 14:43

首个统一系统：将物理机器人提升为与 GPU 同等的计算资源，打破硬件隔阂。

来自主题: AI技术研报

9824 点击 2026-02-11 14:00

在十九世纪的暹罗王国曾诞生过这样一对连体兄弟：他们分别拥有完整的四肢和独立的大脑，但他们六十余年的人生被腰部相连着的一段不到十厘米的组织带永远绑定在了一起。他们的连体曾带来无尽的束缚，直到他们离开暹罗，走上马戏团的舞台。十年间，两兄弟以近乎合二为一的默契巡演欧美，获得巨大成功。

来自主题: AI技术研报

6662 点击 2026-02-11 13:59

在当今的大模型后训练（Post-training）阶段，DPO（直接偏好优化）凭借其无需训练独立 Reward Model 的优雅设计和高效性，成功取代 PPO 成为业界的「版本之子」，被广泛应用于 Llama-3、Mistral 等顶流开源模型的对齐中。

来自主题: AI技术研报

8549 点击 2026-02-11 13:58

本⽂的主要作者来⾃上海交通⼤学和上海⼈⼯智能实验室，核⼼贡献者包括任麒冰、郑志杰、郭嘉轩，指导⽼师为⻢利庄⽼师和邵婧⽼师，研究⽅向为安全可控⼤模型和智能体。最近，Moltbook 的爆⽕与随后的迅速

来自主题: AI技术研报

10770 点击 2026-02-11 12:32