AI资讯新闻榜单内容搜索-模型

ICLR 2026 | CineTrans: 首个转场可控的多镜头视频生成模型，打破闭源技术壁垒

基于对注意力特性的观察，CineTrans 提出块对角掩码的通用机制，使视频生成模型能高效地自动化转场。为了进一步提升转场模型的效果和准确性，作者设计了详细的多镜头视频生产管线，并收集了一个高质量、多镜头数据集 Cine250K，大幅提升多镜头转场视频生成的效果。作为首个时间级可控的自动化转场模型，CineTrans 为这一领域的众多后续方法提供了关键技术。

来自主题: AI技术研报

8732 点击 2026-02-28 15:05

何恺明团队新作GeoPT，全新预训练范式用合成动力学让模型自学真实物理规律

GeoPT提出了一种全新的动力学提升预训练范式，通过合成动力学（Synthetic Dynamics）将静态几何“提升”到动态空间，让模型在无标签数据上通过学习粒子轨迹演化来获取物理直觉。

来自主题: AI技术研报

8919 点击 2026-02-28 14:58

独家｜VUI Labs宇生月伴完成数千万元天使+轮融资，同创伟业领投，打造行业领先的情感语音大模型和多模态Agent

VUI Labs（宇生月伴）宣布完成数千万元天使+轮融资。本轮投资由同创伟业领投、老股东靖亚资本、小苗朗程持续加注，心流资本FlowCapital担任长期财务顾问。公司半年累计获得近亿元投资，所募资金

来自主题: AI资讯

9178 点击 2026-02-28 10:59

Claude Code“隐形技术栈”被扒出来了！2430次测试揭秘工具偏好清单

最近，专注于量化AI主观决策的基准测试工作室Amplifying.ai，针对Claude Code的工具选择倾向开展了一项系统性研究。研究覆盖3款模型、4种项目类型及20个工具类别，累计分析了2430次工具选择行为。

来自主题: AI技术研报

8796 点击 2026-02-27 17:04

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

8575 点击 2026-02-27 11:35

重磅！阿里云Coding Plan全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5

刚刚，阿里云Coding Plan订阅服务全面上线Qwen3.5、GLM-5、MiniMax M2.5、Kimi K2.5四大顶尖开源模型。用户订阅套餐后，可在Qwen Code、Claude Code、Cline、OpenClaw等AI工具上自由切换使用这些模型，享受更稳定、Tokens额度更高的模型服务。

来自主题: AI资讯

8422 点击 2026-02-27 11:18

算力救不了AI智商？谷歌新大招终结「随机鹦鹉」争论！

传统AI模型在稀疏奖励环境中，往往会找不到激励难以学会层次化思考。如今，谷歌团队通过引入元控制器操控模型内部残差流，让智能体学会了「跳跃式思考」。该研究揭示了大模型内部可自发形成了类似人脑的层次化决策机制，为AI在需要多步的复杂任务提供了全新的训练范式。

来自主题: AI技术研报

7998 点击 2026-02-27 10:58

小模型+Agent Skills能用吗？这份基于POMDP的工业级本地化Agent报告太硬核！

各位对Agent Skill早已轻车熟路。不可否认，在Claude code、Openclaw的加持下，这套框架效果极佳。但工业界的痛点在于：它几乎沦为了超大型闭源API的专属玩具。当您的项目面临金融

来自主题: AI技术研报

8109 点击 2026-02-27 10:48

首次证实RL能让3D模型学会推理，复杂文本描述下生成质量跃升！

当GRPO让大模型在数学、代码推理上实现质变，研究团队率先给出答案——首个将强化学习系统性引入文本到3D自回归生成的研究正式诞生，并被CVPR 2026接收。该研究不只是简单移植2D经验，而是针对3D生成的独特挑战，从奖励设计、算法选择、评测基准到训练范式，做了一套完整的系统性探索。

来自主题: AI技术研报

7484 点击 2026-02-27 10:28

谷歌深夜突发Nano Banana 2，生图圈天塌了！Pro级4K大片，价格砍半

一周一更，谷歌又在深夜扔出「深水炸弹」。就在刚刚，最强生图模型Nano Banana 2横空出世，背靠全新Gemini 3.1 Flash Image。它不仅生成速度飞快，多语言文字处理更强，还能实时联网，一次直出4K大片。

来自主题: AI资讯

9375 点击 2026-02-27 10:07