AI资讯新闻榜单内容搜索-训练

浙大联手字节：开源大规模指令跟随视频编辑数据集OpenVE-3M

作者提出了一个大规模、高质量、多类别的指令跟随的视频编辑数据集 OpenVE-3M，共包含 3M 样本对，分为空间对齐和非空间对齐 2 大类别共 8 小类别。

来自主题: AI技术研报

7863 点击 2025-12-17 09:22

AI Agent最新「Memory」综述｜多所顶尖机构联合发布

就在昨天，新加坡国立大学、中国人民大学、复旦大学等多所顶尖机构联合发布了一篇AI Agent 记忆（Memory）综述。

来自主题: AI技术研报

9554 点击 2025-12-17 09:21

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

从 0 到上线，在OpenAI内部，安卓版 Sora经历的时间只有 28 天，而且期间只用了 2-3 名员工。

来自主题: AI资讯

7978 点击 2025-12-16 16:30

让扩散模型「可解释」不再降质，开启图片编辑新思路

过去三年，扩散模型席卷图像生成领域。以 DiT (Diffusion Transformer) 为代表的新一代架构不断刷新图像质量的极限，让模型愈发接近真实世界的视觉规律。

来自主题: AI技术研报

8308 点击 2025-12-16 16:27

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

南洋理工大学研究人员构建了EHRStruct基准，用于评测LLM处理结构化电子病历的能力。该基准涵盖11项核心任务，包含2200个样本，按临床场景、认知层级和功能类别组织。研究发现通用大模型优于医学专用模型，数据驱动任务表现更强，输入格式和微调方式对性能有显著影响。

来自主题: AI技术研报

10687 点击 2025-12-16 16:27

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

近期，强化学习（RL）技术在提升语言模型的推理能力方面取得了显著成效。

来自主题: AI技术研报

6996 点击 2025-12-16 16:26

打脸哲学无用！牛津博士教出Claude，自曝百万年薪提示词秘诀

在Anthropic，有一位驻场哲学家Amanda Askell专门研究如何与AI模型打交道。她不仅主导设计了Claude的性格、对齐与价值观机制，还总结出一些行之有效的提示词技巧。哲学在AI时代不仅没有落伍，反而那些通过哲学训练掌握提示词技巧的人，年薪中位数可以高达15万美元。

来自主题: AI资讯

7635 点击 2025-12-16 14:40

Veo何止生成视频：DeepMind正在用它模拟整个机器人世界

随着通用型（Generalist）机器人策略的发展，机器人能够通过自然语言指令在多种环境中完成各类任务，但这也带来了显著的挑战。

来自主题: AI技术研报

10659 点击 2025-12-16 14:39

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

如果把用户在互联网上留下的每一个足迹都看作一段记忆，那么现在的推荐系统大多患有 “短期健忘症”。

来自主题: AI技术研报

10017 点击 2025-12-16 14:38

推特吵架吵出篇论文！谢赛宁团队新作iREPA只要3行代码

要说真学术，还得看推特。

来自主题: AI技术研报

6960 点击 2025-12-16 14:37

AI资讯新闻榜单内容搜索-训练

浙大联手字节：开源大规模指令跟随视频编辑数据集OpenVE-3M

AI Agent最新「Memory」综述 ｜多所顶尖机构联合发布

OpenAI最强产品负责人：AGI限制在于人，不在LLM！Codex已能待命自我训练，曝内部压缩机制，18天3人上线安卓Sora

让扩散模型「可解释」不再降质，开启图片编辑新思路

医疗AI迎来大考！南洋理工发布首个LLM电子病历处理评测 | AAAI'26

RL是「点金石」还是「挖掘机」？CMU 用可控实验给出答案

打脸哲学无用！牛津博士教出Claude，自曝百万年薪提示词秘诀

Veo何止生成视频：DeepMind正在用它模拟整个机器人世界

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

推特吵架吵出篇论文！谢赛宁团队新作iREPA只要3行代码

AI Agent最新「Memory」综述｜多所顶尖机构联合发布