AI资讯新闻榜单内容搜索-训练

1080条提示词、7款模型大比拼：视频生成离「好看、好用又准确」还差多少？

当视频生成模型走出娱乐创作的舒适区，进入科学、医疗、教育等知识密集场景，它们是否还能生成事实准确、清晰可用的视频？

来自主题: AI技术研报

10126 点击 2026-06-16 09:53

PE-Field将传统的2D位置编码扩展为结构化的3D场，使DiT能够更加直接地在3D空间中处理几何信息。

来自主题: AI技术研报

6760 点击 2026-06-16 09:52

如果你在三年前问AI圈：未来最强的AI长什么样？

来自主题: AI技术研报

9764 点击 2026-06-15 14:21

新智元报道【新智元导读】FuseSearch：学习型自适应并行执行 —— 一个40亿参数的模型，凭什么在代码定位上干过了商用闭源大模型？答案只有四个字：搜得更聪明。在AI编程狂飙突进的今天，一个尴

来自主题: AI技术研报

6640 点击 2026-06-15 14:20

被ICML 2026接收为Spotlight！

来自主题: AI技术研报

7159 点击 2026-06-15 13:51

如今手机拍照已成日常，后期修图是提升照片质感的关键。

来自主题: AI技术研报

9908 点击 2026-06-15 09:21

当 LLM Agent 处理长期对话、多轮交互和复杂文档时，Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文，并支撑跨时间的推理能力。

来自主题: AI技术研报

9059 点击 2026-06-15 09:20

大模型已经能流畅对话、看图识物，但一个更底层的问题始终没被真正解决——它们是否「理解」了我们所处的三维世界？

来自主题: AI技术研报

6346 点击 2026-06-15 09:19

多模态大模型越来越会读图中文字，但最新研究显示，「读得出来」并不等于「防得住」。西湖大学 AGI Lab 的研究团队发现，当有害文本被渲染成低清、模糊或带噪图片后，模型在一个特定清晰度区间内反而更容易被越狱。

来自主题: AI技术研报

7356 点击 2026-06-15 09:19

雨雪、雾霾、镜头噪点、压缩失真、夜间弱光……

来自主题: AI技术研报

7646 点击 2026-06-15 09:19