AI资讯新闻榜单内容搜索-模型

Seedream 4.0大战Nano Banana、GPT-4o？EdiVal-Agent 终结图像编辑评测

在 AIGC 的下一个阶段，图像编辑（Image Editing）正逐渐取代一次性生成，成为检验多模态模型理解、生成与推理能力的关键场景。我们该如何科学、公正地评测这些图像编辑模型？

来自主题: AI技术研报

6944 点击 2025-10-25 14:26

最新Agentic Search综述，RL让Agent自主检索，RAG逐渐成为过去式

AI在线强化学习“边做边学”，斯坦福团队让7B小模型性能飙升，甚至超越GPT-4o

斯坦福等新框架，用在线强化学习让智能体系统“以小搏大”，领先GPT-4o—— AgentFlow，是一种能够在线优化智能体系统的新范式，可以持续提升智能体系统对于复杂问题的推理能力。

来自主题: AI技术研报

6211 点击 2025-10-25 14:03

验证者定律，智能的锯齿边缘和商品化，CoT之父Jason Wei2025AI进展的三个思路

在这片喧嚣和迷雾之中，我们迫切需要一个清晰的导航图。而Jason Wei正是提供这份地图的最佳人选之一。他现任Meta超级智能实验室（Meta Super Intelligence Labs）的研究科学家，此前在OpenAI工作了两年，o1研发的主导者，更早之前是Google Brain的科学家。

来自主题: AI技术研报

8524 点击 2025-10-25 13:09

超越Runway！Adobe发布新神器：P视频比P图还简单

全新AI工具EditVerse将图片和视频编辑整合到一个框架中，让你像P图一样轻松P视频。通过统一的通用视觉语言和上下文学习能力，EditVerse解决了传统视频编辑复杂、数据稀缺的问题，还能实现罕见的「涌现能力」。在效果上，它甚至超越了商业工具Runway，预示着一个创作新纪元的到来。

来自主题: AI技术研报

8406 点击 2025-10-25 10:42

死磕「文本智能」，多模态研究的下一个前沿

dots.ocr 支持多语言文档的解析，能够在单一模型中统一完成版面检测、文本识别、表格解析、公式提取等任务，并保持良好的阅读顺序。他们之所以在一个模型中完成这些任务，是因为他们相信这些任务之间可以相互促进，为彼此提供更多的 context，从而达到更高的性能上限。目前，该项目的 star 量已经超过了 5000。

来自主题: AI资讯

8607 点击 2025-10-25 10:41

比Qwen3-Max更Max？夸克抢先用上最新闭源模型

10 月 23 日，一向不爱出风头的夸克上线了对话助手，可以让用户在一个 App 内即可完成信息查找、问题解答与任务处理，实现了 AI 搜索与对话的深度融合。其中一大亮点就是，该对话助手采用了 Qwen 最新闭源模型。至于是哪个型号、性能有多强，夸克卖了个关子，只透露比 Qwen3-Max 更进一步，在业界有绝对领先性。

来自主题: AI资讯

8763 点击 2025-10-24 17:09