AI资讯新闻榜单内容搜索-工智能

ICCV 2025最佳论文出炉！何恺明、孙剑等十年经典之作夺奖

ICCV最佳论文新鲜出炉了！今年，CMU团队满载而归，斩获最佳论文奖和最佳论文提名。同时，何恺明团队论文，RBG大神提出的Fast R-CNN，十年后斩获Helmholtz Prize，实至名归。

来自主题: AI技术研报

9150 点击 2025-10-22 15:22

刷屏的《海贼王》真人版片场花絮，居然是 AI 做的，4 步教你复刻同款

视频里，演员们穿着精致的戏服，在片场与工作人员互动、准备拍摄；摄影机、灯光、演员、助理，全都在忙。就是这样一个 35 秒的「泄露」片段，在社交媒体上迅速疯传，YouTube 相关视频播放量破千万。

来自主题: AI资讯

9256 点击 2025-10-22 15:15

如果中国大模型不再开源

美国 AI 圈开始出现“担心中国开源断供”的苗头了吗？10 月 20 日，在专注于开源模型讨论、拥有 55 万成员的 Reddit 分论坛“r/LocalLLaMA”上，一位网友发布了一则“当中国公司停止提供开源模型时会发生什么？”的提问，并表达了假如中国模型逐渐闭源或开始收费该怎么办的担忧。

来自主题: AI资讯

8885 点击 2025-10-22 15:06

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

8594 点击 2025-10-22 15:00

轻量高效，即插即用：Video-RAG为长视频理解带来新范式

尽管视觉语言模型（LVLMs）在图像与短视频理解中已取得显著进展，但在处理长时序、复杂语义的视频内容时仍面临巨大挑战 —— 上下文长度限制、跨模态对齐困难、计算成本高昂等问题制约着其实际应用。针对这一难题，厦门大学、罗切斯特大学与南京大学联合提出了一种轻量高效、无需微调的创新框架 ——Video-RAG。

来自主题: AI技术研报

8185 点击 2025-10-22 14:57