AI资讯新闻榜单内容搜索-Embedding

清华AI数学家来了！从想法一路推到定理，参与完成84页量子算法论文

研究团队提出了符号嵌入量子算法（Sign Embedding Quantum Algorithms），形成了一篇84页的量子算法论文。可以说，相比此前主要解决研究者给定的开放数学问题，这一次，AIM开始参与研究问题的提出与方向探索。

来自主题: AI技术研报

8511 点击 2026-07-10 10:41

多模态 Agent 记忆，为什么不能当成升级版多模态RAG？

多模态 Agent 的记忆系统，过去很容易被理解成一个升级版 RAG：图片、图表、PDF 进来之后，先抽取内容、做 embedding、写进向量库；用户提问时，再用 query 做检索，把命中的top-k图片、文档页或图表一并塞进上下文，再交给多模态模型回答。整个过程中，所有原始模态信息都会不加选择的塞给大模型。

来自主题: AI技术研报

8232 点击 2026-07-10 10:39

WWW时间检验奖颁给唐建博士：图神经网络的十年远征与AI制药的底层逻辑

一篇发表于 2015 年的论文《LINE: Large-scale Information Network Embedding》被授予 Seoul Test of Time Award（时间检验奖）。这篇由国际知名 AI4S 科学家、Mila 终身教授、百奥几何公司创始人唐建博士领衔

来自主题: AI资讯

8874 点击 2026-07-07 10:23

在线教育行业，如何用Milvus混合检索+微调embedding做题库检索与去重

在教育科技领域，题库是核心资产，更是连接学生、教师与知识体系的关键入口。

来自主题: AI技术研报

7888 点击 2026-05-21 09:48

jina-embeddings-v5-omni 发布！全模态向量小模型

jina-embeddings-v5-omni正式发布，我们把 v5-text 向量模型的能力延伸到图像、音频和视频。文本侧不变，v5-omni 产出的文本向量与 v5-text逐字节一致，无需重建任何已有索引。

来自主题: AI资讯

9400 点击 2026-05-14 20:31

Google放大招：文字、图片、视频、音频、PDF，全部压进同一个向量空间！Gemini Embedding 2正式GA

Google悄悄干了一件大事——Gemini Embedding 2正式进入GA阶段，成为Gemini API中第一个原生多模态embedding模型。它能把文本、图片、视频、音频、PDF文档全部映射进同一个统一向量空间，支持100多种语言。

来自主题: AI资讯

10944 点击 2026-05-02 15:05

早于DeepSeek Engram！用「查表」重置Transformer记忆 | ICLR

ICLR论文STEM架构率先提出「查表式记忆」架构，早于DeepSeek Engram三个月。它将Transformer的FFN从动态计算改为静态查表，用token索引的embedding表直接读取记忆，彻底解耦记忆容量与计算开销。

来自主题: AI技术研报

8921 点击 2026-03-31 10:04

从多模态大模型中「拆」出音频向量模型

Google 最近发了 Gemini Embedding 2，他们第一个原生多模态向量模型。文本、图像、视频、音频、文档，全部映射到同一个 3072 维向量空间。这是 Omni Embedding（全模态向量模型）的大趋势：一个架构吃下所有模态，从 jina-embeddings-v4 到 Omni-Embed-Nemotron 再到 Omni-5，大家都在往这个方向收敛。

来自主题: AI技术研报

6428 点击 2026-03-16 15:06

谷歌AGI底座降临！首个原生全模态嵌入模型上线，已实现全模态SOTA

谷歌发布首个原生全模态 Embedding 模型 Gemini Embedding 2！它将文本、图、音视频及 PDF 无损融于统一向量空间，实现跨越五大模态的直接检索。这极大降低了架构成本，赋予了 AI 真正连贯的「记忆」，是重塑 AI 基建的里程碑。

来自主题: AI资讯

9785 点击 2026-03-12 10:21

让龙虾看懂屏幕！谷歌多模态新成果，文本图像视频音频进同一空间

刚刚，谷歌发布了首个原生多模态（Multimodal）嵌入模型——Gemini Embedding 2。这次模型最大的变化在于：把文本、图像、视频、音频和文档，全部映射进同一个统一的嵌入空间。

来自主题: AI资讯

7359 点击 2026-03-11 16:59