AI资讯新闻榜单内容搜索-向量

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 向量

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

Embedding相似度不是万金油，电商、新闻场景如何按时效性做rerank

同样是语义相似度结合时效性做rerank，指数衰减、高斯衰减、线性衰减怎么选？假设你要在一个新闻应用中落地语义检索功能，让用户搜索雷军的投资版图盘点时，能自动关联顺为资本、小米战投等核心关联信息。

来自主题: AI技术研报

8762 点击 2025-11-05 09:46

ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics，基于分形水印的主动深度伪造检测与定位

ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics，基于分形水印的主动深度伪造检测与定位

ACM MM 2025 Oral | 新加坡国立大学提出FractalForensics，基于分形水印的主动深度伪造检测与定位

该论文提出 FractalForensics，一种基于分形水印的主动深度伪造检测与定位方法。不同于以往的水印向量，为达成伪造定位的功能，论文提出的水印以矩阵形式出现。

来自主题: AI技术研报

7872 点击 2025-11-04 14:44

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

Embedding黑箱成为历史！这个新框架让模型“先解释，再学Embedding”

让模型先解释，再学Embedding！来自UIUC、ANU、港科大、UW、TAMU等多所高校的研究人员，最新推出可解释的生成式Embedding框架——GRACE。过去几年，文本表征（Text Embedding）模型经历了从BERT到E5、GTE、LLM2Vec，Qwen-Embedding等不断演进的浪潮。这些模型将文本映射为向量空间，用于语义检索、聚类、问答匹配等任务。

来自主题: AI技术研报

7316 点击 2025-10-22 15:00

公告：Elastic (NYSE: ESTC) 完成对Jina AI的收购

公告：Elastic (NYSE: ESTC) 完成对Jina AI的收购

公告：Elastic (NYSE: ESTC) 完成对Jina AI的收购

纽约时间 2025 年 10 月 9 日早上 9 点，Elastic (NYSE: ESTC) 在其官网宣布完成了对 Jina AI 的收购。ina AI 原 CEO 肖涵将在 Elastic 担任 VP of AI，负责 AI 方向的战略和研发。由肖涵带领的核心Jina团队将继续在向量模型、重排器、Reader 和小模型上推进搜索 AI 的发展。

来自主题: AI资讯

9272 点击 2025-10-10 13:12

让 llama.cpp 支持多模态向量模型

让 llama.cpp 支持多模态向量模型

让 llama.cpp 支持多模态向量模型

几周前，我们发布了 jina-embeddings-v4 模型的 GGUF 版本，大幅降低了显存占用，提升了运行效率。不过，受限于 llama.cpp 上游版本的运行时，当时的 GGUF 模型只能当作文本向量模型使用而无法支持多模态向量的输出。

来自主题: AI技术研报

8462 点击 2025-09-20 09:42

Jina Code Embeddings: 为高质量代码搜索而生的0.5B/1.5B向量模型

Jina Code Embeddings: 为高质量代码搜索而生的0.5B/1.5B向量模型

Jina Code Embeddings: 为高质量代码搜索而生的0.5B/1.5B向量模型

我们今天正式开源 jina-code-embeddings，一套全新的代码向量模型。包含 0.5B 和 1.5B 两种参数规模，并同步推出了 1-4 bit 的 GGUF 量化版本，方便在各类端侧硬件上部署。

来自主题: AI技术研报

9706 点击 2025-09-11 16:01

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

DeepMind爆火论文：向量嵌入模型存在数学上限，Scaling laws放缓实锤？

这几天，一篇关于向量嵌入（Vector Embeddings）局限性的论文在 AlphaXiv 上爆火，热度飙升到了近 9000。

来自主题: AI技术研报

6552 点击 2025-09-03 13:21

你的RAG系统有个数学BUG，DeepMind首次证明嵌入向量检索召回能力有限

你的RAG系统有个数学BUG，DeepMind首次证明嵌入向量检索召回能力有限

你的RAG系统有个数学BUG，DeepMind首次证明嵌入向量检索召回能力有限

最近，工业界“RAG已死”甚嚣尘上。过去几年，AI领域的主旋律是“规模定律”（Scaling Law），即更大的模型、更多的数据会带来更好的性能。即便偶然有瑕疵，也认为只是工程上的不足，并非数学上的不可能。

来自主题: AI技术研报

9350 点击 2025-09-03 11:54

回归C++: 在GGUF上构建高效的向量模型

回归C++: 在GGUF上构建高效的向量模型

回归C++: 在GGUF上构建高效的向量模型

两周前，我们发布了 jina-embeddings-v4 的 GGUF 格式及其多种动态量化版本。jina-embeddings-v4 原模型有 37.5 亿参数，在我们的 GCP G2 GPU 实例上直接运行时效率不高。因此，我们希望通过更小、更快的 GGUF 格式来加速推理。

来自主题: AI资讯

7578 点击 2025-08-28 11:39

JinaVDR: 一个图文混排文档搜索任务的基准集

JinaVDR: 一个图文混排文档搜索任务的基准集

JinaVDR: 一个图文混排文档搜索任务的基准集

大部分现有的文档检索基准（如MTEB）只考虑了纯文本。而一旦文档的关键信息蕴含在图表、截图、扫描件和手写标记中，这些基准就无能为力。为了更好的开发下一代向量模型和重排器，我们首先需要一个能评测模型在视觉复杂文档能力的基准集。

来自主题: AI技术研报

10373 点击 2025-08-07 14:43

上一页当前第2页,共8页下一页