AI资讯新闻榜单内容搜索-Jina

回归C++: 在GGUF上构建高效的向量模型

两周前，我们发布了 jina-embeddings-v4 的 GGUF 格式及其多种动态量化版本。jina-embeddings-v4 原模型有 37.5 亿参数，在我们的 GCP G2 GPU 实例上直接运行时效率不高。因此，我们希望通过更小、更快的 GGUF 格式来加速推理。

来自主题: AI资讯

5987 点击 2025-08-28 11:39

大部分现有的文档检索基准（如MTEB）只考虑了纯文本。而一旦文档的关键信息蕴含在图表、截图、扫描件和手写标记中，这些基准就无能为力。为了更好的开发下一代向量模型和重排器，我们首先需要一个能评测模型在视觉复杂文档能力的基准集。

来自主题: AI技术研报

8858 点击 2025-08-07 14:43

在 AI 领域，我们对模型的期待总是既要、又要、还要：模型要强，速度要快，成本还要低。但实际应用时，高质量的向量表征往往意味着庞大的数据体积，既拖慢检索速度，也推高存储和内存消耗。

来自主题: AI技术研报

9254 点击 2025-07-10 11:05

今天，我们正式发布 jina-embeddings-v4，一款全新的多模态向量模型，参数规模达到 38 亿，并首次实现了对文本与图像的同步处理。

来自主题: AI资讯

8550 点击 2025-06-27 10:14

在今年 ICLR 会议上，我们被问到最多且最有意思的问题是：像 Jina AI 这样的向量搜索模型提供商，除了在 MTEB 上做基准测试，会不会做些氛围测试（Vibe-testing)？

来自主题: AI技术研报

8341 点击 2025-05-31 15:20

当你在搜索“中国队在多哈乒乓球锦标赛的成绩”时，一篇新闻报道的文本部分和你的查询的相关性是 0.7，配图的相关性 0.5；另一篇则是文本相关性为 0.6，图片也是 0.6。那么，哪一篇报道才是你真正想要的呢？

来自主题: AI技术研报

7224 点击 2025-05-27 09:57

今天，我们正式发布jina-reranker-m0。这是一款多模态、多语言重排器（reranker），其核心能力在于对包含丰富视觉元素的文档进行重排和精排，同时兼容跨语言场景。

来自主题: AI技术研报

6635 点击 2025-04-09 17:03

如果你已经读过我们上一篇经典长文《DeepSearch/DeepResearch 的设计与实现》，那么不妨再深挖一些能大幅提升回答质量的细节。这次，我们将重点关注两个细节：

来自主题: AI技术研报

9500 点击 2025-03-20 09:57

最近，我们团队的一位工程师在研究类 ColPali 模型时，受到启发，用新近发布的 jina-clip-v2 模型做了个颇具洞察力的可视化实验。

来自主题: AI资讯

8971 点击 2025-01-10 10:48

在大模型 AI 时代，如何通过精确的提示词，让大型语言模型给出更理想的答案，已经成为了一个热门话题。特别是，随着各种免费的提示词优化课程和指南的涌现，这似乎是未来每个人都应该掌握的一个技能。

来自主题: AI资讯

8813 点击 2023-09-30 09:36