AI资讯新闻榜单内容搜索-Embedding

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Embedding
回归C++: 在GGUF上构建高效的向量模型

回归C++: 在GGUF上构建高效的向量模型

回归C++: 在GGUF上构建高效的向量模型

两周前,我们发布了 jina-embeddings-v4 的 GGUF 格式及其多种动态量化版本。jina-embeddings-v4 原模型有 37.5 亿参数,在我们的 GCP G2 GPU 实例上直接运行时效率不高。因此,我们希望通过更小、更快的 GGUF 格式来加速推理。

来自主题: AI资讯
8094 点击    2025-08-28 11:39
Jina Embeddings v4 的量化感知训练

Jina Embeddings v4 的量化感知训练

Jina Embeddings v4 的量化感知训练

在 AI 领域,我们对模型的期待总是既要、又要、还要:模型要强,速度要快,成本还要低。但实际应用时,高质量的向量表征往往意味着庞大的数据体积,既拖慢检索速度,也推高存储和内存消耗。

来自主题: AI技术研报
10777 点击    2025-07-10 11:05
视频世界模型JEPA‑2与Meta AI的具身智能系统

视频世界模型JEPA‑2与Meta AI的具身智能系统

视频世界模型JEPA‑2与Meta AI的具身智能系统

JEPA-2(V-JEPA 2)是Meta最新推出的视频世界模型,采用视图嵌入预测(Joint Embedding Predictive Architecture)框架进行自监督预训练。

来自主题: AI资讯
7400 点击    2025-07-01 10:30
Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

Jina Embeddings V4: 为搜索而生,多模态多语言向量模型

今天,我们正式发布 jina-embeddings-v4,一款全新的多模态向量模型,参数规模达到 38 亿,并首次实现了对文本与图像的同步处理。

来自主题: AI资讯
10565 点击    2025-06-27 10:14
刚刚,LeCun亲自出镜,Meta推出新世界模型-V-JEPA 2!

刚刚,LeCun亲自出镜,Meta推出新世界模型-V-JEPA 2!

刚刚,LeCun亲自出镜,Meta推出新世界模型-V-JEPA 2!

就在刚刚,Meta 又有新的动作,推出基于视频训练的世界模型 V-JEPA 2(全称 Video Joint Embedding Predictive Architecture 2)。其能够实现最先进的环境理解与预测能力,并在新环境中完成零样本规划与机器人控制。

来自主题: AI资讯
9951 点击    2025-06-12 10:33
搞RAG开发,听都没听说过Embedding模型排名,快看下MMTEB嵌入基准 | ICLR2025

搞RAG开发,听都没听说过Embedding模型排名,快看下MMTEB嵌入基准 | ICLR2025

搞RAG开发,听都没听说过Embedding模型排名,快看下MMTEB嵌入基准 | ICLR2025

什么,你在开发RAG竟然还没听说过Embedding模型还有排名?在AI应用开发热潮中,Embedding模型的选择已成为决定RAG系统成败的关键因素。然而,令人惊讶的是,许多开发者仍依靠直觉或跟风选择模型,而非基于系统化评估。

来自主题: AI技术研报
11757 点击    2025-03-03 10:40
豪掷 2.2 亿美元!MongoDB 官宣收购一家刚成立 17 个月的 AI 公司,由清华姚班校友创立

豪掷 2.2 亿美元!MongoDB 官宣收购一家刚成立 17 个月的 AI 公司,由清华姚班校友创立

豪掷 2.2 亿美元!MongoDB 官宣收购一家刚成立 17 个月的 AI 公司,由清华姚班校友创立

在科技界,快速崛起和巨额交易总是备受关注。本周,MongoDB 宣布以 2.2 亿美元的价格收购 Voyage AI——一家刚成立 17 个月、在嵌入(embedding)和重排序(reranking)模型领域处于行业领先地位的 AI 初创公司。

来自主题: AI资讯
7753 点击    2025-02-25 19:05
2个简单技巧把 RAG 检索准确率从 50% 提高到 95 %

2个简单技巧把 RAG 检索准确率从 50% 提高到 95 %

2个简单技巧把 RAG 检索准确率从 50% 提高到 95 %

在讨论了 RAG 的 chunking、embedding、评估指标、评估流程等技术后,我们进一步探讨 RAG 系统的实际应用。

来自主题: AI资讯
9165 点击    2024-12-22 11:24
国产模型首开Hugging Face月度下载全球第一,智源BGE累计下载逾亿

国产模型首开Hugging Face月度下载全球第一,智源BGE累计下载逾亿

国产模型首开Hugging Face月度下载全球第一,智源BGE累计下载逾亿

近日,Hugging Face更新了月度榜单,智源研究院的BGE模型登顶榜首,这是中国国产AI模型首次成为Hugging Face月榜冠军。BGE在短短一年时间内,总下载量已超数亿次,是目前下载量最多的国产AI系列模型。

来自主题: AI资讯
6063 点击    2024-10-11 14:38
RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

RAG 高效应用指南 02:Embedding 模型的选择和微调

在本篇文章中,笔者将讨论以下几个问题: • 向量模型在 RAG 系统中的作用 有哪些性能不错的向量模型(从 RAG 角度) 不同向量模型的评测基准 MTEB 业务中选择向量模型有哪些考量 如何 Finetune 向量模型

来自主题: AI技术研报
13341 点击    2024-08-03 10:44