RAG被判死刑:Google用一行API架空工程师!

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
RAG被判死刑:Google用一行API架空工程师!
9925点击    2025-11-26 15:14

Google宣判RAG死刑!那条曾让无数工程师自豪的技术链,如今只剩下一行API调用。Gemini的File Search,把检索、分块、索引、引用,全都封进了模型内部。开发者不再需要理解流程,只需要上传文件。当智能被自动化吞并,工程师第一次发现,自己也成了被自动化的一部分。


在过去几年里,RAG是工程师的底气。


他们手动切块、生成向量、建立索引,再把检索到的内容精准拼进prompt。


那是一整套细腻又繁琐的工程活,只有真正懂这些流程的人,才敢说自己「会用大模型」。


而现在,这份骄傲被一行API抹平了。


RAG被判死刑:Google用一行API架空工程师!


Gemini的File Search上线后,上传一个PDF或JSON,模型就能自动完成分块、检索、引用,甚至附上来源。


File Search 抽象化了整个检索流程。


这句话像一把锋利的刀,切掉了人和系统之间最后一点链接。


AI不再需要工程师去教它查资料,而工程师,也开始被自己的发明优化掉。


从流程到函数:Google一刀切掉RAG工程链


Gemini的File Search发布后,RAG从工程系统变成了API内置能力。


上传文件,模型自动完成分块、embedding(向量化)、索引、检索与引用,全部在同一接口内完成,无需自建向量库或维护检索逻辑。


RAG被判死刑:Google用一行API架空工程师!


多格式支持也被一次性打通:PDF、DOCX、TXT、JSON,以及常见代码文件可直接解析和嵌入,快速搭建统一知识库。


这让开发者能快速构建完整的知识库,而不必再为文件类型或结构做额外适配。


在更新说明中,它被定义为:


一个完全托管的RAG系统,已直接嵌入Gemini API,检索流程被彻底抽象化。


开发者不再需要设计chunk策略或索引结构,系统会在后台自动完成所有环节。


RAG被判死刑:Google用一行API架空工程师!

Gemini File Search工作流程:上传文件→自动生成embedding→调用Gemini检索并生成答案→输出含引用结果


定价被改成了「轻入口」:查询时的存储与embedding生成免费;只在首次索引按$0.15/百万tokens计费,这让部署与扩容的边际成本趋近于零。


这意味着搭建知识检索的成本几乎降为零,RAG的技术门槛也随之被平台吸收。


File Search的逻辑:RAG嵌进API


File Search的核心不在能不能搜,而在隐藏整条检索链。


在过去,想让模型基于外部资料回答问题,必须自己搭一套RAG流程:


先把文件切成小块,再用embedding模型把每块转成向量,存入向量数据库;当用户提问时,再检索最相关的片段,把结果塞进prompt里生成回答。


RAG被判死刑:Google用一行API架空工程师!


Ask the Manual演示应用程序由Gemini API中的全新文件搜索工具提供支持


整个过程需要维护数据库、管理索引、调参、拼接prompt,每一步都依赖工程师。


而现在,这一切被放进了Gemini API的底层。


上传文件,系统自动完成分块、embedding与索引;提问时,调用同一个generateContent接口即可,Gemini会在内部完成语义检索与上下文注入,并在回答中自动生成引用。


甚至使用的是专门的gemini-embedding-001模型,确保检索与生成的语义空间完全一致


RAG被判死刑:Google用一行API架空工程师!

上传一份关于现代i10的文档并询问「什么是现代i10?」。Gemini会检索相关段落,撰写有理有据的答案,并显示支持该答案的来源。


更重要的是,File Search改写了开发逻辑。


开发者不再需要额外部署数据库,也不需要维护检索管线;整个过程只在一次调用中完成。


这意味着,RAG从一个独立系统变成了一个参数。


过去要几百行代码才能跑通的流程,现在是一行配置。官方示例调用如下:


response = client.models.generate_content(

model='gemini-2.5-flash',

contents='What does the research say about ...',

config=types.GenerateContentConfig(

tools=[types.Tool(

file_search=types.FileSearch(

file_search_store_names=[store.name]

)

)]

)

)


当所有检索、存储、注入、引用都自动完成,工程师再也不用理解系统怎么找到答案。


File Search让RAG从一套需要掌握的知识,变成一项被调用的功能。


那一刻,技术不再是一种能力,而成了一种选项。


被抢走工作的工程师


File Search的上线,不只是一次工具升级,而是一场角色迁移。


它让系统具备了自我构建的能力——能够自动切块、索引、检索、引用。


过去,理解这些逻辑是工程师的价值所在;现在,这种理解被彻底隐藏。


在早期接入里,Beam(Phaser Studio)的变化最直观:


RAG被判死刑:Google用一行API架空工程师!


他们把File Search接进内容生产线,用来检索模板、组件与设计文档;每天上千次查询跨越六个语料库,两秒内合并结果。


CTO ichard Davey的说法是:


过去几天的工作,现在几分钟就能出结果。


这当然是生产力的进步,但也意味着——工程师失去了对系统的解释权


当检索策略、引用逻辑、甚至数据结构都由平台控制,工程不再是搭建系统,而是调用系统。


从外部看,这只是少写几百行代码;但从内部看,这是知识密度被平台吸收的瞬间。


当复杂被隐藏,人也随之变得可替换。


权力的迁移:从工程师到平台


File Search的出现,真正重塑的不是开发体验,而是权力结构——它让理解系统的人从工程师变成了平台。


在传统的RAG流程中,工程师拥有对系统的掌控权。


他们能决定怎样分块、怎样索引、怎样检索,也能解释模型为什么会给出某个答案。


这份掌控感来自于可见性——他们看得见每一步的逻辑。


File Search把可见的工程步骤收进了不可见的API。


检索策略、索引结构、引用规则被托管在云端,开发者只看得到答案,看不到过程


这意味着知识注入的权力正在集中:模型基于哪些段落回答、忽略了哪些证据、如何权衡检索结果,均由平台决定。


工程师不再「构建系统」,而是「调用系统」。


这并非孤例。OpenAI的Custom GPTs、Anthropic的Console、以及Gemini的File Search,都在把复杂度下沉到平台底层,让开发更容易,也更受控。


每一次抽象化,都是一次权力集中。


File Search的诞生,让AI开发进入了零配置时代:


人不再需要理解模型,只需调用模型;平台不再提供能力,而是直接提供结果。


这场变化没有任何戏剧性的冲突,却彻底改变了技术的边界。


当系统自己搭建系统,个人的理解被替代为对平台的信任。


File Search并没有「杀死」RAG,它只是把RAG变成了系统的血液。


复杂被隐藏,权力被集中;工程师要做的,是在更高一层的封装里,找到新的入口。


参考资料:

https://blog.google/technology/developers/file-search-gemini-api/

https://x.com/frxiaobei/status/1990091775382602021?s=20

https://medium.com/%40abdulkadir9929/gemini-apis-new-file-search-tool-built-in-rag-for-everyone-e990c054dcff


文章来自于“新智元”,作者 “倾倾”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0