微软 2025Build 大会开源了一个名为 NLWeb 的项目。它能做到仅仅用300行代码,就在你现有的网站上加个 ChatGPT 聊天对话框。
https://github.com/microsoft/nlweb
不止 ChatGPT,这个项目还支持包括 Claude、DeepSeek、Gemini 在内的7种主流 LLM 对话模型接入方式。
在简单的实践完它的 HelloWorld.md 后,我发现它不只是简单的跟 LLM 对个话这么简单。
这个项目支持基于多种信息来源聊天(RAG),包括本地的 json 数据、csv 数据、远端的 rss 订阅甚至远端的任意类型文档。
你需要做的只是在傻瓜部署的时候执行正确的命令即可,加载各类数据源到自带的向量数据库,只需要一条命令。
比如从苹果 podcast 加载某一篇播客:
python -m tools.db_load https://feeds.libsyn.com/121695/rss Behind-the-Tech
自带 RAG 完美解决了一个很现实的问题:我们为什么需要在网页上搭载一个 ChatGPT/DeepSeek?
多数人并不需要莫名其妙的和一个网页上的 AI 聊天,大家更多的是想知道:这个网站、这家企业、这个个人是干什么的,能为我做什么。
NLWeb 能够快速将 LLM 和现成的网页媒体阵地进行整合。
如果挂在企业网站上,那么它是一个24小时的企业售前/售后客服。
如果挂在小说或论文网站上,那么它是一个文章阅读助手。
如果挂在博主个人的主页或个人站上,就是自媒体内容管家或者社群助手。
NLWeb 的出现,让那些给网站做定制化 AI RAG、做模型集成聊天对话 APP 的伪创业团队的生存空间进一步缩减。
本质上,NLWeb 提供了一个开箱即用的通用 RAG 解决方案,它是一个后端服务,不需要部署者理解任何一行代码。
遵循 HelloWorld.md 文件执行一系列傻瓜式部署命令,即可运行起一个 NLWeb 实例。
而这300行全部是前端网页代码,基本上就是给网站加上对话框,写一些 css 样式,用 js 调用 NLWeb 服务。没了。
数据抽取、向量解析、向量存储、模型调用交互、格式化输出,这些核心的技术实现 NLWeb 全部搞定。
更方便的是,每一个启动起来的 NLWeb 实际上也是一个 MCP Server。
NLWeb 直接实现了 MCP 协议的核心功能,使得人类用户和AI代理(如其他聊天机器人)可使用同一套接口与网站进行交互。
一套开箱即用的快速集成 LLM RAG 对话的官方标准解决方案,麻雀虽小,五脏俱全。
大公司每一次的产品发布,都在倒逼社区和技术追逐者反思自己正在做的事。
NLWeb 毫不例外的在向社区释放信息:对话式 AI 都出现2年了,求求别再套壳了。版本 T0 答案已经开源了,关注场景应用才是正道。
有心的读者读到这里会发现,上述学习和使用 NLWeb 的全过程,我并没有很深入的讨论或研究代码细节。
因为在培养了一种新的学习和工作方法后,上手实践代码变得更加简易化。
这种方法就是 AI 协同编程,我用了 Windsurf。
在编程界有一句著名的话:代码即文档。使用诸如 Cursor、Windsurf 这类 AI 协同编码工具,大部分时候我已经不看文档了。
在 AI 协同编码的加持下,过去几周时间我和 AI 合作干了过去 1-2 年的活。
我不想写的单元测试、我不想重构的屎山代码、我一直想写但懒得写的小工具,Windsurf 都默默帮我干了,干得还不错。
Vibe Coding (氛围编程)这个从名字到执行在一两年前还很抽象很科幻的工程实施方式,如今已经是新兴的必备技能了。这是另外一个话题了,值得单开一篇讲讲。
文章来自于微信公众号“长歌启明”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI