这两天Google推出了Gemini-CLI这个编程工具,功能和Claude Code基本一致,结果根本排不上队,登录一下很快闪退,和下图一样,使用感受令人不愉悦。很多人都在等着体验这个新工具,但现实是您可能要等很久才能轮到。不过,我发现了一个完美的替代方案——claude-code-router,它能让您用DeepSeek-R1的强大推理能力来驱动Claude Code。
Claude Code Router [1] 本质上是一个"API路由器",国人自己的项目,它的核心思想很特别。这个项目可以把原本发送给Claude API的请求,重新路由到任何OpenAI兼容的API服务上,比如DeepSeek、OpenRouter、甚至本地的Ollama。听起来简单,但实际上这解决了一个大问题:您不再需要依赖昂贵的Claude API,也不用受限于单一模型的能力。
这个开源项目在GitHub上(地址在下文)已经获得了1.9k stars,说明它确实解决了很多开发者的痛点。项目作者不仅提供了完整的源码,还有详细的文档和配置示例,让部署变得非常简单。
要理解claude-code-router的价值,我们得先明白Claude Code本身到底有多厉害。通过深入分析Claude Code的System Prompt和工具实现,可以发现这绝不是一个简单的聊天机器人,而是一个按照软件工程标准精心设计的AI智能体。
Claude Code最核心的创新是它的上下文管理系统。传统AI对话很容易因为上下文窗口限制而"失忆",但Claude Code通过ClearTool实现了智能对话压缩。这个工具不是简单的截断,而是会深度分析整个对话历史,提取关键的技术细节、代码模式、架构决策,然后生成一个结构化的摘要。摘要包含7个关键部分:用户请求、技术概念、文件变更、问题解决过程、待办任务、当前工作状态和下一步计划。这意味着即使对话历史超过100轮,AI仍然能清楚地记住项目的来龙去脉。
更厉害的是MemoryTool带来的持久记忆能力。AI可以将重要信息保存到项目根目录的CLAUDE.md文件中,包括项目结构、代码约定、踩过的坑、解决方案等。下次打开项目时,AI会自动读取这些记忆,就像一个有经验的工程师重新熟悉代码库一样。这种设计让AI具备了"学习"和"积累"的能力,每次交互都在为下一次工作打基础。
从System Prompt可以看出,Claude Code被明确要求要具备工程师的思维模式。它必须"理解文件的代码约定"、"模仿代码风格"、"使用现有库和工具"、"遵循现有模式"。在实际工作中,它会先检查package.json确认项目依赖,参考邻近文件了解代码风格,然后再开始编码。完成代码后,还会主动运行lint和typecheck进行验证。这种工程化的工作流程,确保了代码质量和项目一致性。
Claude Code的交互设计完全针对命令行环境优化。System Prompt明确要求:"回答必须简洁直接"、"避免不必要的前言后语"、"一个词的回答最好"。这种极简风格看似简单,实际上需要AI具备很强的信息提炼能力。它必须在保持准确性的同时,将复杂的技术问题浓缩成最直接的答案,这正是命令行环境下开发者最需要的效率。
Claude Code还支持并行工具调用,可以同时执行多个操作,比如同时运行"git status"和"git diff",或者批量编辑多个文件。这种并行处理能力大大提升了工作效率,让AI能够跟上现代开发的快节奏。结合主动验证机制,整个系统体现了软件工程的最佳实践。
了解了Claude Code的强大之后,您可能会好奇:既然Claude Code这么厉害,为什么还要做一个Router项目呢?这就要从项目作者的经历说起了。作者在Github上有一篇Blog介绍了开发的初衷。
早在2025年2月25日,Claude Code发布的第二天,项目作者就开始了对这个工具的逆向工程。原因很简单:Anthropic屏蔽了中国区用户,想用Claude Code必须通过繁琐的申请流程,而且很可能申请不到。作为一个技术人员,作者选择了更直接的方式——既然无法正常使用,那就自己想办法。
通过深入的逆向分析,作者发现了一个关键信息:Claude Code允许通过环境变量ANTHROPIC_BASE_URL来覆盖API地址。这个发现意义重大,因为它意味着可以在不修改Claude Code源码的情况下,将所有请求重定向到自定义的服务器。
基于这个发现,claude-code-router的核心技术原理就很清晰了:
项目的发展也很有意思。最初因为DeepSeek不支持Function Call,作者选择了qwen-max模型。后来尝试过复杂的四模型分工机制(router、tool、think、coder),但发现免费小模型无法胜任任务分发的重任。
直到2025年5月底Claude Code正式发布,DeepSeek系列模型(包括5月28日发布的R1)开始完美支持Function Call,作者重新设计了整个架构。现在的四模型分工更加科学:默认模型兜底、background处理后台任务、think负责推理规划、longContext处理长文本场景。
这种演进过程体现了项目作者对技术的深度思考:不是为了技术而技术,而是为了解决实际问题而不断优化。最终的结果是,您可以以Claude十分之一的成本,获得接近Claude Code原生的使用体验。
部署claude-code-router的过程非常简单,您只需要三个步骤就能搞定,按照下面的方式即可。首先安装Claude Code官方工具,然后安装路由器,最后启动就行了。整个过程大概需要5分钟,比配置一个普通的开发环境还要快。我这里提供两种方案,以上是一个Mac的部署方案。如果在Windows里安装,需要切换到wsl -d ubuntu的环境,如果以下命令运行报错,再用Powershell的管理员终端进入,在以下命令之前加入sudo提权即可。
npm install -g @anthropic-ai/claude-code
npm install -g @musistudio/claude-code-router
# 终端1:手动启动服务
ccr start
# 终端2:启动Claude Code
ccr code
第一次运行时,系统会提示您输入API配置信息。您只需要依次填入:
配置完成后,所有信息会自动保存到~/.claude-code-router/config.json文件中,下次启动就不用重新输入了。
说到模型选择,DeepSeek-R1真的是项目作者经过深度实践后的推荐选择。从claude-code-router的架构设计可以看出,作者专门将DeepSeek-R1配置为"think"模型,用于处理Claude Code的推理和Plan Mode任务。这个选择并非偶然:DeepSeek-R1具备强大的推理能力,在处理复杂编程任务时表现出色,特别适合需要深度思考的场景。从技术发展历程看,直到2025年5月28日DeepSeek-R1发布后,DeepSeek全系列模型才完美支持Function Call,这使得它能很好地驱动Claude Code的工具调用机制。更重要的是成本优势让人无法忽视:DeepSeek的价格不到Claude Sonnet 3.5的十分之一,在北京时间凌晨0:30到8:30之间,DeepSeek-R1的成本更是只有平时的25%。
为了测试DeepSeek-R1的真实能力,刚才我让claude-code-router创建一个"炫酷的博客网站"。这个要求看似简单,但实际上需要AI具备项目规划、技术选型、代码实现和问题解决的全链路能力。结果让人印象深刻:DeepSeek-R1展现出了超乎预期的适应性和问题解决能力。
一开始,DeepSeek-R1尝试使用标准的npx create-next-app命令快速搭建项目。但它很快发现这个自动化工具会在终端中弹出交互式选择,无法在CLI环境中自动化完成。您猜怎么着,这时候DeepSeek-R1做出了一个决定:立即放弃自动化工具,改用手动创建的方式。它先创建项目目录,再逐个安装依赖,手动构建整个项目结构。
DeepSeek-R1不仅创建了基础的Next.js项目,还完整实现了现代Web开发的最佳实践。它自动选择了React 18、配置了Tailwind CSS进行样式管理、设置了PostCSS和Autoprefixer、创建了响应式的网格布局,甚至还加入了玻璃拟态效果和悬停动画。整个技术选型体现了对当前前端生态的深度理解,从页面结构到样式系统都考虑得很周全。
经过一系列智能调整后,DeepSeek-R1成功交付了一个功能完整的博客网站。这个网站具备紫色到靛蓝的渐变背景、6个交互式博客卡片、响应式布局设计,在http://localhost:3000成功运行。从用户输入"创建一个炫酷的博客网站"到看到实际效果,整个过程展现了AI在复杂任务中的规划能力、执行能力和问题解决能力。
这个项目最厉害的地方在于它的路由策略。您可以配置不同的模型来处理不同类型的任务:可以用本地的qwen-coder处理后台任务,用DeepSeek-R1处理需要推理的复杂问题,用Gemini处理长上下文的任务。
实际效果怎么样?用户反馈说,在VS Code Copilot用Claude-4处理Flutter问题时搞砸了文件,但用claude-code-router配合DeepSeek,几轮对话就完成了任务,成本还不到1块钱。
值得一提的是,项目作者在文档中还提到了一个很有意思的玩法:可以同时配置本地模型和云端API协同工作。比如用本地的Ollama跑qwen-coder处理一些简单的后台任务,同时用DeepSeek API处理复杂推理,这样既能保证效果又能进一步降低成本。不过说实话,我还没有深入尝试过这种混合部署方式,感觉应该会很有趣。
如果您对claude-code-router这个项目感兴趣,或者在使用过程中遇到什么问题,非常欢迎加入我们的技术交流群一起探讨。毕竟AI工具发展得这么快,大家一起分享经验、探索新玩法,肯定比一个人摸索要有效率得多。让我们一起在这个AI编程的新时代里,找到最适合自己的开发方式吧!
[1] Claude Code Router: https://github.com/musistudio/claude-code-router
文章来自于“Al修猫Prompt”,作者“Al修猫Prompt”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0