谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

9170点击 2025-06-26 11:30

大家好，我是袋鼠帝。

就在刚刚，谷歌深夜悄无声息地扔下了一颗重磅炸弹，正式推出了一个全新的开源AI编程工具：Gemini CLI

注意，是开源的！

GitHub地址：

https://github.com/google-gemini/gemini-cli

而且离谱的，刚开源3小时就已经有5.1K Star了..

而且我边写这篇文章它还在一直飞快的涨

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

添加图片注释，不超过 140 字（可选）

然后这玩意儿直接把谷歌最强的Gemini2.5 Pro塞进了我们开发者最熟悉、最离不开的"小黑窗"--命令行终端里面（开发者的"家"）。

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

我们可以一起来看一个Google官方的视频

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

这个视频演示之所以强大，主要体现在以下几点：

自然语言驱动的复杂任务执行：用户输入简单的要求，而是"Make me a 30s video showing the story of a ginger cat's adventures around Australia"（给我做一个30秒的视频，讲述一只姜黄色猫咪在澳大利亚的冒险故事）。这是一个高度抽象的创意需求，而非详细具体指令。

自主规划与任务分解 (Autonomous Planning)：Gemini CLI在接收到指令后，并没有立刻执行。它首先进行了思考和规划：Refining the Narrative Structure（优化叙事结构）。它将“制作一个视频”这个大任务，自主分解成了多个可执行的子任务，比如：

创建一个四场景的故事。

为每个场景生成图片、视频片段和旁白。

最后将所有素材合成为一个视频。

清理临时文件。

多模态AI能力融合 (Multi-Modal Generation)：这是最cool的部分。为了完成任务，Gemini CLI像一个总指挥，依次调用了多个不同的Google AI模型：

imagen_t2i (Imagen)：用于文生图。根据文本描述生成猫咪在澳大利亚不同地点的静态图片。

veo_i2v (Veo)：用于图生视频。将Imagen生成的静态图片转化为动态的视频片段。

chirp_tts (Chirp)：用于文本转语音。为每个场景生成对应的旁白音频。

与本地系统无缝交互：它不仅能调用云端AI模型，还能直接操作本地文件系统。视频中清晰地展示了它执行了两个shell命令：

mkdir -p ginger_cat_adventure：在开始时创建了一个用于存放素材的文件夹。

rm ...：在任务结束时，自动删除了所有临时的、中间生成的文件，只留下最终的成品。

自主错误处理与修正 (Error Correction)：在视频的00:11处，出现了一个Error: failed to execute tool的错误。但整个流程并没有因此中断。AI代理识别到问题后，显示Adjusting Directory Paths（正在调整目录路径），然后继续执行后续任务。这展示了它具备一定的鲁棒性和自主解决问题的能力。

然后，上面这段对视频的解析是我丢给Gemini2.5 Pro总结的，而且这段视频没有任何声音，Gemini2.5 Pro这个多模态理解能力有点逆天！

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

Gemini CLI专注于你的命令行，让你的终端拥有思考、理解、执行复杂任务的能力。

一句话：Gemini CLI，就是要把你的终端，变成一个本地的AI Agent。

下面这几点直接封神。

1.免费额度遥遥领先，业界天花板！

这绝对是谷歌最"壕"无人性的地方，也是我必须放在第一点讲的。

为了让所有开发者都能无门槛体验，谷歌给出了一个“大到离谱”的免费套餐：

免费使用Gemini 2.5 Pro模型，是的，就是那个拥有100万Token超大上下文窗口的Google旗舰模型

超高请求限额：每分钟60次请求，每天1000次请求！

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

这意味着你几乎可以毫无顾忌、不间断地在终端里使用AI。

别家还在按Token数抠抠搜搜算钱的时候，谷歌直接请你"畅饮"。

这是要把其他AI编程工具往死里卷呀

下面这位老哥是懂阴阳的，哈哈哈

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

2.不止编码，它是AI Agent

Gemini CLI的强大之处在于其内置的"工具集"，让它能做的事情远远超出了代码本身。

超大代码库理解与编辑，得益于100万Tokens的上下文，你可以把整个中大型项目的代码库都扔给它。

而上一篇刚刚讲的Augment是20万Tokens上下文，Gemini CLI是它的5倍..

augment

袋鼠帝，公众号：袋鼠帝AI客栈

降维打击Cursor！Augment正在抢走中级程序员的饭碗...

这样看，无论是分析架构、梳理逻辑，还是进行大规模重构，也都能轻松应对了。

除了多模态，还有以下几种能力：

自动化运维任务：比如查询过去24小时内所有相关的Pull Request并进行总结、处理一个复杂的git rebase冲突这类繁琐的运维任务，现在都可以交给它来自动化处理。

强大的工具和MCP服务集成：它还能调用外部工具，比如使用Imagen生成图片、Veo生成视频，甚至连接Lyria创作音乐。

内置Google搜索：自动调用Google搜索来查找最新资料，基于这些信息给出答案

3.开源、可扩展

Gemini CLI是完全开源的（基于Apache 2.0许可证）

这意味着安全透明，你可以检查每一行代码，不用担心它背后有什么"后门、小动作"。

而且全球的开发者都可以为其贡献代码、提交Bug、增加新功能。

它的成长，你也可以参与其中，这个成长速度应该会非常恐怖！

这就是开源的魅力

而且自由度非常高：它构建在MCP（模型上下文协议）标准之上，支持通过GEMINI.md文件进行系统级提示词配置。

可以根据自己的工作习惯和团队规范，深度定制，把它调教成最懂你专属助理。

怎么部署？

灰常简单！

前提条件：你的电脑上安装了Node.js 18或更高版本。

通过node -v查看版本号

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

第一步：运行CLI

在你的终端里，执行下面这行命令就完事了

npx https://github.com/google-gemini/gemini-cli

或者

npm install -g @google/gemini-cli

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

第二步：选择主题并授权

首次运行时，它会让你选一个看得顺眼的主题

按上下键去选，选好点回车，我选了github dark（如下图）

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

然后会跳转到下图所示的界面，回车选择登录Google账户（Login with Google）

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

然后会弹出一个浏览器窗口，提示你用个人Google账户登录授权。

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

授权成功后，你就自动获得了这个免费套餐。

就可以在下方窗口处开始对话啦

谷歌杀疯了！免费2.5 Pro+开源Gemini CLI，就是要卷死所有AI编程工具..

如果你需要使用特定模型，或者免费额度不够用，可以去Google AI Studio生成一个API Key，通过环境变量配置：

export GEMINI_API_KEY="你的apikey"

「最后」

Google Gemini CLI的开源发布，它更像是一种宣言，宣告着命令行交互新范式到来。

它将自然语言的便捷与命令行的高效完美结合，并且以一种极其开放（开源）和慷慨（超大免费额度）的方式，交到了每一位开发者手中。

今年不仅是属于Agent的，也是属于开发者（不止程序员）的。

我目前也在进一步体验Gemini CLI，用它来构建一些有意思的功能。

篇幅原因，今天这篇主要是带大家快速了解Gemini CLI，先部署起来～

时候不早了，睡了，晚安😴

文章来自于微信公众号“袋鼠帝AI客栈”，作者是“袋鼠帝”。

关键词: AI新闻 , Gemini CLI , Ai编程 , 谷歌AI

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务，堪称「云端超级打工人」而且做到了开源界GAIA性能天花板，达到了57.7%，超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址：GitHub：https://github.com/camel-ai/owl

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0