登顶GitHub Hacker News,这个开源项目让AI编程的成本降低98%|涌现新项目

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
登顶GitHub Hacker News,这个开源项目让AI编程的成本降低98%|涌现新项目
5902点击    2026-06-10 15:17

除此之外,context-mode 将大模型的记忆力从30分钟提升至 3 小时。


一句话介绍


context-mode是一款专为AI编程打造的上下文优化MCP(Anthropic发布的模型上下文协议)插件。


它解决了开发者在长周期开发中遭遇的“模型失忆”与“Token过多消耗”的核心痛点。


据团队表示,在编程场景下,context-mode 能够让 AI 编程的成本降低 98%,同时将大模型的记忆力从30分钟提升至3小时。


介绍


context-mode的背后是一支背景多元的跨国初创团队。目前团队的核心成员分布在土耳其、法国等 4 个国家,主要通过 GitHub 异步协作。


Mert Köseoğlu(核心开发者、创始人)曾作为技术顾问为OpenAI等企业提供技术服务,拥有超10年全栈工程与系统架构经验。创业前,他曾先后任职于Countly、Planhat及Jotform等全球知名数据与SaaS平台,担任高级软件工程师。


孙逸诚(核心开发者、多平台适配负责人):团队里的中国面孔,目前大二在读。他曾入围强基计划(数学与物理全省前18名),具有Temporal-RAG(时序数据检索增强)引擎的独立开发经验,并获得知乎全球A2A(Agent-to-Agent)黑客松银奖。


产品及业务


登顶GitHub Hacker News,这个开源项目让AI编程的成本降低98%|涌现新项目

图源: context-mode


简单来说,context-mode是一款专门为AI编程助手“减负”和“整理记忆”的开源MCP 插件。


该项目发布后曾登顶GitHub Hacker News,目前已在GitHub获得超1.5万颗Star。context-mode现已吸引逾24.3万名开发者接入,完成了对 15 个主流平台的底层适配,并被微软、谷歌、Meta、字节跳动及 Cursor 等科技公司的研发团队采用。


context-mode 之所以能在极客圈获得大量的关注,正是因为其精准切中了一个令人头疼的行业焦虑:被昂贵API账单和大模型失忆逼疯的开发者。


随着“龙虾(OpenClaw,一个开源 Agent 框架)”等全自动AI编程智能体的普及,Vibe Coding 的应用门槛进一步降低。


然而,享受到 AI 带来的效率提升的同时,用户很快意识到,智力是昂贵的:一方面,Claude、GPT等顶尖模型的 Token 定价并不便宜,包含充足 Token 额度的高级套餐,定价动辄高达 200 美元/月。


另一方面,受制于当下的能力,在执行具体任务过程中,模型的反复试错、重复检索都会造成额外的 Token 浪费。


在实际开发场景中,大模型往往表现得像一个“没有常识的数据处理机器”。团队成员孙逸诚分享了一个踩坑经历:


参加 Kaggle 数据竞赛时,他将一个包含 300 组数据的训练任务交给了 Claude。为了确认任务进度,Claude 没有选择写一段定时脚本,而是选择每隔 5 秒钟向整个项目发起一次全局检索。这种极其低效的“死盯”策略,让一个高配会员账号的 API 额度在短短半小时内消耗了 90%。


与此同时,大模型还存在“失忆”的问题。开发者发现,当代码量触及某些主流 IDE(集成开发环境)的隐形上限(如 164K)时,系统会不得不丢弃或压缩历史信息,导致模型遗忘关键细节。这就导致:前一秒还在流畅写代码的 AI,下一秒就会把前置的关键架构和约束条件忘得一干二净。


面对大模型严重的“幻觉”与“失忆”,context-mode 给出了解法:既然大模型处理海量原始数据又贵又笨,那就剥夺它直接阅读原始数据的权利。


孙逸诚打了一个比方:“传统的 AI 编程就像看一场马拉松,大模型会死死盯着每一个选手的每一步,这当然会耗尽它的上下文。而 context-mode 做的,是把跑马拉松的过程扔进一个屏蔽的沙盒(Sandbox)里,大模型只需要看最后的排名结果。”


具体到工作原理,首先,通过引入“虚拟沙盒”与精准检索,context-mode 能够有效降低 Token 的消耗。


在传统的调用模式中,每一次 MCP 工具的调用都极其昂贵,庞大的原始数据会被直接倾倒进大模型的上下文窗口,导致 Token 消耗量上升。


context-mode 的“虚拟化沙盒”机制,就好比在大模型和操作系统间建立了一道“防火墙”。它会先把所有文件和运行记录存放在本地,需要用到时再帮大模型把相关内容找出来。


登顶GitHub Hacker News,这个开源项目让AI编程的成本降低98%|涌现新项目

《智能涌现》的测试结果。


根据《智能涌现》的测试,接入context-mode后,大模型读取一份79.3KB的文件时,Token 的消耗成本降低了 87.7%。


其次为了解决大模型的“失忆”痛点,context-mode通过构建“存档点”,实时监控开发者的每一次文件编辑。


当对话太长,它会主动构建并向AI注入一个通常小于2KB的“快照”,相当于在代码编辑过程中建立了一个“存档点”。官方表示,这种机制能将大模型连续编程的有效时间从30分钟提升至3小时。


最后,context-mode引入了强制性“用代码思考(Think in Code)”的范式,从而节省Token消耗。


所谓的 Think in Code,简单而言,就是不让模型逐行阅读、处理文件,而是先让模型编写一个“小程序”,让“小程序”先在本地完成数据分析,再将提炼后的结果反馈给模型。


context-mode 创始人 Mert 告诉《智能涌现》,开发者陷入了一个误区:习惯将海量数据直接丢给大模型进行处理。实际上,面对 50 个文件的数据统计任务,与其让模型亲自逐个阅读,不如先让模型写一段脚本,由脚本完成统计工作,再把结果返回给模型。


用 Mert 的话说,一个脚本可以替代十几个昂贵的工具调用,并节省百倍的上下文。


根据《智能涌现》的测试,接入 context-mode 后,模型处理一份文件时,节省了99.98% 的 Token 成本。


context-mode 的上手门槛,比 Cursor 等需要重新下载并适应环境的独立开发软件(IDE)更低。作为一个轻量级的 MCP(模型上下文协议)插件中间件,context-mode 可以直接接入开发者原有的工作流中。


context-mode 团队还提供了一系列快捷指令,用来查看各大平台的 Token 节省情况。用户只需要在聊天框中输入指令,浏览器就会弹出一个本地的数据统计面板,记录着当周调用了多少次 API,以及 context-mode 拦截了多少次无效的数据读取。


登顶GitHub Hacker News,这个开源项目让AI编程的成本降低98%|涌现新项目

△快捷指令列表。 图源: context-mode


近期,context-mode 针对企业研发场景,推出了上下文即服务”


在企业研发场景中,AI的ROI往往难以衡量。


为此,context-mode 推出了企业服务“Insights”。获得授权后,安装在程序员电脑上的插件,可以直接将程序员使用 AI 的过程数据(比如调用了什么工具、报错了几次、消耗了多少钱),发送到Insights 所在服务器上。


与此同时,Insights 还能针对不同岗位,提供不同的数据报告。比如面向安全总监,系统会自动生成安全报告;面向财务团队,系统可以提供 Tokens 消耗明细。


目前,Insights 仍处于定向内测阶段。


Founder思考


  • 停止将大模型视为“数据处理器”,它本质上是“代码生成器”。


现在很多平台和开发者陷入了一个误区,喜欢把 50 个文件直接读入上下文,让大模型去里面“数”有多少个函数。


这不仅缓慢,而且极其浪费算力。我们的主张是“用代码思考(Think in Code)”——LLM 应该去编写一个统计脚本来完成计数,最后只输出结果。


一个脚本可以替代十几个昂贵的工具调用,并节省百倍的上下文。在未来的 AI 编程范式中,这是所有平台都必须遵循的底层铁律。


  • 无限上下文是一个伪命题,克制才是 AI 工具最难建立的壁垒。 


行业里都在卷大模型的长文本能力(比如 100K 甚至 1M 的上下文),但这其实是个陷阱。把几十 KB 的报错日志一股脑倾倒给 AI,只会加速它的“失忆”和幻觉。


真正的解法不是盲目扩容,而是建立起一套极度克制的“状态记忆层(沙盒)”。谁能把传给 AI 的无效噪音压缩到极致,谁才能真正帮开发者把连续编程的时间从 30 分钟延长到 3 个小时。


  • 下一代 AI 编程的瓶颈不在于模型够不够聪明,而在于上下文管理框架够不够清晰。


现在大家都在抱怨 AI 会在同一个 Bug 上反复跌倒。这并不是因为模型变笨了,而是它在冗长的对话中迷失了。


只有给 AI 提供像单机游戏一样的存档点,强制它按优先级读取记忆,才能为它真正有价值的逻辑推理留出足够的空间。


  • 大厂在卷“全家桶”,而我们在做跨平台的“万能插座”。


我们花大量精力去适配 Cursor、Claude、Gemini 等不同的底层逻辑,是因为真实的开发者生态永远是碎片化且快速迭代的。


开发者不需要另一个被大厂深度绑定的全能Agent,他们需要的是一个轻量、不吃内存、即插即用且能极大降低API账单的中间件。


文章来自于"智能涌现",作者 "李嘉星"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI