AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

10924点击 2025-01-23 14:12

本文内容适合关注 AI 前沿的读者。回顾2024年 AI 编程领域技术和产品创新，同时总结企业提效在落地的真实效果和挑战，从落地实践和思考，观察行业趋势和分析解决方案。最后，展望2025年AI 编程下一代技术给大家的期待。文章信息量较大，建议阅读时长20-30分钟适宜。本文涉及：Github Copilot、Cursor、v0、reweb.so、AI Agent、Coding Agent、RAG、微调、Blot.new 、Devin.ai 、Cursor Composer 、AIOps、Function Call

企业现阶段落地的场景

数据建模

Text2SQL的发展

Text2SQL，Natural Language to SQL，它能够将自然语言的查询语句转换成结构化查询语言（SQL）的命令。这个过程使所有人通过日常的语言来与数据库进行交互，无需了解SQL的具体语法，下面是一些受欢迎的开源项目

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

企业内部技术团队基于 Text2SQL 构建复杂的SQL查询和增强数据分析能力。比如金融行业，Text2SQL系统从大量的数据表中，解析业务合规、风险问题，相应构建复杂的SQL规则，用于识别不符合规定的交易活动，甚至根据设定规则和公式自动创建查询，计算最新的信用分数

DB Agent 摸索

典型以腾讯**SuperSonic 、**阿里的蚂蚁团队 DB-GPT，用 Agent 集成Text2SQL，用自然语义，轻松完成 BI 分析工作，还自动化生成报表

https://github.com/eosphoros-ai/DB-GPT

产品效果：除了Text2SQL能力，还可以生成可视化的图表，并进行灵活自然语义的 BI 分析

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

DB Agent 典型的商业应用

百度 AppBuilder、字节Coze、AutoGen、FastGPT 都有针对 DB 的 RAG 支持，不用写代码，用 Agent 的 Function Call 有需要时候调用 DB。下面百度 AppBuilder的例子

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

当在Agent查询酒店信息时，Agent 自动查询数据库，因为它知道数据库里有这些信息

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

AI 设计表

大量实践证明，在市面上可见业务系统，大模型表设计能力不错，在长Token能支持范围内，准确度和理解能力已经成熟。不少技术团队已经表设计让AI先自动构建再Review方式，提升效率明显。下面是真实的视频教学系统为例，拿过去产品需求，直接作为提升从让大模型做表设计。

我们来对比原项目E-R图和AI生成的表设计

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

7张表一个不漏，包含表与表关系，里面详细字段，几乎准确无误
过去需要懂业务工程师花一天完成工作，AI 在几分钟之类可以设计出同质量的表
大部分这样的场景下，提升效率甚至能到几十倍

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

总结：个人非常看好这个方向，DB 领域本身比较结构化、标准化，非常适合大模型落地场景，核心看大模型对自然语言理解能力边界

AIOps 中故障定位和根因FAQ

用 AI 赋能Ops 领域尝试了很多年。这里我只提故障定位而不是故障分析，是因为运维故障分析核心技术并不是靠大模型的能力，它主要是基于历史时序数据进行未来预测的深度机器学习。

不过有大模型自然语义理解能力，RAG的检索增强，对过去的一些故障定位，FAQ也起到很大作用。最大的体现，过去故障根因，只能最精通的人分析数据，解答问题。现在拉低这个门槛，所有知识技术人员描述基本异常，大模型分析专业数据，给出通识化的答案。有点像一个24小时特殊训练过的故障专家协助工程师。
FAQ 这个环节极大提升效率，一定程度加快故障排查和解决的时间。

当然，预测异常大模型完成不了，国内外前沿一些科技公司，比如腾讯、阿里巴巴、中兴

重点关注 Datadog 推出 Bits AI 功能，基于 OpenAI 的人工智能助理，它提供单一对话接口，查询和关联整个Datadog平台上的重要数据，包括日志、指标、关注、内部文件甚至 Slack对话内容等。用户通过自然语言指令处理事件管理，加速问题诊断和确认影响范围

一些企业会深度做一些定制化的研发，通过自身丰富的 RAG 知识库，建立一个私有的故障定位和分析 FAQ 。随着数据不断被人为标注和大模型微调，覆盖的系统随之全面。产品形态，类似下面一个云原生可观测的开源项目

https://github.com/CloudDetail/apo

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

不需要专家，普通技术人员，只要给到上下文完整，可以拉低故障排查的门槛

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

2025最大期待：下下一代编程技术革命

你不得不感慨 AI 赋予编程技术最新创新，Cursor 尽管是编程 Copilot 新的革命，还不止，全新的 Coding Agent 时代也开始来临

这里划时代的产品：商业化中的 Devin.ai 、Blot.new 和完全开源的 Cline ，它们在做什么？

主要体现在：

用Agent 技术，代替我们自动化部署环境，自动化调试和修正程序，最后自动化运行程序。

直白来说，让一个独立的编程机器人，只需我们输入任务的描述，它去实现程序完成任务。

那么这个阶段条件已经具备了吗？是的，技术已经出来了，而且还开源出来了！

这里定义它是下下一代的技术，主要是和 Cursor做一个区分。如果说 Cursor 带来是人与AI 交互编程的最高天花板， Coding Agent 标志零编程的最高天花板。

Devin 号称全球第一个AI 工程师，2024年上半年火爆全球，虽然被普遍质疑，最近推出企业付费版本，最低 500美金/月。不少业界专业人士已经试用过，真实反馈，假肯定不假，完成任务能力还停在实习生阶段。它体现出来的自动化能力，技术上可以做到

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

Blot.new : Web 开发平台，旨在简化开发流程，相比本地运行 Devin，开发者直接在线在浏览器中快速地构建、运行、编辑和部署全栈 Web 应用程序

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

Devin.ai、Blot.new 毕竟还是黑盒的，那么我就要重点提一下 Cline ，你可以任务它是开源的 Devin，这个是真的一个里程碑，这里非常感恩开源技术社区的贡献

https://github.com/cline/cline

对，你没听错，下下一代技术已经开源了！我用 Cline 加最新通用大模型 Deepseeker V3，做了一个完整真实项目。

项目有独立的前、后端子项目，中间还包含访问数据库，生成图形报表交互需求。这种项目从难度和复杂度，应该满足软件工程里面 60% 编程场景。当然，调用大模型 API 还是要花钱，最终完成这样一个项目成本几块钱。
Cline 本质来说是一个个Agent，从产品功能能够体现出来，你喂给它一个需求目标。它唤起一个个独立机器人，不停地完成一个个任务

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

在运行过程当中，如果出现了 Bug，他会尝试帮我们分析 Bug，还自动修复 Bug。这个能力实在太棒，下面Cline在自动运行程序，出现依赖缺失错误后，它开始尝试自动修复

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

还不赖，它修复成功，正常启动了程序

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

对于一些复杂的功能，它在执行过程中，一路磕磕绊绊。

我经过两天，近50次尝试，发现了各种问题：

1、大模型本身逻辑推理问题，比如实例中代码缺陷无法识别和自动修复的问题

2、单轮对话无法完成复杂的问题

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

第一轮对话只完成项目的原始构建

3、提示词需要不断打磨优化，COT 策略需要引入

4、还顺带修复 Cline IDE 中环境 Bug，像环境权限、路径变量的问题

最后，因为是开源，我们完成一套 Solution下来，只需要一套提示词模版，和多轮对话技巧，甚至在大模型有缺陷情况下，十几分钟零代码、零编程方式完成这个任务。

而且，接下来每次的运行，都几乎100%能成功。

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

完成的页面效果

对比访问数据库中的数据

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

Cline 应该能够完成企业70%的编程场景任务，你的产品设计做的比较完善，理解上下文和Cot的精髓，它真的可以完成你期望的任务。前提是你真正懂编程，大模型原理，然后你才能充分利用好编程工具，工程越复杂，中间还有不断调试，优化的过程。
如果你只想不切实际用直白自然语言让AI给你完成一个高难度项目，我劝你还是放弃幻想。
越复杂系统做编程，越是接近于艺术创造，让AI 去取代人类角色，完成艺术创造，我觉得这是一个错误的思路。AI 更应该协助人类，高效完成基础功能。这是它能掌握和擅长的。
更进一步，如果用编程描述语言，完整做到核心的架构的描述，一些技术原理的描述，把复杂问题解耦成一个个基础单元，AI 是可以完成一些复杂的功能，甚至会让我们觉得非常惊艳。而且Cline 是开源的，完全可以做这个方向定制化

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

RAG和微调对AI 编程深远影响

微调和 RAG 分别从大模型参数化、非参数知识两个维度做增强。大模型知识储备能力、推理能力都可以得到提高。需要到定制化RAG和微调都是面向 To B，重点是满足下面几个诉求：

RAG：对代码补全的上下文准确率至关重要，同时企业也可以作为内部代码知识库

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

百度Comate远程SaaS平台上传知识文档

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

本地IDE对话编程工具的效果

微调：代码补全模版完善，判定 Good/Base Case, 增强企业定制化业务逻辑

// bad
const Index<Props>=({ children }) => {
  return <>{children}</>
}
// good
const Index: React.FC<Props> = (props) => {
  return <>{props.children}</>
}

微调以后，代码补全提示是正确的Case

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

特别是对代码、数据安全要求高，不希望外传云端的大模型有刚性需求企业，私有化部署这类企业包括：银行、政府部门、金融机构等等

RAG 和微调涉及东西太多，这里不核心展开。2025年，一定比例企业还会持续投入私有化代码大模型建设，对数据安全是它们底线，这是一个追求效率和安全的平衡。就算没有云服务AI 编程工具能力，在保证数据安全下有本质提效，节约成本，也达到他们最终的目标。

混合云模式

我相信未来还会有私有云和公有云同时存在的AI编程模式，根据不同项目，不同业务隔离机制，不同团队采用不同模式，这也是合情合理。

双刃剑

AI 污染互联网

AI 编程粗糙滥用，会有反噬效应：

现在一大部分人，似乎走在一个错误的方向：处于不同目的，一类人不厌其烦用 AI 生产一些 Hello World 的 Demo。另一类人，还幻想用 AI ，用最简单口令，去马上完成一些复杂到大部分人类都很难的艺术编程。它们除了价值不大以外，会产生很多低质量的代码，这些代码一旦散布网上，事实上已经如此：

在 ChatGPT 爆火之初，Stack Overflow 便宣布「临时禁用」。

从 ChatGPT 获得正确答案的平均比例太低了！官方在声明的吐槽

https://36kr.com/p/2962446022201350

一些低质量的 AI 代码海量发布到 Github ，充斥到一些知名技术社区的 FAQ。另一方面，大模型现在几乎零识别抓取、收录到低质量的、有幻觉的代码，将结果返回给用户。

如此这般形成恶性循环，我觉得这所有人都需要在2025年深度思考的点。

AI 编程需要是Solution

AI 编程要在企业发光发热，AI 工具必不可少，但光有工具远远不够。企业需要的是一整套的解决方案 Solution。这个 Solution 包含工具外，还应该包含：

1、和 AI 能力配套的先进软件流程体系，一种 OKR，而不是盲目追求代码采纳率的 KPI

2、创新的产研协同思维，产品设计、市场运营应用上AI ，整合研发AI，将 AI 价值无限放大。这不是天方夜谭，下面是 Qunar 技术团队最新推行的 “AI重塑后的开发流程”

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

去哪儿网前端代码自动生成技术实践

https://mp.weixin.qq.com/s/qEbvFBqgnHYVFLh1mJ9ytw

3、工具混合使用，场景化定制：企业一种务实做法，具体场景看具体优势，甚至结合自身需求做定制化。我接触一家金融科技公司，内部用 AI 做业务缺陷查找：自审、资金损失提醒、交易流程防范手段，不需要投入额外人力，查漏率直接提高60%

AI 时代来临，要求企业自身改变，适应新的理念，如果没有一套先进，体系的方法论，就算给了再好的工具，生产力也提不上去。

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

AI 编程工具用得不合理，甚至有企业反馈不但没有提效，而且还会把过去的开发效率会降低，那就要好好思考下是否用对了正确的方法

作者简介

蒋志伟，Next4.ai 创始人（微信 nizhanali )
目前从事 AI 创业和技术顾问，关注 AI Agent、RAG、AI搜索、智能编程领域
曾就职阿里、Qunar、美团，前 Pmcaff.com CTO，核心研发过上亿用户搜索推荐系统
我开源了一个用来测评 AI 编程质量的开源项目，也欢迎大家关注和交流

https://github.com/laziobird/CodeLLMEval

文章来自于“下一代AI实验室”，作者“蒋志伟”。

AI编程双城记下：万字长文剖析下一代技术革命与落地挑战

关键词: AI , AI编程 , Cursor , 人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现，请参考教程进行配置。
视频教程：https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址：https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0