AI编程双城记下:万字长文剖析下一代技术革命与落地挑战

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
AI编程双城记下:万字长文剖析下一代技术革命与落地挑战
9302点击    2025-01-23 14:12

本文内容适合关注 AI 前沿的读者。回顾2024年 AI 编程领域技术和产品创新,同时总结企业提效在落地的真实效果和挑战,从落地实践和思考,观察行业趋势和分析解决方案。最后,展望2025年AI 编程下一代技术给大家的期待。文章信息量较大,建议阅读时长20-30分钟适宜。本文涉及:Github Copilot、Cursor、v0、reweb.so、AI Agent、Coding Agent、RAG、微调、Blot.new 、Devin.ai 、Cursor Composer 、AIOps、Function Call


企业现阶段落地的场景


数据建模


Text2SQL的发展


Text2SQL,Natural Language to SQL,它能够将自然语言的查询语句转换成结构化查询语言(SQL)的命令。这个过程使所有人通过日常的语言来与数据库进行交互,无需了解SQL的具体语法,下面是一些受欢迎的开源项目


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战

AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


企业内部技术团队基于 Text2SQL 构建复杂的SQL查询和增强数据分析能力。比如金融行业,Text2SQL系统从大量的数据表中,解析业务合规、风险问题,相应构建复杂的SQL规则,用于识别不符合规定的交易活动,甚至根据设定规则和公式自动创建查询,计算最新的信用分数


DB Agent 摸索


典型以腾讯**SuperSonic 、**阿里的蚂蚁团队 DB-GPT,用 Agent 集成Text2SQL,用自然语义,轻松完成 BI 分析工作,还自动化生成报表


https://github.com/eosphoros-ai/DB-GPT


产品效果:除了Text2SQL能力,还可以生成可视化的图表,并进行灵活自然语义的 BI 分析


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


DB Agent 典型的商业应用


百度 AppBuilder、字节Coze、AutoGen、FastGPT 都有针对 DB 的 RAG 支持,不用写代码,用 Agent 的 Function Call 有需要时候调用 DB。下面百度 AppBuilder的例子


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


当在Agent查询酒店信息时,Agent 自动查询数据库,因为它知道数据库里有这些信息


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


AI 设计表


大量实践证明,在市面上可见业务系统,大模型表设计能力不错,在长Token能支持范围内,准确度和理解能力已经成熟。不少技术团队已经表设计让AI先自动构建再Review方式,提升效率明显。下面是真实的视频教学系统为例,拿过去产品需求,直接作为提升从让大模型做表设计。


我们来对比原项目E-R图和AI生成的表设计


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


  • 7张表一个不漏,包含表与表关系,里面详细字段,几乎准确无误
  • 过去需要懂业务工程师花一天完成工作,AI 在几分钟之类可以设计出同质量的表
  • 大部分这样的场景下,提升效率甚至能到几十倍


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


总结:个人非常看好这个方向,DB 领域本身比较结构化、标准化,非常适合大模型落地场景,核心看大模型对自然语言理解能力边界


AIOps 中故障定位和根因FAQ


用 AI 赋能Ops 领域尝试了很多年。这里我只提故障定位而不是故障分析,是因为运维故障分析核心技术并不是靠大模型的能力,它主要是基于历史时序数据进行未来预测的深度机器学习。


  • 不过有大模型自然语义理解能力,RAG的检索增强,对过去的一些故障定位,FAQ也起到很大作用。最大的体现,过去故障根因,只能最精通的人分析数据,解答问题。现在拉低这个门槛,所有知识技术人员描述基本异常,大模型分析专业数据,给出通识化的答案。有点像一个24小时特殊训练过的故障专家协助工程师。
  • FAQ 这个环节极大提升效率,一定程度加快故障排查和解决的时间。


当然,预测异常大模型完成不了,国内外前沿一些科技公司,比如腾讯、阿里巴巴、中兴


重点关注 Datadog 推出 Bits AI 功能,基于 OpenAI 的人工智能助理,它提供单一对话接口,查询和关联整个Datadog平台上的重要数据,包括日志、指标、关注、内部文件甚至 Slack对话内容等。用户通过自然语言指令处理事件管理,加速问题诊断和确认影响范围


一些企业会深度做一些定制化的研发,通过自身丰富的 RAG 知识库,建立一个私有的故障定位和分析 FAQ 。随着数据不断被人为标注和大模型微调,覆盖的系统随之全面。产品形态,类似下面一个云原生可观测的开源项目


https://github.com/CloudDetail/apo


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


不需要专家,普通技术人员,只要给到上下文完整,可以拉低故障排查的门槛


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


2025最大期待:下下一代编程技术革命


你不得不感慨 AI 赋予编程技术最新创新,Cursor 尽管是编程 Copilot 新的革命,还不止,全新的 Coding Agent 时代也开始来临


这里划时代的产品:商业化中的 Devin.ai 、Blot.new 和完全开源的 Cline ,它们在做什么?


主要体现在:


  • 用Agent 技术,代替我们自动化部署环境,自动化调试和修正程序,最后自动化运行程序。


直白来说,让一个独立的编程机器人,只需我们输入任务的描述,它去实现程序完成任务。


那么这个阶段条件已经具备了吗?是的,技术已经出来了,而且还开源出来了!


  • 这里定义它是下下一代的技术,主要是和 Cursor做一个区分。如果说 Cursor 带来是人与AI 交互编程的最高天花板, Coding Agent 标志零编程的最高天花板。


  • Devin 号称全球第一个AI 工程师,2024年上半年火爆全球,虽然被普遍质疑,最近推出企业付费版本,最低 500美金/月。不少业界专业人士已经试用过,真实反馈,假肯定不假,完成任务能力还停在实习生阶段。它体现出来的自动化能力,技术上可以做到


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


  • Blot.new : Web 开发平台,旨在简化开发流程,相比本地运行 Devin,开发者直接在线在浏览器中快速地构建、运行、编辑和部署全栈 Web 应用程序


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


Devin.ai、Blot.new 毕竟还是黑盒的,那么我就要重点提一下 Cline ,你可以任务它是开源的 Devin,这个是真的一个里程碑,这里非常感恩开源技术社区的贡献


https://github.com/cline/cline


对,你没听错,下下一代技术已经开源了!我用 Cline 加最新通用大模型 Deepseeker V3,做了一个完整真实项目。


  • 项目有独立的前、后端子项目,中间还包含访问数据库,生成图形报表交互需求。这种项目从难度和复杂度,应该满足软件工程里面 60% 编程场景。当然,调用大模型 API 还是要花钱,最终完成这样一个项目成本几块钱。
  • Cline 本质来说是一个个Agent,从产品功能能够体现出来,你喂给它一个需求目标。它唤起一个个独立机器人,不停地完成一个个任务


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


  • 在运行过程当中,如果出现了 Bug,他会尝试帮我们分析 Bug,还自动修复 Bug。这个能力实在太棒,下面Cline在自动运行程序,出现依赖缺失错误后,它开始尝试自动修复


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


还不赖,它修复成功,正常启动了程序


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


对于一些复杂的功能,它在执行过程中,一路磕磕绊绊。


我经过两天,近50次尝试,发现了各种问题:


1、大模型本身逻辑推理问题,比如实例中代码缺陷无法识别和自动修复的问题

2、单轮对话无法完成复杂的问题


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


第一轮对话只完成项目的原始构建


3、提示词需要不断打磨优化,COT 策略需要引入

4、还顺带修复 Cline IDE 中环境 Bug,像环境权限、路径变量的问题


最后,因为是开源,我们完成一套 Solution下来,只需要一套提示词模版,和多轮对话技巧,甚至在大模型有缺陷情况下,十几分钟零代码、零编程方式完成这个任务。


而且,接下来每次的运行,都几乎100%能成功。


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战

完成的页面效果


对比访问数据库中的数据


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


  • Cline 应该能够完成企业70%的编程场景任务,你的产品设计做的比较完善,理解上下文和Cot的精髓,它真的可以完成你期望的任务。前提是你真正懂编程,大模型原理,然后你才能充分利用好编程工具,工程越复杂,中间还有不断调试,优化的过程。
  • 如果你只想不切实际用直白自然语言让AI给你完成一个高难度项目,我劝你还是放弃幻想。
  • 越复杂系统做编程,越是接近于艺术创造,让AI 去取代人类角色,完成艺术创造,我觉得这是一个错误的思路。AI 更应该协助人类,高效完成基础功能。这是它能掌握和擅长的。
  • 更进一步,如果用编程描述语言,完整做到核心的架构的描述,一些技术原理的描述,把复杂问题解耦成一个个基础单元,AI 是可以完成一些复杂的功能,甚至会让我们觉得非常惊艳。而且Cline 是开源的,完全可以做这个方向定制化


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


RAG和微调对AI 编程深远影响


微调 和 RAG 分别从大模型参数化、非参数知识两个维度做增强。大模型知识储备能力、推理能力都可以得到提高。需要到定制化RAG和微调都是面向 To B,重点是满足下面几个诉求:


  • RAG: 对代码补全的上下文准确率至关重要,同时企业也可以作为内部代码知识库


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战

百度Comate远程SaaS平台上传知识文档


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战

本地IDE对话编程工具的效果


  • 微调:代码补全模版完善,判定 Good/Base Case, 增强企业定制化业务逻辑


// bad
const Index<Props>=({ children }) => {
return <>{children}</>
}
// good
const Index: React.FC<Props> = (props) => {
return <>{props.children}</>
}

微调以后,代码补全提示是正确的Case


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


  • 特别是对代码、数据安全要求高,不希望外传云端的大模型有刚性需求企业,私有化部署这类企业包括:银行、政府部门、金融机构等等


RAG 和微调涉及东西太多,这里不核心展开。2025年,一定比例企业还会持续投入私有化代码大模型建设,对数据安全是它们底线,这是一个追求效率和安全的平衡。就算没有云服务AI 编程工具能力,在保证数据安全下有本质提效,节约成本,也达到他们最终的目标。


混合云模式


我相信未来还会有私有云和公有云同时存在的AI编程模式,根据不同项目,不同业务隔离机制,不同团队采用不同模式,这也是合情合理。


双刃剑


AI 污染互联网


AI 编程粗糙滥用,会有反噬效应:


现在一大部分人,似乎走在一个错误的方向:处于不同目的,一类人不厌其烦用 AI 生产一些 Hello World 的 Demo。另一类人,还幻想用 AI ,用最简单口令,去马上完成一些复杂到大部分人类都很难的艺术编程。它们除了价值不大以外,会产生很多低质量的代码,这些代码一旦散布网上,事实上已经如此:


在 ChatGPT 爆火之初,Stack Overflow 便宣布「临时禁用」。

从 ChatGPT 获得正确答案的平均比例太低了!官方在声明的吐槽

https://36kr.com/p/2962446022201350


一些低质量的 AI 代码海量发布到 Github ,充斥到一些知名技术社区的 FAQ。另一方面,大模型现在几乎零识别抓取、收录到低质量的、有幻觉的代码,将结果返回给用户。


如此这般形成恶性循环,我觉得这所有人都需要在2025年深度思考的点。


AI 编程需要是Solution


AI 编程要在企业发光发热,AI 工具必不可少,但光有工具远远不够。企业需要的是一整套的解决方案 Solution。这个 Solution 包含工具外,还应该包含:


1、和 AI 能力配套的先进软件流程体系,一种 OKR,而不是盲目追求代码采纳率的 KPI


2、创新的产研协同思维,产品设计、市场运营应用上AI ,整合研发AI,将 AI 价值无限放大。这不是天方夜谭,下面 是 Qunar 技术团队最新推行的 “AI重塑后的开发流程”


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


去哪儿网前端代码自动生成技术实践

https://mp.weixin.qq.com/s/qEbvFBqgnHYVFLh1mJ9ytw


3、工具混合使用,场景化定制:企业一种务实做法,具体场景看具体优势,甚至结合自身需求做定制化。我接触一家金融科技公司,内部用 AI 做业务缺陷查找:自审、资金损失提醒、交易流程防范手段,不需要投入额外人力,查漏率直接提高60%


AI 时代来临,要求企业自身改变,适应新的理念,如果没有一套先进,体系的方法论,就算给了再好的工具,生产力也提不上去。


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战


AI 编程工具用得不合理,甚至有企业反馈不但没有提效,而且还会把过去的开发效率会降低,那就要好好思考下是否用对了正确的方法


作者简介


  • 蒋志伟,Next4.ai 创始人 ( 微信 nizhanali )
  • 目前从事 AI 创业和技术顾问,关注 AI Agent、RAG、AI搜索、智能编程领域
  • 曾就职 阿里、Qunar、美团,前 Pmcaff.com CTO,核心研发过上亿用户搜索推荐系统
  • 我开源了一个用来测评 AI 编程质量的开源项目,也欢迎大家关注和交流


https://github.com/laziobird/CodeLLMEval


文章来自于“下一代AI实验室”,作者“蒋志伟”。


AI编程双城记下:万字长文剖析下一代技术革命与落地挑战

关键词: AI , AI编程 , Cursor , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

6
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

7
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

8
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

9
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0