本文内容适合关注 AI 前沿的读者。回顾2024年 AI 编程领域技术和产品创新,同时总结企业提效在落地的真实效果和挑战,从落地实践和思考,观察行业趋势和分析解决方案。最后,展望2025年AI 编程下一代技术给大家的期待。文章信息量较大,建议阅读时长20-30分钟适宜。本文涉及:Github Copilot、Cursor、v0、reweb.so、AI Agent、Coding Agent、RAG、微调、Blot.new 、Devin.ai 、Cursor Composer 、AIOps、Function Call
Text2SQL,Natural Language to SQL,它能够将自然语言的查询语句转换成结构化查询语言(SQL)的命令。这个过程使所有人通过日常的语言来与数据库进行交互,无需了解SQL的具体语法,下面是一些受欢迎的开源项目
企业内部技术团队基于 Text2SQL 构建复杂的SQL查询和增强数据分析能力。比如金融行业,Text2SQL系统从大量的数据表中,解析业务合规、风险问题,相应构建复杂的SQL规则,用于识别不符合规定的交易活动,甚至根据设定规则和公式自动创建查询,计算最新的信用分数
典型以腾讯**SuperSonic 、**阿里的蚂蚁团队 DB-GPT,用 Agent 集成Text2SQL,用自然语义,轻松完成 BI 分析工作,还自动化生成报表
https://github.com/eosphoros-ai/DB-GPT
产品效果:除了Text2SQL能力,还可以生成可视化的图表,并进行灵活自然语义的 BI 分析
DB Agent 典型的商业应用
百度 AppBuilder、字节Coze、AutoGen、FastGPT 都有针对 DB 的 RAG 支持,不用写代码,用 Agent 的 Function Call 有需要时候调用 DB。下面百度 AppBuilder的例子
当在Agent查询酒店信息时,Agent 自动查询数据库,因为它知道数据库里有这些信息
大量实践证明,在市面上可见业务系统,大模型表设计能力不错,在长Token能支持范围内,准确度和理解能力已经成熟。不少技术团队已经表设计让AI先自动构建再Review方式,提升效率明显。下面是真实的视频教学系统为例,拿过去产品需求,直接作为提升从让大模型做表设计。
我们来对比原项目E-R图和AI生成的表设计
总结:个人非常看好这个方向,DB 领域本身比较结构化、标准化,非常适合大模型落地场景,核心看大模型对自然语言理解能力边界
用 AI 赋能Ops 领域尝试了很多年。这里我只提故障定位而不是故障分析,是因为运维故障分析核心技术并不是靠大模型的能力,它主要是基于历史时序数据进行未来预测的深度机器学习。
当然,预测异常大模型完成不了,国内外前沿一些科技公司,比如腾讯、阿里巴巴、中兴
重点关注 Datadog 推出 Bits AI 功能,基于 OpenAI 的人工智能助理,它提供单一对话接口,查询和关联整个Datadog平台上的重要数据,包括日志、指标、关注、内部文件甚至 Slack对话内容等。用户通过自然语言指令处理事件管理,加速问题诊断和确认影响范围
一些企业会深度做一些定制化的研发,通过自身丰富的 RAG 知识库,建立一个私有的故障定位和分析 FAQ 。随着数据不断被人为标注和大模型微调,覆盖的系统随之全面。产品形态,类似下面一个云原生可观测的开源项目
https://github.com/CloudDetail/apo
不需要专家,普通技术人员,只要给到上下文完整,可以拉低故障排查的门槛
你不得不感慨 AI 赋予编程技术最新创新,Cursor 尽管是编程 Copilot 新的革命,还不止,全新的 Coding Agent 时代也开始来临
这里划时代的产品:商业化中的 Devin.ai 、Blot.new 和完全开源的 Cline ,它们在做什么?
主要体现在:
直白来说,让一个独立的编程机器人,只需我们输入任务的描述,它去实现程序完成任务。
那么这个阶段条件已经具备了吗?是的,技术已经出来了,而且还开源出来了!
Devin.ai、Blot.new 毕竟还是黑盒的,那么我就要重点提一下 Cline ,你可以任务它是开源的 Devin,这个是真的一个里程碑,这里非常感恩开源技术社区的贡献
https://github.com/cline/cline
对,你没听错,下下一代技术已经开源了!我用 Cline 加最新通用大模型 Deepseeker V3,做了一个完整真实项目。
还不赖,它修复成功,正常启动了程序
对于一些复杂的功能,它在执行过程中,一路磕磕绊绊。
我经过两天,近50次尝试,发现了各种问题:
1、大模型本身逻辑推理问题,比如实例中代码缺陷无法识别和自动修复的问题
2、单轮对话无法完成复杂的问题
第一轮对话只完成项目的原始构建
3、提示词需要不断打磨优化,COT 策略需要引入
4、还顺带修复 Cline IDE 中环境 Bug,像环境权限、路径变量的问题
最后,因为是开源,我们完成一套 Solution下来,只需要一套提示词模版,和多轮对话技巧,甚至在大模型有缺陷情况下,十几分钟零代码、零编程方式完成这个任务。
而且,接下来每次的运行,都几乎100%能成功。
完成的页面效果
对比访问数据库中的数据
微调 和 RAG 分别从大模型参数化、非参数知识两个维度做增强。大模型知识储备能力、推理能力都可以得到提高。需要到定制化RAG和微调都是面向 To B,重点是满足下面几个诉求:
百度Comate远程SaaS平台上传知识文档
本地IDE对话编程工具的效果
// bad
const Index<Props>=({ children }) => {
return <>{children}</>
}
// good
const Index: React.FC<Props> = (props) => {
return <>{props.children}</>
}
微调以后,代码补全提示是正确的Case
RAG 和微调涉及东西太多,这里不核心展开。2025年,一定比例企业还会持续投入私有化代码大模型建设,对数据安全是它们底线,这是一个追求效率和安全的平衡。就算没有云服务AI 编程工具能力,在保证数据安全下有本质提效,节约成本,也达到他们最终的目标。
我相信未来还会有私有云和公有云同时存在的AI编程模式,根据不同项目,不同业务隔离机制,不同团队采用不同模式,这也是合情合理。
AI 编程粗糙滥用,会有反噬效应:
现在一大部分人,似乎走在一个错误的方向:处于不同目的,一类人不厌其烦用 AI 生产一些 Hello World 的 Demo。另一类人,还幻想用 AI ,用最简单口令,去马上完成一些复杂到大部分人类都很难的艺术编程。它们除了价值不大以外,会产生很多低质量的代码,这些代码一旦散布网上,事实上已经如此:
在 ChatGPT 爆火之初,Stack Overflow 便宣布「临时禁用」。
从 ChatGPT 获得正确答案的平均比例太低了!官方在声明的吐槽
https://36kr.com/p/2962446022201350
一些低质量的 AI 代码海量发布到 Github ,充斥到一些知名技术社区的 FAQ。另一方面,大模型现在几乎零识别抓取、收录到低质量的、有幻觉的代码,将结果返回给用户。
如此这般形成恶性循环,我觉得这所有人都需要在2025年深度思考的点。
AI 编程要在企业发光发热,AI 工具必不可少,但光有工具远远不够。企业需要的是一整套的解决方案 Solution。这个 Solution 包含工具外,还应该包含:
1、和 AI 能力配套的先进软件流程体系,一种 OKR,而不是盲目追求代码采纳率的 KPI
2、创新的产研协同思维,产品设计、市场运营应用上AI ,整合研发AI,将 AI 价值无限放大。这不是天方夜谭,下面 是 Qunar 技术团队最新推行的 “AI重塑后的开发流程”
去哪儿网前端代码自动生成技术实践
https://mp.weixin.qq.com/s/qEbvFBqgnHYVFLh1mJ9ytw
3、工具混合使用,场景化定制:企业一种务实做法,具体场景看具体优势,甚至结合自身需求做定制化。我接触一家金融科技公司,内部用 AI 做业务缺陷查找:自审、资金损失提醒、交易流程防范手段,不需要投入额外人力,查漏率直接提高60%
AI 时代来临,要求企业自身改变,适应新的理念,如果没有一套先进,体系的方法论,就算给了再好的工具,生产力也提不上去。
AI 编程工具用得不合理,甚至有企业反馈不但没有提效,而且还会把过去的开发效率会降低,那就要好好思考下是否用对了正确的方法
https://github.com/laziobird/CodeLLMEval
文章来自于“下一代AI实验室”,作者“蒋志伟”。
【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。
视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0