AI写代码新姿势：一个截图，代替千行代码

9572点击 2025-02-22 21:50

现在写代码，最fashion的“姿势”应该是什么？

答案或许就是：截图。

没错，就像这样，先随便找个网页，截取想要的那部分界面，然后“喂”给AI，并附上一句Prompt：

参考这个页面，生成一个类似的HTML页面。

AI写代码新姿势：一个截图，代替千行代码

只是一张图和一句话，AI就“唰唰唰”的把代码给写出来了。

有了这个功能，前端程序员搞简单的页面代码可就方便太多了（甚至编程小白都可以尝试做网页）~

而且这个AI啊，还不是国外的什么应用，正是商汤在今天GDC（全球开发者先锋大会）中办公小浣熊2.0最新升级的功能。

不得不说，国产AI的含金量还在持续上升中~

AI写代码新姿势：一个截图，代替千行代码

△商汤科技小浣熊负责人，贾安亚

纵观整场发布会，一个最大的感受就是，商汤办公小浣熊2.0不仅仅是增添新功能这么简单，更是把办公AI从一个助手的角色转变成了有自主执行能力的智能体。

这又该如何理解呢？我们继续往下看。

办公AI：从有用，到好用

截个图就能写代码，还只是办公小浣熊2.0新功能的一隅。

小浣熊这次是把“日日新”融合大模型的原生融合多模态能力结合了进来，实现了多模态理解和交互。

举个例子

数据分析是大家在办公场景中或多或少都会接触到的工作内容之一，用上了办公小浣熊2.0，效率直接变得Pro Max了。

在数据清洗和预处理阶段，它能自动帮你搞定数据里的各种麻烦，比如补全漏掉的数据、修正错误、统一格式、去掉重复内容、转换类型，还能解决文字乱码问题。

这样一来，在数据分析最初阶段，就能把速度和准确性给提升上去。

为了能让你把数据看得更清楚，办公小浣熊2.0还支持数据可视化。

AI写代码新姿势：一个截图，代替千行代码

它能自动帮你选最合适的图表，生成好看又清晰的图表，重点信息一目了然。

还可以根据需要调整样式和布局，甚至做出可以互动的图表。就算你不懂复杂的工具，也能轻松做出专业的数据图表。

不仅如此，办公小浣熊2.0还具备模式识别和趋势分析的能力。

同样是自动的方式，它可以帮你发现数据中隐藏的规律，识别时间数据的趋势，找出异常值和波动，预测未来的走势，还能分析不同数据之间的关系。

那些原本需要专业统计知识才能完成的分析任务，现在一个AI就能搞定。

下面的例子中就展示了让小浣熊预测《哪吒2》票房的过程：

AI写代码新姿势：一个截图，代替千行代码

当然，若是还有不懂的问题或进一步的需求，我们依旧可以通过对话的方式来提问。

甚至联动Excel、txt、Word、和PDF等多个不同类型文件，直接让它生成一个完整且多模态的报告都是OK的哦~

AI写代码新姿势：一个截图，代替千行代码

但不仅限于数据分析这一类任务，办公小浣熊2.0已经将刚才我们展示的模式“融会贯通”到了近乎全场景中。

而这种模式，可以为归结为“三步走”：

第一步是规划（Plan）：在规划阶段，可以自主整合世界知识（预训练阶段信息）、网络信息（互联网实时信息）和自有数据（私域知识网信息）。

AI写代码新姿势：一个截图，代替千行代码

第二步是分析（Analysis）：在分析阶段，可以有效地对数据和文档进行分析并从中挖掘有效信息。

AI写代码新姿势：一个截图，代替千行代码

第三步则是创作（Write）：基于上面步骤，进而完成内容生成、智能校对信息源并辅助创意创作，完成各类复杂任务。

AI写代码新姿势：一个截图，代替千行代码

总而言之，现在的办公AI，可以说是熟练学会了如何使用人类工具，通过不断地将执行结果作为反馈信息源参与至会话中，可以不断提升AI的自主工作能力，进而泛化更多应用场景、发挥更大价值。

嗯，是从有用，转向了好用。

AI写代码新姿势：一个截图，代替千行代码

代码小浣熊也升级了

除了办公小浣熊之外，家族的另一位成员——代码小浣熊2.0也推出了诸多新功能。

相比此前的代码补全、问答交互，其最大的特点，便是多维数据融合和多模态推理。

AI写代码新姿势：一个截图，代替千行代码

代码小浣熊2.0在多维数据融合上的确有一套，能帮开发人员省不少事儿。

先说本地数据融合这一块，它就像个智能管家，能把你的个人代码数据还有代码仓库都管起来，让你随时能轻松找到想用的代码，快速复用，开发速度“嗖”地就上去了。

再看企业内部云端融合，以前各部门的数据就像一个个孤岛，现在它把这些孤岛都连起来了，企业的数据库、知识库都整合得妥妥当当。

大家一起搞开发的时候，信息共享那叫一个顺畅，不用来回沟通解释，时间和精力都省了。

除此之外，它能联网检索知识，把网络上很多有用的信息都能帮你找回来，加到本地的数据里，给开发工作源源不断地提供新资料，让你的思路更开阔。

而在实操方面，代码小浣熊2.0在写代码的时候，不管是单行的代码，还是好几行连在一起的，它都能帮着补全，要是有不对的地方，也能帮着改。

要是碰到任务里某个点要调整，它不光能改这一处，还能同时跨着文件，把相关的好几处任务一起改了，着实是有些方便在身上的。

AI写代码新姿势：一个截图，代替千行代码

并且它还可以执行更多的具体开发流程操作，提供更加全面的编程辅助能力。

例如一键添加注释：

AI写代码新姿势：一个截图，代替千行代码

以及通过自然语言连续提问：

AI写代码新姿势：一个截图，代替千行代码

值得一提的是，代码小浣熊2.0除了对个人用户之外，对企业也特别有用，它能帮整个企业管好代码资产。

怎么个管理方式呢？

它先会仔细筛查代码，把有问题的地方找出来，接着再进行后续的开发，让代码变得越来越好，这个优化升级的过程会一直持续下去。

而且它管得还很全面，从最开始了解大家对软件有啥需求，到后面测试软件好不好用，软件研发的好多流程它都涉及到了。

有了它，企业的代码质量会更高，以后维护起来也更轻松。

不用再愁多Agent应用开发了

如果说小浣熊家族的升级是商汤在应用层上的最新发布，那么在底层大装置方面，商汤在本次GDC上同样也有一个大动作。

首先，是一个可以破局多Agent应用开发困境的开发者工具——LazyLLM。

AI写代码新姿势：一个截图，代替千行代码

简单来说，LazyLLM是一个面向开发者的一站式、开源的，可构建多Agent大模型应用开发框架，能协助开发者用极低的成本，构建复杂的AI应用，并可以持续迭代优化效果。

可以先来看下一个demo：

以下视频来源于

商汤学术

AI写代码新姿势：一个截图，代替千行代码

接下来，我们就来盘一盘LazyLLM到底有什么特点。

首先从代码设计方面来看，是肉眼可见的简洁。

例如用代码表达一个数学公式，对比LazyLLM、LangChain和LlamaIndex，LazyLLM的代码是真的短了不少：

AI写代码新姿势：一个截图，代替千行代码

其次，面对当下众多的调用、部署的“选项”，LazyLLM做到了统一。

无论是什么样的模块，用户都可以用统一的方式来调用，灵活试验各种基模型、训推框架与数据库。

AI写代码新姿势：一个截图，代替千行代码

值得一提的是，它还提供微调的服务，这就更便于客户在垂直领域的应用。

LazyLLM还有一个大亮点，就是开发方便。

例如十行代码就能搭建RAG多路召回应用，三行代码搭建ChatBot，甚至两、三行代码就能在RAG应用中用上自定义的转换规则或者多路召回的策略。

AI写代码新姿势：一个截图，代替千行代码

除此之外，LazyLLM的亮点还包括：

以数据流为核心的应用开发范式：LazyLLM以数据为核心，可通过Pipeline、Parallel、Switch、If、Loop、Diverter、Warp、Graph等数据流拼接已有组件或其他开源软件，并支持在应用开发过程中持续迭代数据，从而不断提升数据效果。
像搭积木一样开发大模型应用：LazyLLM通过精细化模块设计和符合直觉的代码风格，使开发者能够更快地实现想法产品落地，同时真正像搭积木一样，把意图识别、知识库检索能力、大模型能力等快速拼到一起，实现完整应用。
复杂应用一键部署：LazyLLM利用轻量网关实现分布式应用一键部署，助力用户快速实现产品落地。当智能体开发完成后，应用者能够一键将其部署到网页、企业微信、钉钉等平台。同时，框架还支持跨平台、不同操作系统，以及不同底层云的基础设施。
多Agent编排：封装FunctionCall、React、ReWOO、PlanAndSolve等多种Agent。
跨平台：兼容多个操作系统（如Windows、OS或Linux）和多种IaaS平台（如裸金属、K8s、slurm、公有云）。

AI写代码新姿势：一个截图，代替千行代码

总而言之，LazyLLM是做到了可以让用户以最简单的方法和最少的代码，快速构建复杂、强大的多Agent AI应用原型，像搭建积木一样，快速构建出具有生产力的AI大模型应用。

而基于LazyLLM这个开发者工具，商汤还发布了一个应用开发平台——万象平台。

AI写代码新姿势：一个截图，代替千行代码

整体来看，它是企业级一站式模型开发与管理平台，集成模型管理、精调、推理、评测等功能，提供多种开源和闭源大模型，基于SenseCore万卡集群，支持实时调用、快速扩缩容，兼容国产芯片和异构算力管理。

我们先来看下万象平台的实操界面：

AI写代码新姿势：一个截图，代替千行代码

万象平台的一大核心能力，就是高效推理和简单微调。

不仅支持PPL.LLM、LightLLM等多推理框架，在这里，你还可以一键搭建各种主流大模型，包括大火的DeepSeek满血版、商汤SenseNova，以及Meta、阿里、智谱等众多开源模型！

AI写代码新姿势：一个截图，代替千行代码

其次，正是因为基于LazyLLM，万象应用开发平台通过统一画布界面，将LLM应用开发、RAG核心算法及多模态模块编排整合，支持用户灵活组合算法组件、即时测试调整，并一键启动微调服务，实现高效便捷的流程编排能力。

AI写代码新姿势：一个截图，代替千行代码

值得一提的是，万象平台还突破了云算力依赖。

因其兼容云端与本地服务协同，开放第三方模型接入接口，这就允许用户使用自己的MaaS平台提供服务，将闲置算力用起来。

而且万象平台还可以进行本地部署与私有化交付，适配国产数据库及芯片，保证数据安全，符合审计合规。

商汤眼中的“AI与人类协同”

最后，我们还需要对今天商汤在GDC的一系列发布做个总结，从中挖掘商汤在大模型发展路径上的战略布局。

从应用层，即小浣熊家族的升级来看，商汤是想让AI不只是打辅助，更是起到自动化去解决更复杂问题的作用。

商汤的办公小浣熊2.0和代码小浣熊2.0不仅作为辅助工具（Copilot）提升人类的工作效率，还逐步向自主执行任务的Agent方向发展。

办公小浣熊能够自主规划任务、分析数据并生成报告，代码小浣熊则能够跨文件执行多任务修改，甚至进行代码资产管理。这种转变使得AI能够更独立地处理复杂任务，减少人类的重复性劳动。

从底层大装置来看，通过LazyLLM开源框架和万象平台，商汤大幅降低了AI应用开发的门槛。

即使是初级开发者，也可以通过简单的拼接和模块化设计，快速构建复杂的AI应用。这种低门槛的开发方式使得更多企业和个人能够参与到AI应用的创造中，推动了AI技术的普及和应用。

而二者也有相通之处，那便是多模态融合与推理。

这也是得益于商汤的“日日新”融合大模型近来在多模态推理和融合方面取得了突破，能够处理文本、图像、音频、视频等多种模态的数据。

这种多模态能力的提升，使得AI能够更好地理解和处理复杂的现实世界任务，进一步增强了AI与人类的协同能力。

从这里我们也不难发现，商汤此前提出的“三位一体战略”，即“大装置 + 大模型 + 应用”，还在持续奏效。

而面对当下和未来不断快速变化的大模型市场，商汤联合创始人林达华在近期的访谈中，也道出了商汤的布局之道：

未来AI发展方向是从语言模型向多模态、推理模型和世界模型进化，大模型将突破行业核心任务才能实现真正商业价值。

DeepSeek的训练优化不会降低算力需求，反而推理市场增长迅速，竞争加剧。商汤的核心战略是通过多模态技术、深度行业应用、软硬件一体化来构建高价值AI生态，而非单纯参与API价格战。

DeepSeek吹起的低成本+高性能“国潮AI风”还在继续，而从商汤今天一系列最新发布来看，趋势没有停滞，涌现还在持续。

文章来自微信公众号 “ 量子位 ”，作者金磊

AI写代码新姿势：一个截图，代替千行代码

关键词: 办公小浣熊2.0 , 办公AI , LazyLLM , AI前端

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。
项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0