AI写代码新姿势:一个截图,代替千行代码

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
AI写代码新姿势:一个截图,代替千行代码
7565点击    2025-02-22 21:50

现在写代码,最fashion的“姿势”应该是什么?


答案或许就是:截图


AI写代码新姿势:一个截图,代替千行代码


没错,就像这样,先随便找个网页,截取想要的那部分界面,然后“喂”给AI,并附上一句Prompt:


参考这个页面,生成一个类似的HTML页面。


AI写代码新姿势:一个截图,代替千行代码


只是一张图和一句话,AI就“唰唰唰”的把代码给写出来了。


有了这个功能,前端程序员搞简单的页面代码可就方便太多了(甚至编程小白都可以尝试做网页)~


而且这个AI啊,还不是国外的什么应用,正是商汤在今天GDC(全球开发者先锋大会)中办公小浣熊2.0最新升级的功能。


不得不说,国产AI的含金量还在持续上升中~


AI写代码新姿势:一个截图,代替千行代码

△商汤科技小浣熊负责人,贾安亚


纵观整场发布会,一个最大的感受就是,商汤办公小浣熊2.0不仅仅是增添新功能这么简单,更是把办公AI从一个助手的角色转变成了有自主执行能力的智能体


这又该如何理解呢?我们继续往下看。


办公AI:从有用,到好用


截个图就能写代码,还只是办公小浣熊2.0新功能的一隅。


小浣熊这次是把“日日新”融合大模型原生融合多模态能力结合了进来,实现了多模态理解和交互。


举个例子


数据分析是大家在办公场景中或多或少都会接触到的工作内容之一,用上了办公小浣熊2.0,效率直接变得Pro Max了。


数据清洗和预处理阶段,它能自动帮你搞定数据里的各种麻烦,比如补全漏掉的数据、修正错误、统一格式、去掉重复内容、转换类型,还能解决文字乱码问题。


这样一来,在数据分析最初阶段,就能把速度和准确性给提升上去。


为了能让你把数据看得更清楚,办公小浣熊2.0还支持数据可视化


AI写代码新姿势:一个截图,代替千行代码


它能自动帮你选最合适的图表,生成好看又清晰的图表,重点信息一目了然。


还可以根据需要调整样式和布局,甚至做出可以互动的图表。就算你不懂复杂的工具,也能轻松做出专业的数据图表。


不仅如此,办公小浣熊2.0还具备模式识别和趋势分析的能力。


同样是自动的方式,它可以帮你发现数据中隐藏的规律,识别时间数据的趋势,找出异常值和波动,预测未来的走势,还能分析不同数据之间的关系。


那些原本需要专业统计知识才能完成的分析任务,现在一个AI就能搞定。


下面的例子中就展示了让小浣熊预测《哪吒2》票房的过程:


AI写代码新姿势:一个截图,代替千行代码


当然,若是还有不懂的问题或进一步的需求,我们依旧可以通过对话的方式来提问。


甚至联动Excel、txt、Word、和PDF等多个不同类型文件,直接让它生成一个完整且多模态的报告都是OK的哦~


AI写代码新姿势:一个截图,代替千行代码


但不仅限于数据分析这一类任务,办公小浣熊2.0已经将刚才我们展示的模式“融会贯通”到了近乎全场景中。


而这种模式,可以为归结为“三步走”


第一步是规划(Plan):在规划阶段,可以自主整合世界知识(预训练阶段信息)、网络信息(互联网实时信息)和自有数据(私域知识网信息)。


AI写代码新姿势:一个截图,代替千行代码


第二步是分析(Analysis):在分析阶段,可以有效地对数据和文档进行分析并从中挖掘有效信息。


AI写代码新姿势:一个截图,代替千行代码


第三步则是创作(Write):基于上面步骤,进而完成内容生成、智能校对信息源并辅助创意创作,完成各类复杂任务。


AI写代码新姿势:一个截图,代替千行代码


总而言之,现在的办公AI,可以说是熟练学会了如何使用人类工具,通过不断地将执行结果作为反馈信息源参与至会话中,可以不断提升AI的自主工作能力,进而泛化更多应用场景、发挥更大价值。

嗯,是从有用,转向了好用


AI写代码新姿势:一个截图,代替千行代码


代码小浣熊也升级了


除了办公小浣熊之外,家族的另一位成员——代码小浣熊2.0也推出了诸多新功能。


相比此前的代码补全、问答交互,其最大的特点,便是多维数据融合多模态推理


AI写代码新姿势:一个截图,代替千行代码



代码小浣熊2.0在多维数据融合上的确有一套,能帮开发人员省不少事儿。


先说本地数据融合这一块,它就像个智能管家,能把你的个人代码数据还有代码仓库都管起来,让你随时能轻松找到想用的代码,快速复用,开发速度“嗖”地就上去了。


再看企业内部云端融合,以前各部门的数据就像一个个孤岛,现在它把这些孤岛都连起来了,企业的数据库、知识库都整合得妥妥当当。


大家一起搞开发的时候,信息共享那叫一个顺畅,不用来回沟通解释,时间和精力都省了。


除此之外,它能联网检索知识,把网络上很多有用的信息都能帮你找回来,加到本地的数据里,给开发工作源源不断地提供新资料,让你的思路更开阔。


而在实操方面,代码小浣熊2.0在写代码的时候,不管是单行的代码,还是好几行连在一起的,它都能帮着补全,要是有不对的地方,也能帮着改。


要是碰到任务里某个点要调整,它不光能改这一处,还能同时跨着文件,把相关的好几处任务一起改了,着实是有些方便在身上的。


AI写代码新姿势:一个截图,代替千行代码


并且它还可以执行更多的具体开发流程操作,提供更加全面的编程辅助能力。


例如一键添加注释


AI写代码新姿势:一个截图,代替千行代码


以及通过自然语言连续提问


AI写代码新姿势:一个截图,代替千行代码


值得一提的是,代码小浣熊2.0除了对个人用户之外,对企业也特别有用,它能帮整个企业管好代码资产


怎么个管理方式呢?


它先会仔细筛查代码,把有问题的地方找出来,接着再进行后续的开发,让代码变得越来越好,这个优化升级的过程会一直持续下去。


而且它管得还很全面,从最开始了解大家对软件有啥需求,到后面测试软件好不好用,软件研发的好多流程它都涉及到了。


有了它,企业的代码质量会更高,以后维护起来也更轻松。


不用再愁多Agent应用开发了


如果说小浣熊家族的升级是商汤在应用层上的最新发布,那么在底层大装置方面,商汤在本次GDC上同样也有一个大动作


首先,是一个可以破局多Agent应用开发困境的开发者工具——LazyLLM


AI写代码新姿势:一个截图,代替千行代码


简单来说,LazyLLM是一个面向开发者的一站式、开源的,可构建多Agent大模型应用开发框架,能协助开发者用极低的成本,构建复杂的AI应用,并可以持续迭代优化效果。


可以先来看下一个demo:


以下视频来源于


商汤学术


AI写代码新姿势:一个截图,代替千行代码


接下来,我们就来盘一盘LazyLLM到底有什么特点。


首先从代码设计方面来看,是肉眼可见的简洁


例如用代码表达一个数学公式,对比LazyLLM、LangChain和LlamaIndex,LazyLLM的代码是真的短了不少:


AI写代码新姿势:一个截图,代替千行代码


其次,面对当下众多的调用、部署的“选项”,LazyLLM做到了统一


无论是什么样的模块,用户都可以用统一的方式来调用,灵活试验各种基模型、训推框架与数据库。


AI写代码新姿势:一个截图,代替千行代码


值得一提的是,它还提供微调的服务,这就更便于客户在垂直领域的应用。


LazyLLM还有一个大亮点,就是开发方便


例如十行代码就能搭建RAG多路召回应用,三行代码搭建ChatBot,甚至两、三行代码就能在RAG应用中用上自定义的转换规则或者多路召回的策略。


AI写代码新姿势:一个截图,代替千行代码


除此之外,LazyLLM的亮点还包括:


  • 以数据流为核心的应用开发范式:LazyLLM以数据为核心,可通过Pipeline、Parallel、Switch、If、Loop、Diverter、Warp、Graph等数据流拼接已有组件或其他开源软件,并支持在应用开发过程中持续迭代数据,从而不断提升数据效果。
  • 像搭积木一样开发大模型应用:LazyLLM通过精细化模块设计和符合直觉的代码风格,使开发者能够更快地实现想法产品落地,同时真正像搭积木一样,把意图识别、知识库检索能力、大模型能力等快速拼到一起,实现完整应用。
  • 复杂应用一键部署:LazyLLM利用轻量网关实现分布式应用一键部署,助力用户快速实现产品落地。当智能体开发完成后,应用者能够一键将其部署到网页、企业微信、钉钉等平台。同时,框架还支持跨平台、不同操作系统,以及不同底层云的基础设施。
  • 多Agent编排:封装FunctionCall、React、ReWOO、PlanAndSolve等多种Agent。
  • 跨平台:兼容多个操作系统(如Windows、OS或Linux)和多种IaaS平台(如裸金属、K8s、slurm、公有云)。


AI写代码新姿势:一个截图,代替千行代码


总而言之,LazyLLM是做到了可以让用户以最简单的方法和最少的代码,快速构建复杂、强大的多Agent AI应用原型,像搭建积木一样,快速构建出具有生产力的AI大模型应用。


而基于LazyLLM这个开发者工具,商汤还发布了一个应用开发平台——万象平台


AI写代码新姿势:一个截图,代替千行代码


整体来看,它是企业级一站式模型开发与管理平台,集成模型管理、精调、推理、评测等功能,提供多种开源和闭源大模型,基于SenseCore万卡集群,支持实时调用、快速扩缩容,兼容国产芯片和异构算力管理。


我们先来看下万象平台的实操界面


AI写代码新姿势:一个截图,代替千行代码



万象平台的一大核心能力,就是高效推理和简单微调


不仅支持PPL.LLM、LightLLM等多推理框架,在这里,你还可以一键搭建各种主流大模型,包括大火的DeepSeek满血版、商汤SenseNova,以及Meta、阿里、智谱等众多开源模型!


AI写代码新姿势:一个截图,代替千行代码


其次,正是因为基于LazyLLM,万象应用开发平台通过统一画布界面,将LLM应用开发、RAG核心算法及多模态模块编排整合,支持用户灵活组合算法组件、即时测试调整,并一键启动微调服务,实现高效便捷的流程编排能力。


AI写代码新姿势:一个截图,代替千行代码


AI写代码新姿势:一个截图,代替千行代码


值得一提的是,万象平台还突破了云算力依赖


因其兼容云端与本地服务协同,开放第三方模型接入接口,这就允许用户使用自己的MaaS平台提供服务,将闲置算力用起来。


而且万象平台还可以进行本地部署与私有化交付,适配国产数据库及芯片,保证数据安全,符合审计合规。


商汤眼中的“AI与人类协同”


最后,我们还需要对今天商汤在GDC的一系列发布做个总结,从中挖掘商汤在大模型发展路径上的战略布局


应用层,即小浣熊家族的升级来看,商汤是想让AI不只是打辅助,更是起到自动化去解决更复杂问题的作用。


商汤的办公小浣熊2.0和代码小浣熊2.0不仅作为辅助工具(Copilot)提升人类的工作效率,还逐步向自主执行任务的Agent方向发展。


办公小浣熊能够自主规划任务、分析数据并生成报告,代码小浣熊则能够跨文件执行多任务修改,甚至进行代码资产管理。这种转变使得AI能够更独立地处理复杂任务,减少人类的重复性劳动。


底层大装置来看,通过LazyLLM开源框架和万象平台,商汤大幅降低了AI应用开发的门槛。


即使是初级开发者,也可以通过简单的拼接和模块化设计,快速构建复杂的AI应用。这种低门槛的开发方式使得更多企业和个人能够参与到AI应用的创造中,推动了AI技术的普及和应用。


而二者也有相通之处,那便是多模态融合与推理


这也是得益于商汤的“日日新”融合大模型近来在多模态推理和融合方面取得了突破,能够处理文本、图像、音频、视频等多种模态的数据。


这种多模态能力的提升,使得AI能够更好地理解和处理复杂的现实世界任务,进一步增强了AI与人类的协同能力。


从这里我们也不难发现,商汤此前提出的“三位一体战略”,即“大装置 + 大模型 + 应用”,还在持续奏效。


而面对当下和未来不断快速变化的大模型市场,商汤联合创始人林达华在近期的访谈中,也道出了商汤的布局之道:


未来AI发展方向是从语言模型向多模态、推理模型和世界模型进化,大模型将突破行业核心任务才能实现真正商业价值。
DeepSeek的训练优化不会降低算力需求,反而推理市场增长迅速,竞争加剧。商汤的核心战略是通过多模态技术、深度行业应用、软硬件一体化来构建高价值AI生态,而非单纯参与API价格战。


DeepSeek吹起的低成本+高性能“国潮AI风”还在继续,而从商汤今天一系列最新发布来看,趋势没有停滞,涌现还在持续。



文章来自微信公众号 “ 量子位 ”,作者 金磊


AI写代码新姿势:一个截图,代替千行代码

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0