ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
先让不懂代码的来测?通义这个新产品,代码刚写完,预览就出来了
2847点击    2024-10-28 14:49

这才是未来 AI 该有的样子? 


奇怪了。


一款 AI 代码工具刚发布,限量测试却要求「不懂代码」的人优先。



10 月 24 日,阿里旗下的通义正式宣布了「代码模式」,并开放试用预约,首批邀请 1024 名用户进行体验。


 

通义代码模式旨在降低应用开发的门槛。它针对简单的代码和应用生成需求,主打一个所见即所得。


具体来说,人与 AI 大模型的交流现在会出现在一个专门的窗口里,AI 大模型生成的代码会实时地在网页上跑出来以供预览。



因此,非专业程序员优先是本次测试的特别要求。


这是国内首家实现「让使用者一句话编程,并实时生成可见预览」的公司,通义代码模式的出现,或许代表着一种未来新趋势。


言听计从,不用吵架

24 小时随时等需求的「贴身程序员」来了


最近一段时间,大模型技术正在加速进入下半场。各家科技巨头、AI 创业公司在发展新一代模型的同时,也在不断探索大模型的应用方式。


上周,消费级产品领域曝出了一系列新产品,微软发布的「商业智能体」旨在包揽人们在销售、客服、财务、供应链团队的工作;Anthropic 提出的升级版 Claude 3.5 Sonnet 则主打一个「AI 自己操纵电脑」;在手机端,荣耀提出智能终端的「自动驾驶」,似乎让手机具备了全局跨 App 自动操纵的能力。


通义代码模式,则预示着在生产的一侧,开发领域的新一轮迭代。


在实时可预览代码模式出现之前,我们即使是使用 ChatGPT 等行业顶尖的大模型来写代码,也必须遵循这样的路径:1)先想好与 AI 沟通的措辞提出需求;2)复制 AI 生成的代码,尝试在外部开发环境中运行;3)继续追问大模型,不断修改代码并尝试运行,直到最终获得满意的结果为止。


现在有了通义代码模式,你在叙述完具体功能需求后,系统会创建一个工作空间,AI 在其中与你协同工作。在后续对话过程中,AI 可以实时查看你的新要求,持续编辑代码。问题随时解决,效果实时呈现,就像是在现实世界中的多人协作一样。


而且,AI 还永远不会与你 battle。


ChatGPT 刚刚爆发时人们曾预测,AI 大模型先解放的将会是软件开发。现在看来,我们距离实现这个理想又更近了一步。


我们看到,使用通义代码模式可以捣鼓出各种不同的应用。比如生成一个贪吃蛇小游戏:



带有一定复杂规则的格斗游戏:

 


甚至还有音乐播放器:

 


通义产品经理王晓明表示,代码模式的提出主要是来自于用户需求。通义大模型的代码能力属于业界领先,每天有大量程序员在使用通义进行代码生成和代码解释等任务。此外,他们发现还有不少不懂代码的用户会有创建应用、网页等需求。


与通义灵码、AI 程序员主要面向资深程序员的深度编码场景不同,通义代码模式提供了一种新的交互方式,针对简单的代码和应用生成需求,为用户创建一个动态的窗口,将生成的代码文件直接在网页上渲染成应用。


从「通义灵码」到「AI 程序员」再到「通义代码模式」到底迭代了什么?至此,答案就呼之欲出了: 


  • 第一是人与 AI 的高度协作。你负责提出想法,调整参数,AI 负责来实现。在这个过程中,若遇到任何问题,用户都可以随时与大模型进行沟通,从而充分发挥人与 AI 各自的优势。
  • 第二是结果直观可视化。即使是没有开发经验的人,也能够通过可视化的演示知道 AI 生成的代码是否跑通了。这样每个人都可以不再限于自己的技术背景,能够快速地实现一些新想法。
  • 最后,不论是人与 AI 的交互,还是代码生成的结果,都是实时的。这样的工作流程大幅提升了效率。


「这相当于让用户拥有一个 24 小时随时提需求的『贴身程序员』,不用排期、随时上线,且能满足你专属需求。」王晓明类比说。他还透露,阿里内部的开发者每天都在让通义协助完成大量的代码任务,从简单的代码排查、生成和解释,到更深入的代码文件辅助生成。「有些同事甚至直接用通义代码模式复刻出了小时候玩的掌机、小霸王上的一些小游戏,比如坦克大战、俄罗斯方块、飞机大战等。」


基于 Qwen 2.5

通义代码模式还在持续进化


任何一款好用的 AI 产品都离不开背后足够聪明的大模型,通义代码模式也是如此。它基于 Qwen 2.5 大模型进行开发。如果你一直在关注大模型领域的动态,会发现 Qwen 大模型最近的热度正在持续提高。


在 9 月底,全球开源社区基于 Qwen 系列二次开发的衍生模型数量已经超过了 Llama 系列,达到了 7.4 万。在 LiveBench 排行榜上,该模型的编码能力得分超过了 OpenAI 的 o1 模型,曾经跻身排行榜第二。在 Chatbot Arena 榜单上,该模型也能排到第五。



而且除了跑分,这个模型在国内外开发者中的口碑也非常好。



无论是在性能方面,还是在影响力方面,Qwen 都已经获得了充分的认可。


通义代码模式的出现,则让 Qwen 2.5 在多个方面充分发挥了自己的潜力。具体来说,代码模式一方面需要基于模型的意图识别和指令理解能力,将涉及到代码的用户意图精准识别出来,另一方面也需要将代码生成能力进行提升。有了 Qwen 2.5 做基础,通义代码模式在代码生成、推理和修复等能力方面表现非常优秀,能够支持 40 多种编程语言。


此外,通义代码模式的代码能力相比常规模式有 30% 以上的显著提升,在代码场景下表现极为优秀的同时,也具备很强的数学和通用能力。


在完成意图的理解和代码的生成之后,通义代码模式还需要将代码文件渲染成小游戏、网页和数据图表等各类应用,并且支持直接对代码的编辑修改(如转换语言、添加注释、问答等)。


这其中最大的难点就在代码渲染层面。为了尽可能扩大代码成功渲染为各类应用的范围,通义的团队需要对用户需求进行深入调研,并且针对主要的几大类场景进行优化,以确保满足用户的实际使用需求。其中涉及到意图理解、模型调优、前端渲染组件适配等一系列复杂的工作。


王晓明表示,通义代码模式目前可以实现大多数只依赖前端渲染的应用生成任务,对于更复杂的前后端代码,目前可以实现长篇的代码片段生成作为辅助。未来,该模式会进一步与 IDE 进行深度结合,帮助用户完成更加完整的前后端系统代码生成,实现更加复杂的应用类型生成。


这才是未来 AI 该有的样子?


通义代码模式选择的人机交互范式,可谓如今各路大模型公司主攻的新方向。


从理念上来说,这一模式与国外知名 AI 公司 Anthropic 提出的新功能 Artifacts 以及 OpenAI 发布的 ChatGPT with Canvas 不谋而合。或者,从某种程度上来说,通义代码模式更像是集合了二者的优势。


Artifacts 的最大特点在于实时预览。长期以来,大型语言模型一直能够生成代码,但在 GitHub 和 Copilot 等人工智能辅助开发环境之外,执行生成的代码通常需要额外的步骤。这些步骤让开发人员感觉繁琐,也把非开发人员挡在了门槛之外。在单独的窗口中保存和运行代码,可以带来方便、即时的体验。同样,在生成图像和其他可视化输出时也是如此。


所以,在 Artifacts 问世之际,很多人将其称为「本年度最重要的 AI 功能」、「Claude AI 最有用的功能」…… 还有人评价说,它「比 GPT-4o 还要震撼,这才是未来 AI 的样子」。



不过,Artifacts 也有一些不方便的地方,比如对于编程语言之间的自动转换、注释的添加还没有做到很好的支持。OpenAI 随后发布的 ChatGPT with Canvas 倒是提供了这些功能,但并不支持代码预览和应用生成,前面提到的种种问题依然存在。



通义代码模式更像是二者的结合体。它能够实现类似 Claude Artifacts 的代码生成和预览功能,并且还支持 Claude 不具备的代码编辑、添加注释、转换语言等功能,可以一步到位实现小游戏、网页、数据图表等各类应用的预览和使用,所触及的人群更加广泛。


同时,为了让那些不会写指令的用户直接创建应用,通义代码模式预置了一批提前生成好的小游戏和应用,用户可以直接使用。如果需要修改,用户只需要简单改一下指令,就能生成符合自己需要的应用。


如果说,未来的人类社会不可避免地走向人机协作,那么真正的挑战不仅在于如何打造更智能的 AI,还在于如何让这种智能易于获取、直观自然,并能无缝融入现有的工作流程。


在大模型之争的上半场,大多数企业都在关注前者。如今到了下半场,关注后者的企业将变得越来越多,OpenAI、Anthropic、阿里通义都属于行动较早的那一拨。


最后,关于「为什么要招募不懂代码的用户做测试」,王晓明回答说,「不懂代码的人更关注的是能否使用 AI 生成自己需要的各类应用,比如搭建个人博客、生成贪吃蛇小游戏、编写数据图表等,甚至还有用户希望用通义来生成一个表白网站的。对于这些用户来说,更重要的是应用生成的简便程度和可用性,而不是底层的代码实现逻辑。」


从实际使用场景出发,只需要用「大白话叙述」就能构建起符合我们需要的应用,这样的工具才是真正能够提升效率的工具,能够让更多的人用起来。


因此,「通义代码模式」用户的大头可以不是程序员,可以是学生、老师、数据分析师,自媒体从业者…… 测试者自然要更贴近这些人。


听起来,这会是一场非常有趣的测试,得到的洞察也会非常丰富。


如果你也想参与测试,可以在通义 App 或者通义 PC 页面对话框输入「1024」进行预约。期待大家的测试反馈。


文章来自于微信公众号“机器之心”,作者“关注生成式AI的”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/