AI编程初创公司Magic发布1亿上下文窗口模型,编码能力超级加倍
短短一周,却是AI 编码赛道的高光时刻。三家知名AI Coding公司都在上周获得了可观的融资。
先是总部位于旧金山的 Magic 公司在谷歌前CEO的加持下获得了 3.2 亿美元的融资,使其总融资额在短短两年内达到了4.65 亿美元,随后公司趁热打铁,发布了首个1亿个token上下文窗口的模型 LTM-2-mini,顿时声名鹊起。与此同时,总部位于圣何塞的 Codeium 公司在C 轮融资中获得了 1.5 亿美元,得到了 General Catalyst 和 Kleiner Perkins 等知名投资者的认可,估值12.5亿美元,晋升为独角兽。无独有偶,Codeium 的“老对家”,AI代码生成新秀Cursor获6000万A轮美元融资,由A16Z领投,OpenAI等巨头参投。
在这些AI新贵后面,不乏金光闪闪、鼎鼎大名的投资人们。根据《金融时报》报道,自2023年初以来,AI编程助手累计获得近10亿美元投资。Replit、Anysphere、Magic、Augment、Supermaven和Poolside AI等公司仅在今年就筹集了4.33亿美元,总融资额达到9.06亿美元(根据Dealroom的数据)。大量的注资仿佛在表明,计算机编程是最先被人工智能技术改变的工作职能。在阿尔法公社之前的文章中AI编程创业公司为何接连获得大额融资?|AlphaFounders,我们简要介绍过AI编程领域的融资盛况,这次我们将深入了解,AI 编程公司的迷人之处究竟在哪。
提到AI编码助手,不得不提鼻祖级应用,GitHub Copilot。微软CEO萨提亚·纳德拉曾透露,Github Copilot带来的收入已超过微软收购GitHub时GitHub的全部收入。这款基于大语言模型的AI编程助手能够根据上下文自动生成代码,大大提高了开发人员的工作效率。
作为编程助手的代表作,GitHub Copilot奠定了三大革新性的理念,此后不断被参考和实践。
1、如何做产品?在AI时代下,软件产品的大趋势是从"特性工厂"变成"结果驱动"。
不同于传统注重项目管理和代码质量控制的方式的项目管理模式,未来的软件产品开发更注重从用户需求和业务目标出发,通过迭代的方式不断优化产品,以实现预期的结果。这种“结果驱动”的思维方式对于开发基于人工智能的产品尤为关键。传统的软件产品开发是一个相对确定性的过程,开发者可以编写单元测试,检查代码是否存在bug,并修复它们。但人工智能产品则完全不同,AI产品是非确定性的,开发者无法完全预测它们的输出。因此,AI编程公司需要思考产品管理到底意味着什么,Github的策略即是采取更加灵活和迭代的方式,不再简单地依赖单元测试,而是建立了一套复杂的离线评估体系,通过大量的样本数据来评估Copilot的输出质量,不断验证假设,并根据用户反馈来优化产品。
2、如何挖掘产品价值?通过“Prompt Engineering”等人机协作模式让用户“驾驭”产品。
传统的软件开发流程过于注重项目管理和交付,而忽视了如何将用户需求和业务目标有效地转化为产品功能。这种"特性工厂"式的思维方式,往往会导致产品失去焦点,无法真正满足客户的需求。AI编码助手并非简单地通过代码补全来提高开发效率,而是试图从根本上改变程序员的工作方式。这类软件最大的价值,不仅在于它能帮助开发者更快地完成编码任务,更在于它能提升他们的工作体验和满足感。码农们在一次次Prompt Engineering的交互中,可以把更多精力投入到创新和问题解决上,由此提升了用户和软件的亲密度与粘性。
3、如何变现产品价值?GitHub Copilot亲身演绎AI编码公司的商业化打法,是与云基础强劲的大厂绑定。
在各家大厂争先投资AI 编程赛道前,微软早已入局,在2018年以75亿美元收购GitHub Copilot。而上周Magic获谷歌支持、Cursor有OpenAI站台更是验证了GitHub Copilot的商业化道路,大厂需要与AI编码公司绑定搭建生态,保证自己不落后,而AI编码公司的技术创新需要资金,更需要高性能基础设施的支持,以供大规模用户使用,因此大厂成为最优选。
Codeium的创立和Github Copilot的产品理念脱不开关系。联合创始人兼CEO Varun Mohan是早期Github Copilot的用户,深深感受到这类工具的巨大潜力,但同时也发现它们存在一些局限性。比如只能在代码的开头或结尾提供建议,无法智能地补全中间,于是在2022年中期Codeium诞生。为了更好地利用代码的语义信息,Codeium团队在模型训练时专门增加了上下文建模的目标,让模型能够捕捉更丰富的上下文特征,最终解决了“填补中间”的技术难题。
同时,Codeium在Github Copilot的基础上,针对产品设计也做出了独特的选择。Copilot的理念是以用户反馈来优化产品,因此当时现有的代码生成工具常常过于关注简单的"接受率"指标,而忽略了生成代码的实际质量。这可能会导致工具提供一些毫无意义的建议,只为了提高指标。为了避免这种情况,Codeium团队专门设计了一套"字符级归因”机制,能够精确度量每个代码建议对最终产出的实际贡献,更关注被采纳的代码占整个代码库的比例,优化了产品验证流程。
AI编程赛道玩家层出不穷,狂揽近5亿美金的AI编码初创新星Magic更是野心勃勃,将前人定义的编程自动化畅想到极致。Magic近日已推出首个1亿个token上下文窗口的模型 LTM-2-mini,而以长上下文窗口闻名的Google 的Gemini 旗舰型号,也仅拥有 200 万个 token。如果说此前AI编程产品领域的角逐主要在训练层面的参数规模、数据多模态,那么现在比拼的则是推理能力的进化,例如超长文本、推理时间计算、强化学习、对齐等等。因为Magic 的目标远不止于开发一个编程智能助手,而是实现AGI:一个比人类更可靠地解决对齐等问题的人工智能。为实现这一路径,Magic同样选择与Infra强劲的大厂结盟,和谷歌、英伟达深度合作,在 Google Cloud Platform 上构建两台“超级计算机”,使用Nvidia H100 GPU。
可以说,AI编程赛道是AI应用领域独角兽最集中的方向之一。玩家这么多,这个赛道会拥挤吗?从长远看,并不会。
从一开始,编程助手这个工具的出现,就暗存着“民主化编程”的愿景,即不仅是提高开发人员的生产效率,更要让普通用户也能参与到软件创造中来。而AI的赋能将逐步降低编程的门槛:让每个人都能通过一个文本框就能创造出自己的软件产品。
如果AI工具能嵌入到现有工作流程中并立即显现出价值,那么更容易实现盈利。正是编程助手的强经济效应,用户付费意愿和滚雪球式的用户增长等属性,推动了微软、亚马逊、Meta、谷歌等科技巨头争相入局。
数学领域中有这样一个有趣的问题:任意给一个自然数N,如果它是偶数,就将它除以2,如果它是奇数,则对它乘3再加1,经过有限步骤后,最终的演算都是以 “4→2→1”为结尾。AI 编程公司的魅力应该在于,假以时日,能为开发者将复杂的编程问题都以 “4→2→1”为结尾,化繁为简,编程越容易,需求就越高。
如果10%的人口都能编程,那将是一个巨大的变革。
文章来自于“阿尔法公社”,作者“发现非凡创业者的”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0