大模型引发的科技和创业热潮,已经迈入了第三年。
自 2023 年 ChatGPT 横空出世后,大语言模型的能力不断突破,一次次震撼世界。但与此同时,技术和应用间的鸿沟依然存在,并未得到弥合。特别是 C 端应用,依然是以「Chatbot」聊天机器人为主,并没有真正渗入普通用户的高频场景,AI 应用的商业化未来,也依然迷雾重重。
很大程度上,从模型到应用,并不只是两个点的连接,也不可能一蹴而就。就像计算机和互联网革命,从最底层的机器语言、通信协议,到移动互联网的大繁荣,之间需要构建复杂的产业链条。
对大模型来说,从基础的算力、数据、模型,到对模型的微调,开发 Agent 智能体,再到接入不同的应用,这些应用不仅包括 app,还包括各种硬件终端,甚至是大型的虚实结合场景……这些都需要更强力的贯通,需要一个更大的产业和人才集群,才能实现。
AI 应用的落地和商业化,是全链路打通的结果。
这个过程就像是创造「奇点」,必须将资源聚集,并且给到合适的压力和环境,才有更大的机会将一切导向原爆点。而现在,这个「奇点」的雏形,已经在上海逐渐显现。
1 月 3 日,上海市「人工智能+」行动推进大会,在徐汇滨江举行。通过「十大行动」的发展思路,模速空间正在创造一个高密度的大模型技术产业集群,凝聚为国内以至全球的大模型产业高地,为下一次的创新密集爆发积聚力量。
当下大模型领域最大的发展矛盾,就是算法、算力和数据的矛盾。
先进的算法、训练方法,这是大模型 AI 创业公司的强项,往往由少数顶尖人才组成的小团队驱动,他们能更具针对性地瞄准算法思路,命中先进的算法;
庞大的算力则掌握在芯片、云计算、ISP 巨头手上,如微软、谷歌、英伟达;
新的知识数据,从文字、图片到视频,则掌握在一些社交媒体、主要面向 C 端企业手上,比如美国的 Meta、X、YouTube……国内的知乎、贴吧、快手等。
只有将三者结合在一起,才能训练出最先进的大模型。但今天的行业现状是,越来越多的公司,为保护自身的商业利益,已经开始互相「建墙」。
曾经大多公开的模型、训练方法,现在越来越转向闭源;算力资源随着紧缺,价格水涨船高;社交媒体也纷纷搬出了各种反爬虫算法,防止其他企业爬取自己的数据……
这几乎已经成了现在大模型开发的「不可能三角」。
让企业间「打通壁垒」,是模速空间打造技术集群的过程中,最重要的思路。它不仅接入了包括上海人工智能实验室、MiniMax、阶跃星辰、商汤等国内大模型 AI 领域的最前沿企业和机构,还强调推动打造具有国际影响力的大模型开源生态,推动前沿算法和模型的研究突破。集聚大模型企业 255 家,备案大模型 34 个,约占全市三分之二。几百家与大模型相关的企业聚集在这片场域,彼此间非常容易感知产业的变化,也更容易产生化学反应。
而在算力和资源层面,模速空间推动了「上海智能算力加速计划」,与包括三大运营商,腾讯云、阿里云在内的国内云服务巨头合作,构建多层次的算力支撑体系,且加大提供相应的算力补贴支持。
除了与云服务提供商合作之外,模速空间也在推动软硬件协同,发掘自主可控的算力芯片项目,为当下芯片算力紧缺的情况寻找的新的突破口。
模速空间还与一批语料数据企业合作,构建高质量垂直语料库,同时推动公共数据分批次开放,为大模型训练提供更好的数据基础。
在模速空间的发展策略里,不难发现,他们已经充分意识到大模型技术层面最重要的「三角维度」。并且针对每一个方向,都已经有了成熟的发展规划,为未来更强大的模型迭代,提供了良好的环境基础。
而且,对于大模型 AI 领域最前沿的,需要攻坚的难题。模速空间也制定了一套「创新攻关」的发展策略,将鼓励和创建一批高水平研究机构、企业创新平台,通过这套机制,能够加强新型研发机构间合作,在面对国家级的难题时,将更多智慧集中在一起进行攻坚。
在基础的模型技术之上,大模型领域当前更大的困难,依然在应用落地。
过去三年,模型的迭代速度很快,成本也在大幅降低。但核心的矛盾在于,这种迭代并没有转化为用户的体验。大部分大模型应用,依然在以「从头做一个 AI 助手 App」作为唯一的应用转化路径。但实际上,单纯聊天助手式的 AI 应用,又很难渗透进用户的高频场景。
AI 应用领域需要的,是更多「中间件」,是一个开放互惠的生态,也需要更具想象力的实验场景。
AI 的应用落地,不应该是复制移动互联网时代的 App 风暴,将用户手机里的 App 数量从 40 个变成 80 个,大家的互联网使用时长已经到了一个极限,很难挤出更多时间给任何新的 AI App 了。AI 要做的,是改造那些现有的应用场景,以及超出手机、电脑,探索更广阔的现实,实现更强大的「虚实结合」的应用。
针对目前这一现状,模速空间给出的第一个答案是「垂直场景」。
当前,模速空间已经推动了上海市首批垂类应用示范场景的发布,将包括医疗、交通、能源、城市管理等多个垂直领域的需求方,和供给侧的多个垂类大模型进行了对接。医疗领域,徐汇区开展人工智能院地合作,支持中山医院在内的八家三甲医院试点开放院级场景,加快大模型赋能「防诊治康」各个关键流程。教育领域,徐汇区服务上海创智学院打造学科数据生产平台,研发教育领域通用大模型。城市治理领域,徐汇区行政服务中心率先采用 Agent(智能体)、RAG(检索增强生成)技术,上线全市首个「政务服务大模型」。
通过垂类的需求和供给对接,双方可以展开密切地合作,结合具体需求对大模型进行针对性微调,迅速实现应用落地。这些场景不仅具有极高的应用价值,更在于它们为大模型应用提供了示范作用。
除了主要面向 B 端的垂类大模型,在 C 端,模速空间也在针对软硬件两个层面,进行更多的创新孵化。其中不仅有应用,还包括更多智能终端产品,包括理疗机器人、下棋机器人、AR 眼镜和智能汽车……
最后,也是最重要的,上海为未来更广阔的 AI 落地机会,为虚实结合,提供了一个巨大的「实训场」。
当下对 AI 大模型落地最广阔的想象,就是具身智能。这里既包括各种能理解通用指令,完成通用任务的智能机器人,也包括可以实现更高阶自动驾驶的智能汽车,以及低空的飞行器。
这些产品最大的一个特点,就是需要在现实中进行测试和积累数据,最终转化为模型训练和强化学习的资料。但大部分城市,当下都没有成熟的试验环境。
而当下的上海,已经在为具身智能未来的发展和试验,做好了准备。
过去几十年,创新迸发的过程越来越密集。无论是时间还是空间上,都是如此。
前信息时代的工业革命,是散布在全球各地,发生的过程也跨越了一个较长的过程。但信息时代是很短时间内,在一个地理上很小的空间里「爆发」出来的,包括硅谷,以及国内的中关村……
这里最大的原因在于「人」。从工业革命到信息革命,过程中最大的变化就是人的密集程度增加了。如果说工业革命是劳动密集的革命,信息革命就是智力密集的革命。
而到了 AI 时代,一切依然是如此,资金、算力、技术等等要素需要聚集,人才更需要聚集,只有在聚集的过程中才能形成启动的「压力」,建立起初始的势能,最终将创新的火种点燃。
所以对一个「AI 创新社区」来说,不只是要得到那些前沿的大公司,头部机构的支持,更在于营造一个良性的生态发展环境。帮助创业机构完成从 0 到 1,从 1 到 10,从 10 到 100 的发展阶梯,完成每一个阶段性的发展目标。
这是模速空间自成立以来成功的关键。过去一年,他们已经帮助阶跃星辰、无问芯穹、MiniMax 等创业公司实现了高速成长。这个过程不仅仅在于帮助企业对接资金、算力、上下游合作方等等资源,还在于建立起一个有助于人与人碰撞出火花的交流环境。
以上海人工智能母基金、徐汇资本等为牵引,平台建立了覆盖种子期、成长期、成熟期的全链条科创投体系。目前,徐汇资本及其出资的人工智能领域基金总计已投 103 个项目,且始终坚持投早投小,投资 A 轮及以前早期项目数量占比达 88%。奇绩创坛等投资机构发挥「VC+孵化」双重功能,魔搭社区、稀宇科技「大法师计划」、阶跃星辰「繁星计划」等项目,解决了开发者从 0 起步的问题。
上下游企业的聚集,让很多创业公司在产品开发和销售的早期,就能直接对接到上游的方案商和下游的客户。这既帮助他们尽早实现商业上的循环,也让他们的产品能迅速顺应市场的需求做出调整。在密集的互动中,一个更完整的 AI 产业链条正在形成。
这种生态环境,可能比单纯的资金、技术支持更重要。
而现在,这一理想正在进一步扩大。
此次上海市「人工智能+」行动推进大会上,这支「AI 集团军」几乎囊括了国内大部分处于大模型 AI 领域前沿的企业、机构,而且更重要的还在于「人」,包括中国科学院、上海交通大学、复旦大学等多家科研院所,也参与其中。
这意味着,更多人才都能加入到这波 AI 浪潮中。这不仅仅是技术、产业的集群,更是智慧和创新思想的集群。
模速空间的发展目标,是通过建设产业集群,推动产业发展来到一个「原爆点」,就像每一次产业和技术革命一样,最终让 AI 的技术浪潮,惠及每一个普通人的生活。
文章来自于“Founder Park”,作者“Founder Park”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner