在AI领域数据和算力的军备竞赛中,AI从业者要么紧密跟随OpenAI等领先公司做进一步的应用开发,要么在Transformer机制日益显现局限之时探索新的路径。
自然,在AI的时代红利下,创业公司站在巨人的肩膀上可能会加大创新成功的概率,而选择挑战主流的范式,并在基础架构层面做创新,无异于难上加难。
Sapient Intelligence的联合创始人Austin郑晓明和合伙人王冠无疑选择了一条相对艰难的创业之路。
“很多伟大的变革和创新,起初都是由不被重视的outlier(非同寻常者)们开启的。” Austin在2024福布斯中国·最具影响力华人精英TOP 100颁奖典礼上这样说。他认为,很多outlier不拘泥于传统框架,着眼行业全局的视角,从本质思考行业的迭代和突破。
Austin本人就是一位这样的outlier。多元的背景让他更擅长快速地捕捉机会、洞悉事物发展原理,从底层出发去思考如何解决问题。2024年8月,王冠和Austin共同创立Sapient Intelligence,意为“智人”,寓意着更高级的智能体。Sapient Intelligence正在打造可以完全自主化解决复杂长程任务的新一代大模型架构。该架构试图超越传统的自回归Transformer设计,采用了更加贴近人脑思维的算法模式,使得AI在面对复杂问题时具备真正的推理能力。
历史学家、哲学家尤瓦尔·赫拉利撰写的《智人之上》一书中,赫拉利深入探讨了信息网络如何重构了我们的世界,以及在未来社会中,信息与权力、智慧与自由之间的复杂关系。他认为,每个人在使用AI的过程中都肩负着重大的责任,需要正确地引导AI向着一种积极的、有利于人类的方向发展。
从这种引导AI的正向发展出发,除了架构的创新,Austin更看重的是,要做一个年轻化、多元化、全球化的顶级 AI 创新组织,大力支持培养充满创造力和探索精神的outlier们,一起大展身手、共同攀登AGI的技术巅峰。
Sapient Intelligence 联合创始人Austin郑晓明(右)和王冠
Austin从小开始走“少有人走的路”。14岁时,从中国内地去加拿大上学,在加拿大少有华人的区域进行学习和融入,心态也更加开放,愿意持续探索。
上大学后,他在Ivey Business School学习哲学(PPE)与商科双学位。无论是出于修习哲学还是自身的兴趣,Austin非常喜欢探索每一个行业的本质原理,包括技术在其中如何运作,商业逻辑、价值动因及用户付费动机等。在大学里,他开始不间断地学习和尝试。“一直在不断地尝试不同行业从0到1的全链路过程”。
大一时,他参与创立学生孵化器W5。主要工作是,帮助本地同学尤其是工程师们更好地描述自己的想法和技术,让他们更好地得到YC等知名孵化器的支持。在这期间,W5孵化出了包括Voiceflow(估值数亿美元)在内的数个知名项目。
大三时,Austin开启尝试首次创业,先是和几位同学做不同创业方向的探索,评估了众多行业后,从供给和需求的角度考虑,他选择从男性化妆品切入。2016年,他联合创立了男性化妆品品牌Faculty.World,后获得雅诗兰黛数千万元投资。
这是Austin首次从0到1参与到创业的整个过程中。这段创业经历也让他更能理解商业的本质:未来不管做什么,都需要看市场的基本逻辑,看看供需关系之下哪些值得被解决,以及可以被解决的问题。
更大的商业构想在他的脑海中逐渐浮现——虽然消费领域创业很有趣,但技术领域可以改变世界,真正影响到所有人。
2019年,Austin毕业并加入加拿大知名孵化器NEXT36,随后获得了奇绩创坛等机构的投资,先是在云游戏方向创业。做云游戏期间,因为涉及到大量的云渲染,Austin的公司储备了大量的GPU算力资源。到生成式AI爆发的时候,Austin敏锐地将公司重心转向AI算力并与众多知名AI项目合作,由此积累了大量AI方向的资源与人脉,也在AI领域建立了自己的口碑。
Austin是两度拿到奇绩创坛投资的创始人。
他在多次与奇绩创坛创始人陆奇的沟通中,感觉到了后者通过哲学的方式来引导后辈创业者的能量。
在创业筹备之初,陆奇曾问Austin和王冠一个问题:到底是什么在驱动着你?
在仔细思考过后,他选择听从自己内心真实的声音。
“我希望去做一些有影响力的事情,通过我的努力去改变世界。”
科技公司的本质是要引领创新。在AI领域紧密跟随策略或许是保险之策,但很难真正能有革命性的变化产生。
中国的很多理工科本科生会走去美国读博士进而去硅谷大厂工作的道路。这也部分使得在AI领域中,有很多年轻的华人精英群体已经成为AGI的中坚研发力量。Austin注意到,在公司层面,全球范围内除了李飞飞的空间智能公司World Labs,以及日本的Sakana公司,真正由亚裔或华人领导的AI公司少之又少。“从全球来看,由亚裔或者华人领导的基础模型公司非常少,但硅谷最厉害的AI研究院都是华人,我们也希望建立一个由华人领导并能在世界上形成竞争力的AI研究公司。”
Sakana.Ai的联合创始人Llion Jones作为Transformer八位作者之一,目前在Sakana基于“自然启发智能”自己打造基础模型,致力于颠覆Transformer的现有技术路线。
Austin也认识到Transformer的局限,一直寻找可以在AGI领域有突破、致力于改变世界的年轻人。可谓“功夫不负有心人”,他在Github上发现了王冠。
王冠,今年刚毕业于清华大学,他先在清华AIR研究院学习强化学习,之后加入清华脑与智能实验室,尝试将强化学习与演化计算做融合。王冠最初尝试做一个名为OpenChat的开源模型,仅7B大小,发布后,OpenChat在Github上获得5.2k stars,在无融资和推广的情况下,成为全世界下载量最高的开源模型之一,在hugging face上月均下载量一直在20万以上。
OpenChat也让两人结识。王冠和Austin一拍即合,决定一起创业。
合伙创业的原因,一方面在性格上,两人“高度一致又高度互补”。更重要的是,“在对AI技术终局的技术理解和追求上,我们两个非常像。我们都认为,如果AI真的要做到通用人工智能,要真正解决问题,一定要做到思考、推理、归纳和探索。”
2024年8月,Austin和王冠共同创立Sapient Intelligence。Austin负责公司战略、团队搭建和运营等工作。在Austin描绘的愿景里,Sapient Intelligence是一家致力于探索全新一代自迭代AI模型架构来解决长程复杂推理任务的公司。
相较于ChatGPT简单推理不稳定、复杂问题无法解决以及幻觉等缺陷,Sapient希望通过模仿人脑的工作机制来实现AI的推理能力。当下,Sapient的基础架构已经完成数学验证,团队也已结合演化算法和强化学习完成验证。“这将是少见的,拥有多步计算、memory和树搜索能力的非自回归模型。”
认知科学理论启发的 Sapient-H 系统架构(前额叶皮层和皮层柱的认知控制层级结构)
Sapient Intelligence是全球罕见的以大规模强化学习和元学习为核心的大模型架构,目前Sapient H模型在极小的模型体量下拥有极高的推理能力,可以解决众多GPT架构的“不可解”问题,并在多个复杂推理问题中达到SOTA水平。
Sapient Intelligence已经获得了来自新加坡淡马锡旗下的Vertex Venture、日本头部风投集团、欧洲及美国的头部VC数千万美元的天使轮投资,并已经与新加坡和日本建立起了深度的合作生态和渠道关系。“这是全球近段时间最大一个种子轮的AI投资之一。”Austin说。
Sapient Intelligence不仅是第一家由华裔大学生创办的全球化大模型公司,也是第一家获得新加坡和日本主流机构支持的大模型公司。由于研发中心设在新加坡和硅谷,Sapient Intelligence也成为新加坡当前唯一一个基础大模型创业公司。
选择新加坡、日本等国家和地区的投资机构,Austin有多重考虑,全球化的公司更方便召集全球优秀的人才加入。新加坡、日本、韩国等地的现实AI需求让Sapient Intelligence从成立伊始就注重商业化的路径。
比如,新加坡AI公司相对少,但新加坡商业化资源丰沛。日韩对AI有大量需求,现金储备充裕,有意愿投资及商业合作。尤其是日本,既有好的互联网基础设施和人才,未来也有大规模的数字化升级和转型要求,“尤其是可以做到端到端代码生成和软件工程的AI公司有大量需求。”
Austin说,团队很大的优势在于多元化,能让大家更容易和海外组织建立深度联系,以及了解企业和用户需求,知悉如何去解决这些需求,如何为海外市场带来AI创新血液。
Sapient Intelligence未来的商业化路径,会依靠投资方旗下的公司做技术探索和需求支持。未来先用新一代的AI架构解决To C层面如AI软件开发和自动化的软件实时代码生成等需求,做类似Magicoder的面向开发者的工具和应用。同时,在To B层面,先做面向日本商社等战略投资方的企业级解决方案支持。Austin透露,日本商社本身每年有大量的软件开发外包服务需求,除了自身的需求,也有渠道可以在日本把公司的模型和能力进行商业化。
Sapient Intelligence强调天使轮的融资将主要用于算力支出及全球人才招募。在Austin的解读中,作为最早由华人背景的团队出海并成功获得新加坡和日本主流机构投资的团队,希望世界上最有创造力、最有颠覆性创造意识的人加入。
“大家可以从不同的环境、不同的背景走到一起。真正去挑战超级智能和通用人工智能这些最艰难的,且最值得被解决的AI发展方向。”
公司在创立初期,汇聚了众多来自世界各地的一线科学家,包括XAI、Deepmind、Google、Anthropic、Meta和Microsoft等世界级AI机构的资深科学家。这些来自世界各地的人才曾领导或参与过众多知名模型和产品的开发,包括AlphaGo、Gemini、Microsoft Copilot 等。
创立Sapient Intelligence后,Austin和王冠在如何能获得足够的资源去找到足够优秀的人同行的看法上也高度统一。Austin深刻意识到,靠两个人单打独斗有能力边界,找到可以更快同行的人才能让公司走得更远。
在组建团队层面,Austin一直以“非技术合伙人”的角色全身心支持科学家的创业心态来组建团队。
Austin眼中的王冠,性格上纯粹率直,做研究时严谨细致,耐得住寂寞,愿悉心钻研。
Austin看到,在AGI大公司里,很多人都像王冠一样,从小就展现出天赋,但少有人愿意给他们资源去尝试其他人没有尝试过的技术方案和路径。在过往创业过程中,以及和众多创业者的接触中,他发现,大模型AI领域,尤其AGI方向,创业者或者研究员并不是传统意义上的计算机专业科班出身,而更多的是拥有物理、化学或数学背景。很多AI领域的研究员甚至还没有上过大学,没有经过传统的学术流程建立自己认知体系。“我和王冠都属于outlier,真正能领导或者改变世界的技术颠覆者大多都是outlier。”
Austin相信,只要给年轻人足够的资源,一定可以创造出一些东西。“王冠和他代表的天才少年这一类型的创业者,我愿意扶持和帮助,希望一起去共创。”
Sapient Intelligence在各地举办AI学术酒馆活动,分享最新的模型进展
在组建团队的时候,Austin会通过两个维度来判断。一个维度是候选人的内驱力。他认为,一个人如果聪明,内驱力足够强,哪怕是刚毕业的大学生,没有工作经验,一定能学会某种技能,也能创造出一些很有趣的事情。Sapient正在招募的员工,在很小的年纪就展现出很强的内驱力和探索能力。第二个维度是技术上的共鸣。他需要大家对底层需求和底层实现方式的看法,比如自动化代码开发场景,端到端的应用开发等需要解决的瓶颈有基本共识。“互相促进,都有认知上的提升,并能达成良性循环。”
在组织结构设计上,不仅是通过股权激励体系吸引优秀的人加入。Austin希望公司的文化和组织形式尽量扁平,避免官僚和结构化。拥有组织多元化和全球化团队的能力也是Sapient的核心优势之一。
在这个层面上,Sapient的终极目标不仅是AGI,也是在亚洲建立一个新的世界级AI Research Organization,引领未来AI技术的发展方向,同时也让大家天马行空的疯狂想法获得一个被实践和验证的空间。
有美好愿景,亦在脚踏实地。眼下,Sapient Intelligence正全力筹备预计于年内发布的新模型,期待在指标上有颠覆性的突破。Austin在忙下一轮融资,未来希望拓展韩国、欧洲、中东、北美等国家和地区的市场和融资渠道。组织建设上,他依然继续寻找天才和有想法的人,持续性地做培养和扶持。
面对AI的大风口,他说,“风口正劲时,大家会倾向于做有共识的事情。但我们更坚持做自己认为正确的事,并用信念和耐心来解决。”
文章来自于“福布斯”,作者“‘2024福布斯中国·最具影响力华人精英TOP 100评选’组委会”。
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md