7月4日,上海高温逼近40度,人们涌入上海世博展览馆的热情却愈发高涨——全球顶尖人工智能学术、产业盛典2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)正式拉开帷幕。
今年,展会面积超过5.2万平方米,不仅规模再创新高,大模型产品、人形机器人、虚实融合、自动驾驶、无人机、脑机接口等AI技术应用体验区,更是给了到场观众一点前沿科技的“小小的震撼”。大会论坛部分则聚焦大模型、算力、具身智能、自动驾驶等“AI+”热门话题,国内外AI 领域最受瞩目的学术界、产业界代表现身大会现场,围绕全球治理、产业发展、科学前沿三大重点,展开交流研讨。
在全行业聚焦、探讨“AI应用究竟该如何落地”的当下,作为AI发展的见证者与推动者,7月5日,在本次WAIC大会上,36氪携手WAIC大会组委会打造“AI Partner氪话未来直播间”,邀请来自国内知名AI企业的相关负责人,通过交流AI应用落地案例,分享“先觉者”的探路故事,剖析“后来者” 突围秘笈。“AI Partner氪话未来直播间”是36氪“新质生产力·AI Partner”计划的重要一环,了解更多“新质生产力·AI Partner”计划,查看????嘿!来这里一图读懂36氪AI年度策划——新质生产力·Al Partner
蚂蚁集团NEXTA创新实验室项目负责人/资深媒体人何思翀
“AI Partner氪话未来直播间”的前四场由蚂蚁集团NEXTA创新实验室项目负责人、资深媒体人何思翀作为主持人,依次与趣丸科技、孚知流、宇树科技、出门问问的嘉宾展开对谈。何思翀表示,这届WAIC明显看到了更多AI赋能后的千行百业新生态,相信在不久的将来,带给用户的一定不是一个大模型,而是全行业的深度合作,由各种机器人、智能体以及多姿多彩的AI应用共同构建。
趣丸科技副总裁兼首席战略官庄明浩
过去讨论AI,大多数都会专注于大模型或是底层技术的能力。现在,全行业都在尝试与AI技术链接,大家开始更加聚焦于AI应用端与垂直场景。社交和泛娱乐往往是技术最先被应用到2C和商业化的板块,社交娱乐和AI技术的融合应用处于什么样的阶段?趣丸科技是一家集兴趣社交、电子竞技、人工智能于一体的创新型科技企业,趣丸科技副总裁兼首席战略官庄明浩在与主持人何思翀的对话中谈到,现阶段所有在做社交产品的公司,包括初创企业在做新项目的第一天,都会想着基于AI技术能做出什么样的拓展,这已经是一个业内默认的标准答案了。无论是通过X+AI,或者是AI Native,AI技术确实带给大家新一波探索新产品形态的机会。
面对当前市场上不断涌现又快速消亡的AI社交娱乐产品,他也坦言:“今天这个时间点AI看上去是无所不能的,但是面对这样的一个无所不能的东西的时候,就越发要求我们作为一个使用者,要清楚地知道边界在哪,这个边界包括我们自身对自己业务场景边界的定义,也包括我们对现阶段AI能够做到什么的技术边界的理解。”市场不断变化,大浪淘沙,庄明浩认为,AI应用的发展潜力已经成为“明牌”,中国很有机会在应用领域构筑起全球的领先地位,但黑暗森林法则也会在AI应用里演绎得淋漓尽致。不管是X+AI还是AI Native,趣丸科技始终坚持贴近用户需求,通过创新的技术和产品去满足用户的需要,在自身擅长的领域里挖掘新机会、锻造新优势、实现新增长。
孚知流创始人兼CEO白双
AI创业浪潮席卷而来,B端产品和C端产品各自的优势是什么?企业在AI技术落地过程中往往会面临怎样的挑战?企业级智能体是什么?它与传统的AI解决方案有何不同?孚知流创始人兼CEO白双是一位连续创业者,于2020年、2023年先后创立Translai和孚知流两个AI项目,并拿到知名风险机构投资。在第二场直播访谈中,她从用户、技术、市场的角度分享了智能体的概念,同时表示:“智能体它是人类的思考行为方式在数字世界的投射,而企业级的智能体的核心则在于,是否能够为企业带来真正负责任的AI。”
白双认为,AI技术除了能为企业实现降本增效,它更能够通过结合客户已有的业务流程,帮助企业重塑业务流程,找到新的业务增长点。她表示,从TO B的角度来看,未来AI技术只有结合具体行业发展才能够有竞争力:“我觉得每个行业的头部客户会自上而下地在企业中发起AI变革,只是它一定会是一个循序渐进的过程,随着后面形成行业化的解决方案之后,才会形成行业化的渗透,而且我也觉得AI只有结合行业才有竞争力。”
宇树科技市场经理陈希韫
在具身智能概念爆火的今天,机器人技术与人工智能的深度融合正以前所未有的方式,为机器人赋予了超乎想象的感知敏锐度、深度理解力及精准决策能力,拓宽着人类认知的边界。在第三场对谈中,何思翀对话国内知名智能机器人公司宇树科技市场经理陈希韫,围绕人形机器人相关的热门话题与观众展开分享。
谈到民用机器人赛道的具体情况,陈希韫坦言:“现在民用机器人呈现的是一个多点爆发的态势,目前的市场空间非常大,现在可能还是一个几亿或者说几十亿的规模,但是未来我觉得不可限量,可能会达到万亿级别的市场规模。现在没有哪一家公司能够统治得了民用机器人赛道,还是呈现多点爆发、齐头并进的情况。”陈希韫认为,当前人形机器人行业已经迎来了自己的“iPhone时刻”:“这个时刻的节点,其实取决于什么时候人形机器人它可以自身进化。但是我们知道,它现在已经可以了。所以在我看来,我们此时此刻,正处在这个时刻,只不过这个时刻不会像当年iPhone4或者4S刚推出来的时候那么快,这个时刻可能要长达三到五年的时间,我们正身处这个变局之中。”
聊到具身智能的概念,陈希韫把AI与机器人关系比喻为刘备和诸葛亮:“不能说是AI赋能机器人产品,应该说两者双向奔赴,机器人同时也赋能了AI。在两者的关系中,好像是刘备和诸葛亮的关系,他们能在一起成立一番事业,刘备如果没有诸葛亮,相当于没有手脚,诸葛亮没有刘备,也没有办法展开他的手脚,AI和机器人就是这种关系。AI能做到感知,感知以后就要通过一个身体表达,所以这也是为什么这两年做人形机器人的人越来越多,就是因为AI在爆发,人形机器人自然而然是AI最好的一个载体。”
出门问问品牌总监、《飞哥说AI》主理人高佳
作为AIGC第一股,上市究竟会给一家AI企业带来怎样的影响?出门问问品牌总监、《飞哥说AI》主理人高佳在直播间分享了她对大模型多模态、技术趋势、商业竞争的理解。面对当前国内厮杀激烈的行业态势,大模型公司未来拼的是什么?高佳认为:“拼的是落地应用,是能否构建可持续的商业模式。未来产品一定是核心,模型是服务于产品的。而对于产品这一灯塔或北极星,拼的是远见认知、对技术边界和自身能力的洞察理解,甚至是商业审美。纯粹做应用没有壁垒,纯粹做模型没有商业模式,或者说商业模式非常短期,而把自身模型和产品结合起来,以‘产模一体’形成独有的数据飞轮,对模型公司更有长期价值。”
当问及“AIGC第一股”对于出门问问而言是光环更多,还是压力更大?高佳坦言:“是动力更多、责任更大。常有人说出门问问是中国AI的活化石,将出门问问一路历程视为中国AI发展史的缩影,从语音助手到智能硬件,再到大模型,几乎每一步都踏在浪潮之前,穿越了行业周期,也正说明我们一路踩过的深坑更多,趟过的泥泞更多,远非光环更多。作为AIGC第一股,在大模型商业模式并不清晰的当下,我们更希望继续趟在无人区的前面,能为整个行业探索可持续的路径曙光,贡献一些力量。”
大厂的入局,让AI商业化竞争呈现白热化,如何看待当下大模型领域的竞争生态?高佳对比海内外生态,表示:“从行业宏观来看,充分竞争一方面提高了中国AI的整体能力,另一方面在大模型商业模式和烧钱属性的双重压力下,行业可能会在未来一两年内陷入相对小寒冬,一些创业公司面临生死之关;从个体竞争来看,在技术陡峭变化之下,最重要的是着眼于未来自身的生态位,其次是聚焦差异化赛道谋求生存,第三是在PMF和TPF之后,进一步找到PCF(Position-Competition-Fit),才算是构建了一定的竞争壁垒。”
未来智能CTO王松
AI技术正加速涌入电脑、手机等智能设备,诞生了AI PC、AI手机,它们在智能交互方面有哪些进展?未来可能有哪些新的交互方式?AI Agent又是什么?它会成为下一次大模型赛点吗?在最后一场直播中,36氪主持人杨沙沙围绕这些问题与未来智能CTO王松进行深度对话。
王松首先通过对比云端算力和本地算力的使用,解释了AIPC如何实现更智能的交互和操作,同时谈到未来智能设备与用户交互方式将产生重大变革,比如在未来,智能设备将能够实时生成个性化的电影、游戏、音乐和短视频等,让每个用户都能获得独一无二的体验,这种变化将彻底颠覆现有的娱乐和创作方式——“未来一定是一个完全个性化的世界。”同时,王松也表示:“未来的交互变革一定会发生在这些设备之上,包括现在的智能眼镜、智能耳机,甚至包括智能手表、手环、戒指。”
针对未来大模型的发展趋势,王松认为大模型将朝着两个方向发展:一是商业大模型,规模和数据量将越来越大;二是面向垂直领域的小而高效的模型。这两个方向看似矛盾,但实际上是为了适应不同的应用场景。提到AI Agent和AGI,王松坦言AI Agent如果想实现真正的落地,还需要模型能力的进一步迭代、提升,当前正处于通过小的功能点逐步获取用户信任的过程中。
文章来自于 “36Kr”,作者 “未来一氪”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales