过去一年多,在「AI 是未来」的共识下,大模型掀起的新一轮技术风暴在不断地冲击和改变各个行业。现在,在上海举办的 WAIC 2024 是这场「风暴」的最中心。
7 月 4 日,世界人工智能大会暨人工智能全球治理高级别会议(以下简称「WAIC 2024」)在上海正式举行。
相比往届,这次 WAIC 2024 再次创下了展览规模、参展企业数、参展产品数以及首发新品数的历史之最,在 5.2 万平米的会场内,有超过 500 家的国内外厂商参展,展出产品数量超 1500 项。
比如网易有道近日推出的新一代有道词典笔,行业首创内置 AI 摄像头,还搭载了国内首个教育大模型「子曰」,支持 AI 全科家庭教师小 P 老师、虚拟人口语私教 Hi Echo,能够帮助用户打通从查词翻译到全科学习的全学习场景。
图/网易有道
此外还有大量新式的 AI 终端产品和应用、自动驾驶汽车、具身智能以及各家的基础大模型等。仅在具身智能领域,现场就展出了 45 款智能机器人,其中有 25 款人形机器人。
如果说 2023 年作为大模型元年,大家更关注的是「百模大战」,那到了今年,如何将大模型技术转化为更有意义和价值的生产力,成为了更多人、更多厂商关注的重点,也是今年 WAIC 2024 激辩的焦点。
与此同时,作为人工智能领域的顶级盛会,每一届 WAIC 都能汇聚全球顶尖的人工智能专家、学者、企业领袖,最不缺的就是各种「AI 顶流」。
除了特斯拉、华为、百度、阿里、腾讯等全球知名厂商参展,本届 WAIC 2024 还有超过 200 位重磅嘉宾,包括 9 位图灵奖、菲尔兹奖、诺贝尔奖得主和 88 位国内外院士,以及上千位全球科技、产业界的领军人物。
在全体会议现场,姚期智、罗杰·瑞迪(Raj Reddy)、曼纽尔·布卢姆(Manuel Blum)三位享誉全球的图灵奖得主,就与原微软执行副总裁、美国国家工程院外籍院士沈向洋进行了一场堪称「世界级」的圆桌对话。
三位图灵奖得主和沈向洋,图/ WAIC
但这届 WAIC,还不只如此。
从 OpenAI 到 Anthropic,从政府官员到专业学者,尽管都看到了人工智能对于生产力和生产方式的变革潜力,但同时也都看到了人工智能在治理方面的必要性,这可能也是本届 WAIC 冠以「人工智能全球治理」之名。
从全球的角度来看,人工智能发展还面临较多挑战,除了基础设施、数字素养方面存在一定鸿沟,人工智能发展和治理方面,也存在较大鸿沟。这些鸿沟,会不断阻碍全球人工智能的发展,也对全球治理带来较大的影响。
WAIC 2024 开幕式全体会议上,清华大学苏世民书院院长、人工智能国际治理研究院院长薛澜还引用相关研究指出,在联合国制定的可持续发展目标中,AI 会对 134 个(79%)具体目标产生促进作用,对 59 个(35%)会产生阻碍作用。
人工智能领域的大佬们,图/ WAIC
图灵奖得主、中国科学院院士、美国国家科学院外籍院士姚期智更进一步表示,AI 风险主要来自三方面:
一是网络风险的延伸和扩大,随着 AI 能力出现,数据和网络安全的困难放大了 100 倍;二是没有意识到的社会风险,AI 的强大和使用方式,存在在短期内颠覆现有社会结构的可能性,比如 AI 带来的大规模失业;三是所谓生存或存在的风险。
「AI 可以说有些是无法解释,在数学上无法掌握,对我们来说是一个挑战。」姚期智强调,行业需要将 AI 控制好,又不希望破坏 AI 的发展,但这样的权衡是非常困难的。
「出现对这些风险的担忧,根本原因是我们目前的 AI 发展是失衡的。」上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授周伯文则提出了「AI-45° 平衡律」的技术主张,认为 AI 的发展应在性能和安全之间保持平衡,避免长期失衡。他强调短期内可以有波动,但长期应保持在 45 度平衡线上。
不过,图灵奖得主、中国工程院外籍院士、美国工程院院士罗杰·瑞迪也提醒我们,新技术会产生新的机会,也会带来问题,但不应只想着负面影响就不继续了,未来世界上每个人的生产效率将上涨 10 倍,GDP 也将从 100 万亿生长到 1000 万亿。
毫无疑问,AI 和机器人可谓是本届 WAIC 2024 大会最受关注的两个方面,也引发最多的关注和讨论。
大会上,国家地方共建人形机器人创新中心就发布了全球首个开源的全尺寸通用人形机器人——青龙。作为人形机器人,「青龙」身高 185cm、体重 82kg、全身多达 43 个主动自由度,手指支持触感,可轻拿轻放杯子,也能在抓起时保证面包外形的完整性。
不只是「青龙」,这届 WAIC 2024 还重点打造人形机器人专区,展出人形机器人 25 款,包括特斯拉人形机器人「擎天柱(Optimus)二代」以及首款搭载开源鸿蒙的全尺寸人形机器人——乐聚「夸父(Kvavo)」。
夸父,图/乐聚
「夸父」搭载了 OpenHarmony 系统,同时支持盘古大模型,不仅能够实现全方位视觉感知,还具备跳跃能力,能够多地形行走。根据介绍,这款机器人目前已经开始量产,价格预计在 60-80 万元人民币。
擎天柱二代,图/特斯拉
至于特斯拉的「擎天柱二代」,性能相比前代显著提升,还增强了行走速度、自由度、平衡以及控制能力,已经可以执行基本的工厂任务。
与此同时,人工智能与人之间的关系,也再次成为焦点。
中国移动董事长杨杰在大会上表示:「AI 到底是人类的助手还是对手、是机遇还是威胁,已经成为全社会共同的话题。我个人认为,AI 不会取代人类智能,但是会重构很多行业和领域,擅长使用 AI 的人将会替代不会使用 AI 的人。」
百度创始人、董事长兼 CEO 李彦宏也提出了类似的看法:
很多人担心 AI 会抢走人类的工作机会,这是不无道理的。但 AI 扮演的更多是副驾驶的角色,背后仍需人类把关。AI 只是辅助人类工作,而非替代人类工作。
李彦宏,图/百度
李彦宏还说,已经有一些全新的工作冒出来,比如说提示词工程师,随着智能体大量涌现,这种工作需求也会飙升,而且通常门槛并不高,「你做的一般也能够养家糊口,做得好上限可以年薪百万。」
基础大模型方面,华为盘古、百度文心、阿里通义、腾讯混元等国内知名大模型几乎悉数都参加了这届 WAIC,在新一代大模型中还有商汤科技的「商汤日日新 5.5」以及科大讯飞的「讯飞星火大模型 V4.0」。
不过各家大模型厂商似乎都达成了默契,并没有大模型「喧宾夺主 」,而是将更多时间和精力投向大模型的应用落地。
商汤就在大会上发布了基于日日新大模型打造的可控人物视频生成大模型 Vimi,还入选了 WAIC 展览展示最高荣誉「镇馆之宝」。
Vimi,图/商汤
官方宣称,Vimi 可稳定生成长达 1 分钟的单镜头人物类视频,通过一张任意风格的照片就能生成和目标动作一致的人物类视频,并支持已有人物视频、动画、声音、文字等多种元素进行驱动。
另外一个入选 WAIC「镇馆之宝」还有支付宝智能助理,基于蚂蚁集团自研的百灵大模型,目标成为专业智能体生态的平台入口,用户通过对话就能一键连接生活、金融、医疗等垂直行业的 AI 智能体,获得更专业丰富的服务。
而在蚂蚁集团董事长兼 CEO 井贤栋看来,专业智能体就是通用大模型在严谨产业应用关键难题「破解之道」。
井贤栋,图/蚂蚁集团
井贤栋认为,在移动互联网时代,生活、医疗、金融等场景中涌现出了一批优秀的应用,形成互联互通的网络对外提供服务。在大模型时代,智能体是新的应用范式,蚂蚁也在探索智能服务新可能。
同样认为智能体会是新的应用范式还有李彦宏。
李彦宏在大会上表示,过去一年多行业都在「卷模型」,一度出现了百模大战的盛况,造成了巨大的算力浪费,再次呼吁行业不要卷模型了,要去卷应用。而且随着基础模型的日益强大,开发应用也越来越简单了,最简单的就是智能体:
这也是百度最看好的 AI 应用发展方向。
他判断,未来将有数以百万量级的智能体出现,会有各自垂直的场景、特有的经验、规则和数据等,覆盖医疗、金融、教育、制造、交通、农业等领域,形成一个庞大的智能体生态。
而从应用厂商的角度,大模型也在赋予各种应用更大的想象空间。
金山办公 CEO 章庆元在大会上就表示,大模型的加持在进一步推动办公智能化,金山办公在积极接入 MiniMax、智谱 AI、文心一言、商汤日日新、通义千问等主流头部大模型,将其与 WPS Office、WPS 365 融合。
过去一年多,大模型技术持续升温,各种应用层出不穷,具身智能持续火热,这些展示无一不在证明 AI 正以前所未有的速度改变着我们的世界。
然而,最令我印象深刻的并不仅仅是这些技术突破本身,而是与会者们对 AI 治理和未来发展的深思熟虑。技术带来的不仅是便利和效率的提升,还有可能引发的社会变革和挑战。
在大会的讨论中,关于 AI 伦理、安全和治理的深入探讨让我意识到,我们在追求技术创新的同时,更需要谨慎思考如何让这些技术真正造福全人类。
未来的 AI 之路充满机遇与挑战,WAIC 2024 让我们看到,全球顶尖的科学家和企业家们正在共同努力,为这一复杂而美好的未来绘制蓝图。大会上的每一个分享和展示,都在昭示着一个更智能、更具包容性和可持续发展的世界正向我们走来。
本文来自微信公众号“雷科技”(ID:leitech),作者:雷科技AI硬件组
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。
项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0