AI、游戏与科学的故事,未完待续。
2024年的诺贝尔化学奖被授予三名科学家,美国华盛顿大学教授大卫·贝克(David Baker)及谷歌Deepmind公司的德米斯·哈萨比斯(Demis Hassabis)与约翰 ·江珀(John Jumper),以表彰他们对破解蛋白质结构之谜的卓越贡献。
蛋白质结构问题一直是诺贝尔化学奖的热门领域,1958年来共有十余次奖项与之相关,既包括重要结构的发现,也包括工具和方法的改进,如晶体电子显微镜和冷冻电镜的发展。计算机和人工智能方法的成功引入,不仅预测了几乎全部人类已知的蛋白质结构,更能创造全新的蛋白质分子,为生物医药打开更多可能。
三名获奖者中,贝克教授是以计算预测蛋白质结构这一工作的领军者,而吸引Deepmind两名AI专家加入的“接力棒”,则是一款叫做Foldit的游戏。
蛋白质是生命的基石,其结构决定了功能。虽然组成蛋白质的氨基酸只有20种,但它们在三维空间中的组合方式却近乎无限。因此,对蛋白质结构的精准描绘困扰了科学家们数十年。传统方法是观测已有的蛋白质,准确但需要借助大型精密仪器,因此又慢又贵。从1971到2006的40年间,全球蛋白质数据银行(Protein Data Bank)也仅收集了4万个结构数据,相比上亿的总数可谓九牛一毛。
《环球科学》2024年10月刊中“AI重塑结构生物学”专题配图
于是科学家们逆转思路,从观测变为预测,并希望借助性能不断进化的计算机,准确找到更多的蛋白质结构。蛋白质通常会折叠到能量最低的状态,而科学家也知道如何去计算它的能量。基于此,贝克教授团队在1998年发布了重要的计算平台罗塞塔(RoseTTA),它能进行蛋白质的预测乃至设计。计算机虽然擅长运算,但缺乏人类的空间想象能力,加上单台设备算力有限,因此进展不算迅速。
贝克团队发现,蛋白质折叠这项工作具有有明确的目标、规则和打分,恰好构成了一项游戏的全部要素。那为什么不用这一点吸引更多人参与进来呢?他们进行了一项大胆尝试——游戏化科学众包。2008年,基于罗塞塔构建的功能游戏Foldit应运而生,允许用户以闯关形式,将氨基酸的“链”折叠成适当的三维形状,再由科学家检验结果。它富有趣味,简洁易懂,很快吸引了全球几十万没有科学背景的普通用户加入。
Foldit通过在线平台将科学问题和普通人连接起来并聚合智慧
很快,人类在模式识别上的优势就显现出来,不仅准确度超过了计算机,也在多个科研难点中发力。比如玩家曾在10天内破解了艾滋病逆转录酶的晶体结构,一个存在了15年的科学难题。2010年,57000名“Foldit players”作为论文作者登上《Nature》,这是“人工的智能”在蛋白质结构预测中的里程碑。新冠疫情爆发后,20万人共同寻找阻止新冠病毒传播的蛋白质结构。这些公民科学家们还为包括癌症、阿尔茨海默病和埃博拉病毒在内的广泛医疗挑战的研究做出了贡献。
Foldit这颗子弹,将在多年后击中Deepmind创始人、游戏人工智能专家哈萨比斯的眉心。
他是一名不折不扣的“超级玩家”,棋类和Foldit点亮了他对游戏和智能的关系的思考:12岁成为国际象棋世界亚军,编写了自己的第一个人工智能下棋程序;15岁和毕业后设计的《主题公园》《黑与白》等作品“都以AI为核心”。在MIT做博后时,他接触到了Foldit,惊讶于人类直觉在游戏中发现新模式的巨大潜力。
成立Deepmind,是他从游戏智能出发、追寻通用智能的重要一步。他在接受采访时说到:“从一开始,我们就将游戏作为证明和开放 AI 算法的试验场。因为游戏非常高效,也很容易有指标来查看 AI 系统如何思考和改进。”同时,“最终目标是使用游戏中训练的智能来引导通用学习系统,并应对现实世界的挑战”。围棋智能AlphaGo和AlphaZero获得巨大成功,后者甚至仅靠自学就在数天内获得人类数千年的知识,开发出全新的策略,击败人类冠军。这证实了深度学习算法在处理复杂问题上的强大能力。
AlphaGo和AlphaZero寻找最优策略并获得胜利
继续挑战更复杂、更综合的游戏,比如《星际争霸》《我的世界》,自然是一种路径。那有没有一个规模和条件都合适的现实问题,能够快速迁移团队在围棋上的成果呢?
游玩Foldit的经历在哈萨比斯脑海中闪现。他在目睹AlphaGo战胜围棋世界冠军李世石的那一刻想到:如果人工智能可以从0知识开始训练,并击败人类顶尖选手;那同样可以像Foldit的玩家那样,不具备生物化学知识却完成科学家的工作。游戏固定的规则和无穷的可能性之间,形成了极大的张力;找到通向胜利的路径和解法,就是智能的体现。
于是,蛋白质折叠问题,成为Deepmind团队从游戏智能迈向解决现实问题的关键一步。他们着手设计AI蛋白质折叠算法AlphaFold,基于蛋白质银行中已有的14万条结构数据,像游戏中找最优解一样分析数据、寻找规律,反复训练提高预测准确性。AlphaFold于2018年在蛋白质结构预测领域的“奥运会”CASP上首次亮相,取得了2.5倍于第二名的好成绩。但这距离准确预测还远远不够。
第三位主角约翰 ·江珀在此时加入Deepmind,牵头设计了新的transformer架构和许多革新。2022年发布的AlphaFold2真正改变了这一领域,大部分预测超过了百分制的90分。随后,Deepmind一举公布了2.18亿个人类已知的蛋白质结构,宣告50年来蛋白质三维结构预测问题的解决。
AlphaFold基于数据库训练和改进预测结果
自此,不仅蛋白质折叠问题得到突破,用AI解决科学问题的方法更逐步深入人心。新版本AlphaFold3在2024年5月上线,引领生物学预测技术进入下一阶段:构建蛋白质与其他分子(如DNA或者RNA)结合的复合体结构。AlphaFold已被来自190个国家的200多万研究人员用于推进关键工作,包括了解抗生素耐药性和开发可分解塑料的酶等重要应用。META也跟进发布了ESMFold的研究成果:由机器学习创建的6.17亿个宏基因组蛋白质结构的数据库,包括土壤、海洋和人体中的微生物。
Foldit仍在不断迭代,逐步成为了科研人员和普通公众互动的社区。游戏不仅持续将前沿问题转化为游戏关卡,收集玩家的高分解答并吸收到成果中,也鼓励用户间对解题策略的讨论。游戏功能同样与时俱进,2019年时加入了蛋白质设计模块,后续更引入了AlphaFold帮忙给玩家的作业打分。
更多科研项目采用了类似的众包机制,科学家们甚至搭建了专门的公众科学游戏发布平台,如Kaggle和Zooniverse,以供科研人员和机构发布游戏并招募志愿玩家。从生物学、神经科学、天文学、高能物理学到语言学、艺术史学,都已有成千上万的普通玩家的参与。例如,在Eye Wire中,玩家通过简单有趣的操作即可映射神经视网膜通路;在《星系挑战》(Galaxy Challenge)中,玩家能够给星系形态分类;Metropolitana和 ARTigo则允许玩家为社会语言、艺术作品打标签。
同时,游戏AI也在《星际争霸》《王者荣耀》等复杂游戏中获得更全面的能力后,助力解决机器人训练,能源和交通调度等现实问题;更有望让AI进一步理解我们所处的真实世界,获得空间智能。微软、Deepmind、Meta、腾讯等科技公司都是参与者。腾讯开悟游戏 AI 研究开放平台依托腾讯在算法、算力、实验场景方面的核心优势,为学术研究人员和算法开发者开放研究与应用探索的资源及工具。
国内的游戏人工智能人才培养,在产学研各界合力下加速前行。2024年,川渝政府联合腾讯,共同发起川渝大学生人工智能大赛暨腾讯开悟人工智能全球公开赛,吸引国内及17个海外国家超过5200名学生参赛,并协同燧原、Intel、Vivo、成都智慧交通集团,联合开发芯片算子开发、交通应用场景、算法与工程等产业赛道。2023世界人工智能大会期间,厦门大学联合中国传媒大学、北京理工大学、上海交通大学等多所高校,筹备成立“游戏人工智能高校联合研究中心”,持续深化游戏人工智能的研究。
未来的科研新星和下一个Deepmind,会不会从这些创新青年中诞生?
尽管今年的诺贝尔物理与化学奖被调侃为“理科综合”“图灵奖”,但这恰恰反映出学科间的交叉融合越来越广泛深刻。一方面,物理、化学等基础学科受到人工智能等新的研究方法影响,发展出全新的、数据驱动的研究范式。另一方面,人工智能本身也是计算机和数学、神经科学等领域交叉的产物,神经网络、贝叶斯都极大推动了人工智能的演进。
袁越等学者指出,科学研究和创新正从因果关系走向“复杂系统”。例如,获得医学或生理学奖的microRNA背后所代表的基因调控就是一个庞杂到无以复加的复杂系统,难以用简单的因果链条加以解释。神经网络也是复杂系统的计算机模拟,呈现出“黑箱”状态。
在大融合、大系统的背景下,AI for Science已带来科学界的新潮流,此次诺贝尔奖的“风向”指引性也很明显。2024年5月,英国皇家学会发布了《人工智能时代的科学:人工智能如何改变科学研究的性质和方法》报告。科学家们正扮演着导师、同伴或助手的角色,利用人工智能以史无前例的速度和规模执行任务;AI则帮助识别大型数据集中的新模式和关系,预测新内容。除了AlphaFold等标志性案例外,AI应用可见于所有STEM领域,包括医学、材料科学、机器人技术、农业、遗传学和计算机科学等。过去十年,与科学相关的人工智能专利申请激增,中国、美国、日本和韩国提交的专利数量占据主导地位,其中中国贡献了约62%的专利。
英国皇家学会2024年《人工智能时代的科学》报告插图
正如哈萨比斯在获奖后表示,“AlphaFold应该被视为人工智能加速科学发现和造福社会潜力的证据”。《知识分子》总结,应用人工智能方法分析数据、构建复杂生物现象的强大模型用例包括:用AI识别新的抗生素、揭示希格斯玻色子,建模和分析星系形成,筛选粒子对撞机或机器人望远镜产生的大量数据、寻找其中的规律,识别具有电池或太阳能电池所需特性的材料等等。
Game for science 同样值得期待。科学研究过程呈现出复杂性和不确定性。不同领域间的相互启发有如“蝴蝶效应”,而游戏正扮演那只扇动翅膀的蝴蝶。游戏是科技的产物,同时推动科技发展。如果没有3D游戏,或许先进GPU开启的人工智能时代不会这么快到来。游戏更与智能有着非常紧密的连接,也是科技人才的摇篮,马斯克、乔布斯、林纳斯,许多领军人物都受游戏启发而走进编程世界,探索创新边界。
AI、游戏与科学的故事,未完待续。
参考文献来源:
2024化学诺奖接力青睐AI,蛋白质结构预测新工具获一半奖项, 郭贝一、郭晓强https://mp.weixin.qq.com/s/4ISr4rJRw_60O63ipvGWPQ
AlphaFold开发者获2024诺贝尔化学奖,AI抢夺科学家的最重要荣誉,知识分子
https://mp.weixin.qq.com/s/BqO1-UN3hQ4Bagcp206_uw
今年的诺贝尔化学奖,意味着我们从此不需要科学家了?
https://mp.weixin.qq.com/s/ny4kbYctjBW7dzIKBAMu2g
DeepMind 创始人 Demis Hassabis:AI 的强大,超乎我们的想象,经纬创投
https://mp.weixin.qq.com/s/SaNX-zE7NG9jlHuPifv6Zw
腾讯游戏年度发布会上提到的这款游戏,你听过吗?, 腾讯互娱社会价值探索
https://mp.weixin.qq.com/s/OXiZTnVDxu23iezObLTWxw
玩游戏玩出来的Nature?,果壳-未来光锥
https://mp.weixin.qq.com/s/q8_oxouEUrTM2ijrqjTuzg
The challenge of designing scientific discovery games
https://grail.cs.washington.edu/projects/protein-game/foldit-fdg10.pdf
Demis Hassabis:from video game designer to Nobel Prize winner
https://www.theguardian.com/science/2024/oct/09/demis-hassabis-from-video-game-designer-to-nobel-prize-winner-google-deepmind-ai-
AlphaFold 2: Why It Works and Its Implications for Understanding the Relationships of Protein Sequence, Structure, and Function
https://pubs.acs.org/doi/10.1021/acs.jcim.1c01114?__cf_chl_tk=IzRdl._BLUB6TWJy7OjISGlkHoME4f_PgabMM3z2Ya0-1728619960-1.0.1.1-CRrp5_YPKHQtjlQo6ffFZwmGx8PpCyrFenJw2rM9go4
Science in the age of AI: How artificial intelligence is changing the nature and method of scientific research
https://royalsociety.org/-/media/policy/projects/science-in-the-age-of-ai/science-in-the-age-of-ai-report.pdf
胡璇腾讯研究院高级研究员
黄诗宜腾讯游戏商业分析经理
宋巧玲腾讯游戏社会价值探索中心项目经理
文章来自于“腾讯研究院”,作者“胡璇 黄诗宜等”。