不少人怀疑,今年的诺奖“偷懒”了。
除了备受关注的诺贝尔生理学或医学奖“MicroRNA”相关研究外,今年诺贝尔化学奖、物理学奖均被AI相关研究拿下:
2024年诺贝尔化学奖授予华盛顿大学的大卫·贝克,以表彰其在蛋白质设计方面的贡献,另一半则共同授予谷歌旗下人工智能公司DeepMind(深度思维)的戴米斯·哈萨比斯和约翰·江珀,针对结合AI(人工智能)模型对蛋白质结构预测领域的研究。
而今年的诺贝尔物理学奖,则被授予约翰·J·霍普菲尔德(John J. Hopfield)和杰弗里·E·辛顿(Geoffrey E. Hinton),以表彰他们“在实现使用人工神经网络进行机器学习”方面的基础性发现和发明。
逢AI必获奖,诺奖看似在躺平式“响应”AI这一时代主题,但并非诺奖评委有意“怠工”,而是恰恰说明AI早已渗透到了最前沿的科研领域,甚至能起到关键革新作用。
正如此次获奖的DeepMind开发的AlphaFold(阿尔法折叠)大模型,早已在医药和美妆使用的蛋白(肽)类成分的开发中起到关键作用。
但AI在美妆科研端的应用,又何止一个AlphaFold。
在过去,AI在美妆行业的应用大多都在台前。
比如欧莱雅集团用BeautyGenius为消费者测肤并进行个性化推荐,采用CREAITECH生产内容;而雅诗兰黛与微软合作AI innovation Lab主要用于增强消费者与旗下品牌的关联;宝洁早已开始用AI进行消费者行为分析,深度辅助市场决策和供应链管理。
值得一提的还有,作为迪奥、资生堂等397家知名品牌的AI测肤SaaS解决方案供应商,美图宜肤将AI应用到基础研究领域,通过AI对43万名参与者皮肤状态进行研究。该研究利用全景式AI测肤系统美图宜肤识别皱纹发展和严重程度的关键拐点,发现了不同年龄层的衰老“拐点”,将深度学习技术应用于衰老检测,建立皮肤维度测量标准,并探索影响皮肤特征的靶点,并参与制定、发布了《⼈体⽪肤分龄抗衰⽼评价标准表》团体标准。
显然,在美妆科研的大幕后,AI早已开始发光发热,尤其是今年获得诺奖的Deepmind,结结实实地“踩”到了美妆科研的腹地。
据《FBeauty未来迹》了解,AlphaFold已预测出约100万个物种的超过2亿种蛋白质结构,几乎涵盖科学界已编录的每一种蛋白质。这意味着,曾因氨基酸排列组合以及折叠方式带来“维数灾难”的蛋白、肽类成分开发,在AI大模型AlphaFold的筛选之下,可以从“大海捞针”变成了“定向预测”。
如果将开发一个肽类成分比作买彩票,AlphaFold大模型类似于将过往所有彩票数字组合(氨基酸组合)和中奖结果(功效)进行统计,并建立一套准确的算法。当科研人员需要某种目标功效(特定中奖结果)时,可以让AlphaFold预测出目标蛋白、肽类分子的结构(新一期的数字组合)。
科研人员不用再一次一次实验测试各种功能蛋白、肽类成分的湿实验模式(买很多彩票),而是先测算出结果(干实验),再通过一次“湿实验”(买一张彩票)验证结果是否达到预期的结果(中奖)。
在抗衰需求推动的肽类成分盛行的当下,AlphaFold将过去难度和成本极高的功能蛋白、肽类成分科研工作,变得成本、时间可控,且准确率更高。
相关资料显示,通过AlphaFold预测的蛋白质结构与科学家之前通过实验揭示的结果几乎一致(约90%)时,《科学》杂志甚至评论,人工智能技术让人类无需实验即可了解蛋白质结构。
据第十四章品牌创始人梅鹤祥介绍,在新药物开发领域,AI的介入可以降低20%的研发成本,提升20%命中率,并缩短20%研发周期。在美妆科研领域,AI大模型的应用可以让环肽一类 “英雄(Hero)成分”的科研至少降低一半开发成本,缩短3-5年的研发周期。
更重要的是,AI技术的介入,正在改变美妆科研的逻辑:过去的科研是通过不断用湿实验试错,从而找到最正确的解决方案。而现在的逻辑已经变先给到想要的结果,让AI预测(干实验),然后用湿实验验证正确性。
可以说,AI作为一种高效的统计学工具,在众多变量组合中高效且准确地找到最好的解决方案,极大降低了科研过程中的试错成本(时间、精力、资源)。
例如过去青蒿素的发现过程中,需要在青蒿提取物里10000多个有效成分不断分离,进行试验的验证,通过10余年的时间,投入大量的人力物力,才找到最终的青蒿素分子,而现在AI技术的应用,可以提升开发效率。
而现在,上海家化在青蒿素成分在美妆成分应用时,采用AI网络药理学技术对从青蒿提取物的153种成分、1080个活性靶点中,找到了64个舒缓相关蛋白,对应88个成分,涉及调控炎症相关的蛋白,加速完成了其在美妆行业应用的科研进程。
事实上,AI大模型的应用,在美妆科研领域的应用模式远不止于肽类成分的开发,梅鹤祥表示,在类似新药开发完整过程的ADMET各不同流程的研究,均已融合相关的人工智能技术。
而相关的AI工具,可以应用到美妆科研的方方面面。
这门通过计算机科技解决生物技术问题的学科,被统称为计算生物学(Computational Biology,指开发和应用数据分析及理论的方法、数学建模、计算机仿真技术等,用于生物学、行为学和社会群体系统的研究的一门学科)。
近年AI领域的技术大爆发和算力暴涨,以及各种大模型的应用,让计算生物学加速走向科研舞台。其中,基因序列比较、基因表达模式的分析到全基因组关联研究等,蛋白开发都是计算生物学的具体应用。
《深度 | 三问诺奖科技miRNA,如何颠覆美妆研发?》中提及miR相关功效成分开发,也会大量运用AI来进行成分结构预测。
与此同时,在近年十分热门的合成生物领域,AI与计算信息学、生物信息学在发酵工程中的跨领域运用,也能大大优化发酵前期的菌种筛选、发酵过程的优化放大和发酵产物与护肤功效之间的精准匹配,有效提升了美妆功效成分的开发效率。
可见,AI已经被应用几乎所有最前沿的到美妆科研领域中。
对AI应用的想象,永远不要过于保守。
在具体实操中,美妆企业对AI的接受程度,远比想象中要高。从成分开发,到配方、香味、肤感设计,直至专业的定制化服务,均有涉猎:
不难看出,从品牌、到代工、原料企业,均在使用AI完成一些含有巨大变量的预测,或者大批量个性化的对比工作。以此替代过去需要大量人工和专业性的工作,提升科研产出效率。
而AI科技的应用也让第三方科研机构,在美妆科研领域拥有更为活跃的表现。
仅在蛋白、肽类成分开发领域,我国就有清华大学人工智能产业研究院孵化的AI 制药企业华深智药、北京分子之心、浙江清华长三角研究院、铮信分子生物技术研发中心等第三方研发机构入局。
《FBeauty未来迹》曾在《计算生物学“神助攻”,肽类原料开发驶入快车道》一文中提及,清华长三角研究院正式发布了ACRDC活性肽智能深度数据库,通过KEPLER 90i®️计算生物学平台建立了靶点数据集和天然活性肽数据集的智能深度分析与关联预测体系。基于力场的计算(蛋白、肽类成分与受体的结合程度),开辟了与AlphaFold不同路径的蛋白、肽类成分开发路径。
据了解,该研究院基于炎症性衰老前沿靶点的HMGB1的靶向环肽cIY-8,是首个日化领域直接靶向炎症性老化的环肽分子。目前,贝泰妮已经与ACRDC展开合作,双方的合作不仅仅局限于原料定制化、开发,还会越来越多地深入到基础研究领域。
在国外,哈佛医学院开发的miniprot以及爱尔兰生物公司基于人工智能搭建的生物活性肽查找器Magnifier NπΦ也投入了使用,借助AI预测的肽可使临床功效验证的成功率提高至80%。解锁了共计超过600万种植物肽的数据,并发现PeptiYouth和PeptiStrong成分。
另一方面,一些国内外也有许多主流的科技公司,均在开发一些人工智能模型,能够直接或间接参与到美妆科研领域。
资本和政策的支持,也在进一步加速AI美妆以及各行业渗透的进程。
相关数据显示,2023年,全球计算生物学领域发生82起投资事件,总融资金额约为 93 亿人民币,其中深势科技、Causaly、腾迈医药、Superluminal Medicines、分子之心和本导基因等企业,均受到了资本市场的青睐。
在国内,多地已经推行鼓励AI与各产业结合的相关政策,例如上海市科委制定了《上海市计算生物学创新发展行动计划(2023—2025年)》,设立了上海市科技创新行动计划“计算生物学”专项 ,并于今年4月组织了首届上海国际计算生物学创新大赛。
大赛得到了中国科学院上海药物研究所原创新药研究全国重点实验室、中国银行上海市分行、华为云计算技术有限公司、临港实验室、上海人工智能研究院、东方美谷企业集团股份有限公司等多家企事业单位的支持。
在产业端,Mordor Intelligence发布的市场研究报告数据显示,全球计算生物学市场正呈现出强劲的增长势头,规模预计将从2023年的68亿美元增长到2028年的127.2亿美元,预测期间的复合年增长率为13.33%。其中,北美地区是最大的市场,美国是行业内领先国家,政府每年用于发展计算生物学的平均支出约为1.4 亿美元。[2]
在这样的大背景之下,美妆产学研链条与AI的产业下沉开启了双向奔赴。
虽然美妆科研领域目力所及皆可AI,但事实是,AI还远未能发挥“十成功力”,就像人工智能辅助驾驶一样,还远没有到人类可以完全“放下方向盘”的阶段。
复旦大学复杂体系多尺度研究院院长马剑鹏就明确表示,蛋白质结构预测技术AlphaFold2虽然很强大,但还远没有达到能够取代实验的水平。
梅鹤祥也表示,AI目前在美妆科研领域处于辅助阶段,还不能真正意义上做到完全替代。
一方面,AI大模型的开发和培养,需要大量稳定性数据的采集,通过足够数量的数据进行“喂食”学习,加上精心设计的算法,才能提升计算结果的精度,好比给一个婴儿看了足够多的水果图片,并告诉他从什么维度进行判断,经过足够长时间的学习,他才能在看到水果时作出准确的判断。
例如在KEPLER 90i®️的建立过程中,清华长三角研究院许多先将多肽进行编码,变成计算机可识别的语言,从“教孩子认字”学起,才能实现后期对1000多种肽的鉴定。
但目前,一些拥有实力的生物医药企业,均拥有自己的数据库和算法,但数据的孤岛效应使得各方的数据和算法兼容性较差。
没有足够多量的精准的数据和结果对应,会降低干实验(AI预测)与湿实验(实际测试)结果的一致性。因此,美妆科研只能在一些确定性较高的领域充分“相信”干实验的结果。
另一个难题在于,AI美妆科研领域应用的准入门槛较高,相应的人才较为匮乏。
由于涉及到大计算机科学和生物学、网络药理学等多个学科的跨界,一家公司完全掌握AI模型的应用需要数年的时间,且还需要大量专业人才的培养。
“用AI的人不太懂生物,懂的人不太会用AI,需要一个学习过程。”梅鹤祥打趣地说道。“算法是一个黑盒,将药学家、生物学家、算法设计人员,在企业内整合到一起并不容易。”
更让美妆企业难以适从的是,AI技术更新迭代太快。
短短6年时间,AlphaFold已经完成3次迭代,并不断增加参数维度,提升计算的复杂度。事实上在计算生物学的研究思路之下,干湿结合的数据闭环也在不断迭代,通过“假设-验证-优化假设”的方式,不断提升研发效率。
技术的加速迭代,对使用者也提出了更高的要求。
从整体上来看,科研端依旧对AI的应用保持积极的态度。马剑鹏表示“人工智能技术是新时代的望远镜,也是显微镜” 。显微在于AI带来更精准、高效的研发模式,而望远镜则指AI在未来大量应用的确定性。
虽然目前AI模型还只是美妆科研的一个辅助工具,但可以预见的是,未来随着更多企业的入局,以及AI自身的加速迭代,会有更多实际成果应用到美妆领域。
而今年一系列AI相关诺奖的出炉,正是对AI未来广阔应用前景的一个积极预言。
注:
[1] 毛开云,江源,袁银池,张华,周丽萍,江洪波 2023年计算生物学科技发展态势
[2] Mordor Intelligence. 计算生物学市场规模和份额分析- 增长趋势和预测(2023-2028)[EB/OL]. [2023-12-25].
文章来自于微信公众号“FBeauty未来迹”,作者“Future Beauty”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda