图片来源:a16z
Z Highlights
图片来源:a16z
Olivia Webb:你好,欢迎来到Rising Health节目,我们将探讨那些正在构建健康未来的创业者面临的真正挑战和巨大机遇。我是Olivia。今天的节目是从a16z AI podcast转播过来的。主持人Derrick Harris采访了a16z Bio and Health的创始合伙人Vijay Pande,谈论了计算机科学如何兼并生物技术。
Vijay Pande:任何大型变革的第一步是由第一家公司全栈打造技术(ZP注:全栈,覆盖软件开发的全层面)。Google能把他们的搜索引擎软件卖给IBM赚钱吗?可能不会。他们不得不建立这个全栈软件。Google甚至建造了自己的数据中心,自己的服务器。从某种意义上讲,他们真的做到了全栈。我认为在医疗保健领域,我们也将看到类似的情况。早期的AI公司实际上也将是提供医疗护理服务的公司。因为如果你是一家全栈公司,你就能发觉AI的好处。你不必花时间说服其他人。
Derrick Harris:欢迎再次收听a16z AI播客。我是Derrick Harris。这周的节目稍微偏离了主题,至少在内容上是这样。但是,我们仍在谈论AI。但我们不是要深入研究基础模型的前沿研究,也不是要与那些正在构建基于LLM的产品的创始人面对面交谈,我们要讨论的是AI在生物技术和整个医疗保健领域的应用。
为了更好地引入这个话题,我很高兴邀请到a16z的合伙人Vijay Pande。我们将从讨论2000年Vijay发起的Folding at Home项目开始,沿着分布式计算和大规模计算能力这条线追溯到今天。Vijay将解释生物技术、医学和计算机科学在过去几十年里是如何共同发展的,并向我们展示如何真正利用AI提高全球每个人的生活质量,完成一些开创性的成就。我认为这是一次非常有远见的讨论,而我认为你也会这样认为。
所以,在我们开始今天的对话之前,让我们回到几十年前,确切地说是24年前。试想,如果是你正要发起 Folding at Home项目时,你能否向大众推销该项目,又该怎么推销呢?
AI在生物科学领域的快速普及
Vijay Pande: 好,让我来先讲个故事。24年前是很久以前的事了。当时的计算机,特别是像GPU这样的,在处理数据的速度上每年大约翻一番。所以说,每十年就相当于计算机性能增加了一千倍。24年就像,就相当于计算机的算力提升了几百万倍,令人难以置信。过去和现在之间的区别,以及我们当时的目标是——我有一个核心论点,我们可以在计算和生物学的交集处做很多事情。在计算机算力上,我们基本上是个劣势。只有惊人的算法才能做到我们想做的。而计算机是一个关键的元素。问题是如何首先获得这种算力。
假设我口袋里恰好有100亿美元,我可以拿出来买一大堆电脑。但这对我来说不是好的选择。我们所做的是构建软件,让全世界的人们可以在计算机上使用。我们已经实现了几个里程碑,比如第一次达到P字节级别的超级计算机,实际上这也是一项吉尼斯世界纪录,是超级计算机发展上的一个里程碑。事实上,我们能够以一种非常不寻常的方式建造一种类似的超级计算机,它在某种意义上能够让我们在时间上向前推进,让我们能够做到10年前的事情。20年前,那些现在司空见惯的事情,当时却是不可能的。
Derrick Harris:好的,你提到了你资金不足的问题,而且当时,搭建一台超级计算机一定需要很多资金。
Vijay Pande:不完全是资金的问题,超级计算机没有现成的。基本上,你需要自己搭建一台新的计算机。
Derrick Harris:那么在没有超级计算机的情况下,你是如何积累这些资源的。
Vijay Pande:那时对我影响最大的之一是Napster。我在1999年开始建立Folding at Home,并思考如何更好地开发。那时Napster正如火如荼。我想,在1999年互联网还是新鲜事物。开发者共同探索的是,通过计算机之间的通信网络,我们能做些什么?Napster很有趣,因为它表明,只要足够有兴趣和动力,人们可以聚在一起共同做事。你知道,开发单独一个、两个计算机并不那么有趣。一旦被吸引的人开始成千上万,我们就达成了我们的目标,全球网络正在变得非常普遍。
从计算机科学的角度来看,Folding at Home基本上就是一个Web服务器和一个Web浏览器。我们开发了一个专门用于科学目的的Web浏览器,用来与斯坦福大学的计算机交流信息。而斯坦福的计算机实质上就是Web服务器。这就是互联网应该实现的事情。因此,就像把螺丝钉和螺母搭配在一起,这是简单明了的。
真正的挑战是,我希望有一台快一百万倍的计算机,因为我们要解决的问题需要花费一百万天,一百万年才能解决。但不幸的是,我恰好有一百万台电脑可以解决这些问题,当然两种情况并不是完全相同的。
Derrick Harris:当时Napster有多创新?我觉得人们可能熟悉像是SETI at Home这样的项目,还有其他一些类似的项目。Folding at Home是这种大规模网格或分布式计算项目中最早的项目之一,对吗?
Vijay Pande:是的。但是Sanity Home比我们还早大约一年,还有一些其他的公司,现在这些项目可能只为计算机历史学家所熟知。但我们是其中最知名的之一。我们做到的一项独特之处,这在很大程度上是有意的,是我们试图推动技术界限。因此,我们是最早在GPU上进行编程的人之一。甚至在CUDA出现之前,不存在GPU编程语言。
所以,我们一直在不断拓展技术边界,互联网只是其中一个方面,事实上,我们利用一切可以利用的东西,尽量快地推进未来的到来。甚至像在PlayStation 3上默认提供服务,来吸引大量用户。因此,我认为这些是让Folding Home脱颖而出的关键因素。这也是为什么它在20多年后的今天仍然发展得很好。
Derrick Harris:而且对于计算机不熟悉的人要明确一点,比如当你说你有一百万台计算机,只意味着一百万台单独的计算机,它们没有形成网络。所以软件方面有多难呢?我认为部分难处是要实际运行跨所有这些机器和算法的折叠应用程序。但另一部分难处就是针对一百万台机器管理延迟和容量等等。
Vijay Pande:是的,从算法角度,这是一个噩梦。而对于普通人,我通常使用的类比是,一个女人怀孕生下一个孩子需要九个月,但是你不能把九个女人聚在一起,然后在一个月内完成一项任务,或者说聚集9000名女性并在几分钟内完成一项任务。这是不可能的,有些事情通常必须循序渐进地完成。所以,拥有一百万台电脑等于有了一百万个“宝宝”,而不是更快地诞生一个“宝宝”。但是我想要更快地诞生一个“宝宝”,我不想等待成千上万年才能完成这些计算。
因此,我们不得不想出之前不存在的新算法,可以在这种不寻常的架构上运行。这是关键突破,就在幕后,我们开发了一种全新的技术进行计算。讽刺的是,在过程中,我认为我们重新定义了人们对用于药物设计的分子动力学计算的看法。现在,即使我有一台速度快一百万倍的计算机,我可能还会使用我们想出的算法。为什么要这样做呢?似乎一个优化系统总是更可取。但现在的情况并非如此。我们提出的算法基本上是一个统计算法。典型的分子动力学计算就像你制作电影一样运行,而且电影本身并不具有很高的统计学意义。相反,我们建立了一个统计模型,一个用于动态的机器学习模型。我们把这个问题看作是一个在机器学习中的抽样问题。这就是从仅凭经验来观看电影到将其视为一个统计问题的转变。
首先,这需要协作来构建,因为我考虑到生物学,但主要是计算机科学。这是需要完全理解两者还是在不同领域间工作来构建?就我个人而言,我在几个专业学习过。我在斯坦福的专业是化学,但我同时也在计算机科学、结构生物学和物理学方面进行研究。我的个人兴趣和背景融合了所有这些事情。我从10岁开始就是一名程序员,15岁就成为了一名专业程序员,而且我的所有教育背景都是在理论生物物理学领域。所有这些就像自然而然地结合在一起。但我们的目标不仅仅是模拟事物,而是真正推动药物设计的边界。
我们还需要学习是药物是如何设计,以及这个过程是如何运作的。关于我的斯坦福团队,真正让我感到快乐的一件事情是我们拥有的,我们同事来自10个不同的专业。这是一种意见多元化的现象,我们的讨论非常有趣,因为人们从各个不同方向提出了各种想法。现在我们要冒险试着创新,随时随地填写任何空白的领域。
Derrick Harris:但因为几年前我第一次看到AlphaFold时,我的脑海立刻跳到了Folding at Home。这就是为什么我想通过这种方式进行讨论,并在这里建立AI的联系。当看到像AlphaFold这样的东西出现时,首先我好奇的是,它与Folding at Home所努力实现的目标有何不同?这是多么重要的一个里程碑或基准呢?
Vijay Pande:AlphaFold正在研究中,其中包含的“fold”一词表示蛋白质的折叠,但蛋白质折叠有很多方面。事实上,他们正在致力于预测蛋白质最终的结构,而Folding Home则是关于理解蛋白质的行为,以及它是如何达到这种折叠状态的,以及一旦折叠后的行为。所以,AlphaFold对于理解结构很重要。原则上,结构是可以通过实验测量,因此他们可以从中进行验证。我们一直在做的许多事情在实验上很难直接测量,只能间接测量,因此从提供对药物设计有用的东西的角度来看具有真正价值。而且,让我们激动的是尝试研制出不那么随意的抗癌药物,这样它就不会随意打击很多不同的靶点。
这涉及到从这些结构中看不见的蛋白质,所谓的变构口袋。因此,我们正在解决非常不同的问题。所以,结构测定领域确实是我们非常关注的一个领域,它与我们可能想要探索的一些起点相关联。
AlphaFold让人们激动的关键不仅仅是AI部分。至少对我来说,激动的地方在于,工程方法能够在这个领域取得重大突破的速度是非常快的。因为这个领域往往由学术界来探讨,而学术界可能会有一个由大约20人、30人组成的实验室,这些是正在攻读博士学位的研究生。这与拥有一支由专业程序员和工程师组成的团队解决问题的情况非常不同。团队能力的提升,加上技术方面的突破,对于成果的提升至关重要。像谷歌这样的公司真正为这个领域做出了突出贡献,AI和生物学也是他们极感兴趣的领域。
Derrick Harris:现在研究计算生物学需要什么样的技能?似乎主要集中在AI和机器学习,但从一个高层次来看,这些领域已经相当根深蒂固地融入了其他领域中。今天计算生物学的研究是如何进行的呢?
Vijay Pande:一般来说,繁重的工作是由模型和算法来完成的,而不再是由人类来完成的。但是,人需要完成一些更深度的研究,比如现代生物学家必须真正理解统计学。数据方面,统计、机器学习、AI在某种程度上是可以互换的概念,这几乎完全取决于你所处理的数据规模。独特之处在于有许多研究可用的工具,使得生物学家可以在其他人的工作基础上继续研究。我最喜欢的一个例子是人类基因组计划。在生物学之外的人可能没有意识到,在人类基因组计划之前,人们必须对单个基因进行测序,这可能就像研究生博士论文那样,可能需要四年的工作。但是人类基因组计划将这四年的工作转化为数据库查询,你可以在毫秒内查找到结果。这样不仅能省下四年的时间,而且你可以完成以前无法做到的大规模数据分析。
Derrick Harris:这对现在的形势有什么影响?比方说,如果我今天想要创办一家生物科技公司,你必须具有计算机科学背景,否则你可能只是重新发明轮子,还有很多工作需要完成。
Vijay Pande:像1999年之前,科技公司并不一定是互联网公司,互联网公司是后来才出现的,比如亚马逊是一家互联网公司,但苹果公司就不是。这正是AI和生物技术交融所经历的阶段,许多公司之前根本没有使用AI,人们对其是否有用存在很多怀疑。先驱者正是互联网公司、AI和生物技术公司。现在,几乎每一家公司都在其产品中加入了一些机器学习或AI的组件。从某种意义上讲,就像每家科技公司都是一个互联网公司一样,尽管事实上并不准确,在这个领域AI成功的真正标志是每家公司都在某种程度上使用机器学习或AI。他们甚至不再把自己看作是AI公司,他们只是在生产药物。软件正在改变世界,这些东西将被嵌入其中,成为商业运作的一部分。
AI与生物学科研、临床经验、护理服务结合
现在在AI和生物技术交汇的领域,最令人兴奋的成就可能发生在生命科学与健康护理领域。
在生物技术领域,药物是如何制备的大致有三个方面。首先,我们必须了解生物学,这样我们才知道靶点是什么,我们试图做什么。然后,我们必须找到一个能够攻击这个靶点的药物。最后我们必须将其投入临床试验并进行测试。理解生物学部分是非常困难的。我们对小鼠的生物学了解得非常透彻,因为我们可以在小鼠身上进行实验,对吧?而且,在人类身上进行这些实验是不道德的。因此,我们不得不使用老鼠作为人类的替代品,或者使用非人类灵长类动物作为人类的替代品。从统计意义上讲,它们并不具有很好的预测模型。所以AI并非完美,但从人类数据得到的AI在许多方面比这些简单、更简单的动物模型更具预测性,特别是因为你实际上可以根据需要输入动物数据。
首要任务是理解生物学,解开生物学的谜团,确保我们确实命中了靶点。粗略地说,现在大约有85%的药物在二期临床试验中失败。这意味着,我们对这项工作有着最大的信心,在这个领域,我们进行了所有的测试:我们在体外做了实验、在简单的模型中做了实验、也在非免疫灵长类动物身上做了实验。我们做了这么多工作,但最终失败了。为什么呢?因为我们不了解生物学,准确说我们不了解人类生物学。所以AI对此来说是一个明显的巨大转变者。
在药物研发领域,我们看到很多AI能够用药物来治疗那些目前无法治疗的疾病。这可以是通过小分子药物,也可以是通过抗体,还有各种新的药物制备方法。研发的中间过程非常复杂,但最后一个流程才是最令人兴奋,并且工作量要少得多,就是将AI用于临床试验。一场临床试验可能需要花费1亿,甚至10亿美元,而其中很多都会失败,就像85%的试验在第二阶段失败一样。AI能将失败率从85%降到75%,节省数十亿美元。所以,这是另一个全新的领域。这意味着我们能研制出精准面向靶点的药物,并且能更快地进入市场,更快地进入临床试验,并在临床上更容易成功。在临床实验领域,我们将继续使用AI,来理解人类生物学,以了解这种药物是否对人体有效。
在医疗领域,我认为一个被低估的东西是,从某种程度上说,医疗是一个物流问题,适时在适当的地点获得适当的护理。物流对于AI和计算来说是一个可以解决的巨大问题。因此,医疗护理服务的AI正迅速发展。我们看到了AI护士、AI治疗师以及你想象得到的所有不同专家。我们看到AI开始在护理领域逐渐找到自己的利基。首先,可能不涉及非临床事务,不开处方,不进行手术或类似操作。但我认为随着技术的成熟,我们将越来越多地进入临床领域。医疗保健这样一个复杂领域的挑战之一就是如何在现有系统中修复个别部分。并且将这一点放在工业革命的历史背景下进行研究也是很有趣的。关键之一是,任何像这样的重大变革的第一阶段是由第一家公司全面构建技术。所以,谷歌能把他们的搜索引擎软件卖给IBM并赚钱吗?当然不可能,谷歌甚至构建了自己的数据中心,自己的服务器。从某种意义上说,他们真正实现了全栈。我认为在医疗保健领域,我们将看到类似的情况。早期的AI公司实际上也将成为提供医疗服务的公司。就像你无法将Lyft或Uber的软件出售给出租车司机。因此,向服务提供商销售软件可能会很困难。但如果你是一家全栈公司,你就能看到AI的好处。你不必花时间去说服其他人认同。所以这听起来就像是一种全新的获得医疗保健的方式,就像是,也许我去了一家医院,但它并不像医院一样运作,也许是一家诊所,看起来很相似,因为你仍然在处理一个人,但AI在背后确保这个人所做的事情,医生所做的事情是正确的,确保医生了解你的所有情况。这不仅是技术的转变,也是患者和医生们的文化转变。
AI有望提升医疗服务质量
Derrick Harris:在广泛的AI领域,可以说,围绕LLM和生成式AI的所有讨论,是否也在推动医学领域目前的许多激动人心的创新呢?
Vijay Pande:我认为是的,特别是在大多数AI技术并非所涉及的医学应用方面,生成式AI远超我们的想象。结合AI,我们就能创造新的东西。在医学领域,一些简化的潜在理解事物的空间可以用于分类,比如说,你是患有癌症还是没有患癌症,生成式的东西可以从这个简单的潜在空间生成出各种东西,无论是图片、诗歌或段落等。这是令人兴奋的,看到计算机生成的东西似乎与我们所能做的相似。但从科学的角度来看,分类部分是其中最重要的部分之一。从医学角度来看,我认为LLM将成为一个很好的用户界面。一个重要的转变是软件和医生不一定会很好地结合在一起。医生使用的许多软件用来记录医疗记录、电子医疗记录,但现在通过LLM,患者能直接线上与医生交流病情,完成诊断。这种感觉非常不同,因为用户界面能发送短信或通话,就像与同事或一个人直接通过短信或电话交流一样。这是人们思考方式的重大转变,也可能是支付方式的转变,无论是从软件预算转向人员预算。
Derrick Harris:所以,AI有潜力提升医疗服务,使其更加无缝,并增强人类医疗提供者的作用,而不是取代他们。我很好奇未来AI如何具体运用于医疗服务中。美国的医疗保健是一个相当复杂的支付者、提供者、PBM、制药公司、患者等组成的网络。看到像这样的交织,我经常会想到的第一个问题之一是如何挖掘市场潜力。这是医疗保健的一个关键部分。你认为AI用于医疗服务将在哪里最有用?如果我有很好的医疗保险,我住在一个有好医院的地区,我还会去看医生吗?但如果我住在农村地区,或者我住在一个服务不足的人口密集区,那里可能会有更大的市场吗?
Vijay Pande:首先让我们来谈谈医疗保健领域的主要挑战是什么,我认为前三名分别是成本、质量和普及度。显然,成本部分是无需讨论的。现如今医疗成本在不断飞涨,已经相当高昂。质量部分是,高低各不相同,而且通常医生与每个患者的诊断治疗时间并不如我们所期望的那样充足。普及度是一个巨大的问题,不仅仅是在农村地区,即使你是在城市里,好的医疗资源也是稀少的。
但是AI对上述问题的每一个都能有解决的途径。翻看科技发展的历史,科技发展带来的所做的是将过去只属于上述人的资源带给了每个人。一个例子是音乐。100年前,如果你想听贝多芬的音乐,如果你是国王,你会在家里请贝多芬来演奏,你会能请一些弦乐四重奏或其他的乐团来到你的府邸,这对当时大多数人来说将会非常奢侈。但是现在,我们所有人都能在Spotify听音乐一样,我的Spotify与每个人的Spotify都是一样的,在这方面完全实现了民主化。对于iPhone也是如此。对于大多数科技产品也是如此。技术发展为每个人带来了相同的东西。AI对医学的贡献,使得每个人都能得到最好的医生。这是完全可以用AI做到的事情,因为它是软件,可以被分发和复制。这就是我们希望看到的。我认为我们今天已经开始看到了这方面的早期迹象。
Derrick Harris:你提到了一些让我印象深刻的事情。其中之一是质量,因为你确实提到了很多AI用于各种应用的领域。也许在有些领域,准确度并不重要,比如用AI创作表情包、写故事,诸如此类创作的领域,乐趣才是最重要的,准确度无人考究,但随着AI应用发展到如今的程度,比如应用于医学,这是个严肃认真的领域。AI系统在准确性方面需要有多好才能真正地开始运作呢?我是说,并不是要抨击医生,但即使是医生也不是完美的,也不能保证诊断治疗的完全正确,更何况AI呢?
Vijay Pande:没有人是完美的,所以有好有坏,这就是常态。这有点像自动驾驶,人类也不是完美的驾驶员,但一旦自动驾驶汽车的安全性变得比人类驾驶更可靠,我们就应该进行选择自动驾驶。这对人们来说是思想上的巨大转变。好消息是,AI,特别是广义AI(而不是大型语言模型,大型语言模型很容易产生幻觉)可以非常准确,并且具有非常低的错误率,基本上是远低于人类的错误率。对于某些事情,这并不重要,比如你被绊倒了,也许这并不是什么大不了的事,但有一些主要疾病,如果早期发现,可以更简单地处理,有时仅需非常简单的早期干预。从某种意义上讲,医学的任务是将医疗保健从出现病症后治疗转变为让人一直保持健康。这说起来容易,做起来难。这涉及成本、准确性和人类行为。但如果你考虑一下AI和技术的作用,AI和技术成本低,具有很高的准确性,并且可以改变人类行为。应用于医疗服务的消费者驱动的技术非常擅长改变人们的行为模式。因此,我认为这是我们有史以来实现医学任务最佳的机会。
Derrick Harris:这确实有一定道理。消费者驱动的技术尽可能减少阻力并让人们习惯以某种方式互动的情况下,对新的方式产生惯性,现在将这一点应用到医疗保健中。
Vijay Pande:特别是我觉得大多数人忘记了医疗保健领域在技术方面几乎还没有用AI的加入。这是我认为一直在等待AI参与其中的少数几个领域之一。我通常参考的一个类比是AI技术对华尔街和交易的影响。在如今20年的时间里,从2000年到2020年,这些领域已经发展到,从人们认为一台电脑永远无法承担专业交易员的工作,到现在认为一个人能击败电脑简直荒谬。我认为我们在医疗保健领域的这个过程中,这种变化可能已经进行了大约五年。
Derrick Harris:是的。我总是想到预约医生所涉及的一系列的麻烦。真希望AI能带来转变。
Vijay Pande: 是的。如果我能在一个用户界面上接受诊断和治疗,就像我们现在可以在任何一个社交媒体上聊天交友一样。而且我认为用户界面,不仅仅是一个护士。它将在适当的时候成为一个能将你转介给专科医生的全科医生。它更是一位治疗师。
Derrick Harris:我们如何加速这一进程?因为现在我们在有些方面还是欠缺的,无论是数据,还是具体应用。
Vijay Pande:是的,我们在很多方面还是不足的。我们可以分医疗保健和生命科学两方面来看。
在生命科学方面,似乎最成功的公司是拥有独特数据集的公司。有一点是清晰明了的,生命科学的复杂性在于,不是说我们解开已知事物的难题就大功告成了,解决了一个问题,接踵而来的是更多的问题,我们还有很多东西需要研究。因此,AI对于指导我们继续研究最有价值问题的方向也将起到关键作用。
在医疗保健方面,我们希望确保提供高质量的服务。因此,我们将来会看到一些专家级的AI以及其他类型的技术被应用。打一个比喻,这几乎就像拥有一个以LLM为一部分的医疗团队,其中还有其他AI方面的技术的参与。从患者的角度来看,这将很可能是提供一种易于获取并能够准确回答几乎任何问题的工具。
AI在医疗保健领域的监管
Derrick Harris:数据方面,定性数据之间是否有某种联系?如果我在填写我的病历,上面的信息医生也不会完全参考。但现在似乎可以利用它来训练模型,就像你所说的,数据之间有某种联系可以让AI进行深度学习。
Vijay Pande:是的,我认为人们也必须意识到的一件事情是,我们提供的大多数医疗数据都是暗数据。因此,这不是通过从网络上抓取信息来获取的。因此,能够访问这些数据的公司和组织,才是处于一个能够真正利用这些数据推动技术进步的位置。
问题是,这是否是正确类型的数据等等?因此,根据这一点,提供护理服务的公司会获取此类数据,并且是以一种有意识的方式记录数据,这些数据将被用于训练AI。以至于在某种意义上,任何护理交互都会变得智能化。
Derrick Harris:有趣。而医疗保健似乎是会发生这种情况的领域,收集用户的数据可能真的会发生。这在很多其他领域也有吧?
Vijay Pande:特斯拉是一个明显的类比,就像他们在自动驾驶方面所做的,所有这些开着特斯拉的人都在产生数据。你可以想象他们也在做类似的事情。
Derrick Harris:在我们谈论数据的时候,从监管的角度来看,是否有必须要干预的方面?我知道AI监管是一个整体上的重要话题,但在医疗保健领域监管的重要性更胜一筹。
Vijay Pande:是的,医疗保健已经受到大规模监管。因此,您可能担心AI可能会产生负面影响的任何事情已经是非法的,已经受到监管。希望这样可以缓解人们对此已经存在的担忧。好消息是,许多人,包括我们在内,一直与监管部门合作,试图找出我们可以做什么来进一步加快健全监管。AI和数据相关法规面临的一个重要议题是,AI可以自主学习。我们需要对AI的学习采取多大程度上的干预,是完全从零开始训练还是放任他不管?这仍在探讨中,但我认为监管的最终目标是帮助患者,这有助于患者最大化受益。我们希望以一种快速的方式开发AI技术以挽救生命,同时这是在我们深思熟虑之后的做法。找到这种平衡是政策制定者面临的最大问题。
AI在药物设计的引导作用
Derrick Harris:你之前谈到过药物研发、临床试验之类的话题。未来我们能不能做到这种程度,完全避免药物的副作用,又完全精准击中靶点?
Vijay Pande:要看两个方面。一方面,我认为我们用小分子药物来干预这些无法干预的靶标的能力具有潜力,特别是在开发新型药物时。这些变构的分子对于特定的靶标具有更高的特异性。这是其中一个方面。我认为另一个方面是时代的影响。这场AI革命发生在一个非常有趣的时刻,因为在同一时间,我们基本上正处于一场生物学革命之中,我们从生物工程方法中生成了大量数据,并将新型药物、新型模式组合在一起,就像乐高积木一样,现在我们可以将各种抗体和小分子连接起来,创造出能做新事情的结合物。AI非常适用于理解所有这些数据以及后续的处理。
Derrick Harris:这是其中一个重要的好处,现在我们研发新型药物、发现新型的抗体和小分子组合的模式就只要对AI进行训练就行了。但似乎过去的药物研发,至少可以说是在机器学习之前的日子里,你基本上得知道你在寻找什么靶点,你得把药物路径完全设计出来。现在你可以依靠AI引导着一步一步设计药物路径,这是非常值得探索的。
Vijay Pande:所以我认为过去药物设计中有许多偶然的因素。我们正在尝试大力推动的领域实际上确实看起来像设计。你知道,当我们在这里建造大桥时,我们并不是建造了50座桥梁然后进行测试再选出其中一座作为我们要保留的,相反,我们提前进行了设计。
我们目前还没有达到药物设计的水平,但特别是当涉及到生物制品时,但我们已经接近了。在设计桥梁的意义上来说,这是物理学。从生物学角度来看,药物设计意味着理解蛋白质的潜在空间,理解这种疾病等等。我们已经接近理解这个层面。在某些情况下,我们甚至可以提供早期的概念验证演示。因此,当我们更接近药物设计的层面,也会大幅消除药物研发的偶然性,这是一个好消息。坏消息是,行业也已经研发出很多优秀的药物,它们的合成路径相对简单,所以说,未来药物研发和合成的路径会越来越复杂,药物研发会变得更加困难。
也许这也是一个好处,设想一下,当下初创公司中最有前景的活动是什么。在生命科学领域,我们已经看到了许多结合生物学的AI和结合化学的AI,这些是我提出的前两个领域。我们开始看到临床试验的AI和精准医学的AI,这两者有点相辅相成。我对这两个领域非常兴奋,因为正如我提到的,微小的改进,即5%的改进,可能价值数十亿美元,这足以令人兴奋。在护理服务方面,我投资的一家公司Devoted Health,他们的使命是在正确的时间、正确的地点提供正确的护理。我认为这是对护理服务的最好的定义。这也越来越成为一个数据科学问题。这涉及到了理解疾病的数据科学,了解人群的数据科学,尤其是了解患者的数据科学。这就成为了一个AI问题。我们将会更广泛地看到这一点,随着医疗保健在这个视角下进行审视。
Derrick Harris:如何将当今一些令人兴奋的创业公司与上一代大型A类生物技术或大型医疗创业公司进行比较?我想到了Illumina。这是一家非常优秀的生物科技公司。
Vijay Pande:这是一家很成功的早期公司,非常注重生物工程。而成功的标志是什么?标志就是公司业绩年复一年地进步15%或20%。这听起来相对谨慎,但增长的部分会有长达几十年的积累。这就导致了摩尔定律,导致了测序成本的指数级下降。因此我认为Illumina是工程学和摩尔定律的一个很好的例子,就像生物学中的指数增长。同时,我认为在工程生物学领域出现了一系列新的方法,这些方法也在很大程度上接过了这一门学科的旗帜。
Derrick Harris:这些公司在构建或运营方式上是否存在根本的差异?
Vijay Pande:是的。其中一个重要的区别是,许多公司现在正在像科技公司一样建设。这意味着几件事情。其中之一是,机器学习将会普及,同时这些公司还拥有计算机和药物设计团队,它们会分属不同的部门,但也会合作,将专业知识完全融为一体。并且创始人通常都熟悉这两个领域。所以,他们不会像传统药物设计师那样对计算机一无所知,只是雇佣其他人来构建这样的团队。他们看到了AI的价值。在生物技术领域,有着长期的创新历史,从小型初创公司开始,然后被大型制药公司收购。制药公司有他们自己的创新,但通常来自初创公司,并作为分销商。这就是,我们在AI结合医药的领域所看到的情况,这符合我们数十年来看到的模式。
技术创新的地理分布
Derrick Harris:这在一定程度上涉及到我想问的一个问题,那就是关于地理位置的,似乎计算机科学领域的学术圣地,主要在加利福利亚湾区。而生物医学领域的创新集中地分布在波士顿、圣迭戈和旧金山湾区。地理位置在某种程度上重要吗?
Vijay Pande:是的,这是一个有趣的问题。AI目前在湾区确实很受欢迎,至少目前是这样。我认为这对湾区来说将是一件好事。作为湾区的居民,我对此感到非常高兴。生物技术起源于旧金山湾区。Genentech是一家湾区公司。如果你开车去南旧金山,那里是生物技术的发源地。波士顿的生物学术界显然非常强大。院校之间的距离更近。你知道,与哈佛和麻省理工以及其他附近的大学相比,伯克利和斯坦福之间的地理分隔,甚至是斯坦福和加州大学旧金山分校之间的分隔都是巨大的。麻省理工学院基本上在校园内有制药公司,这真的很独特。而且波士顿到巴塞尔和许多欧洲制药公司所在的首都的直达航班也很方便。但事实是波士顿在计算机领域也很重要,软件开发、硬件开发、DEC、WANG以及其他技术都在波士顿有分布,大型计算设备也在波士顿有分布。
软件击败了硬件。在马克的软件出现之前,比尔·盖茨就对硬件成本与摩尔定律的未来做出了非常有远见的讨论,即硬件成本将会降至零。所以一切将取决于软件。而且从这个角度来思考生物技术真的很有意思。生物技术在多大程度上变成了关于软件开发方面的?而在软件,实际上是指数据和AI方面,我们仍然需要大量的数据,所以生成数据的能力将会存在,因此我们也需要很多硬件。所以讲清楚地理位置的重要性并不是一件容易的事情,但我认为旧金山同时作为AI和生物技术的发源地,是一个非常独特的位置。
Derrick Harris:最后,关于互联网,我们可以通过合作接触开放数据和开放源代码。如果我是一位创始人,如果我毕业于麻省理工学院,那我是不是可以完全不了解软件呢,因为我可以召集到团队,其他人有这方面的知识?
Vijay Pande:完全不是。但是我觉得,建立一个大公司最重要的一点是你需要一个高管团队。你需要首席营销官(CMO)、首席科学官(CSO)、首席医疗官和首席技术官等等。那人才网络在哪里呢?有两个主要来源,波士顿有一个人才网络,湾区也有一个。组建你自己的人才网络很难,特别是在创业初期。
Derrick Harris:所以也许一件事最困难的地方在于最后实现的阶段,对吗?我的意思是,我们已经看到了AI在很多领域的应用,这似乎预示着AI可以和医疗保健结合,但我们能否真的完全实现这一点呢?
Vijay Pande:我认为这是很有可能的。我认为还有一个问题是,我们还没有讨论过的另一种AI版本,即AI作为推动生物技术领域工作的手段。AI科研人员、AI临床实验人员等,我们还没有达到那个程度,这是科幻小说中才有的,但首先会出现的是AI副驾驶员,就像它们是操纵软件的副驾驶员一样。到时候一个人就可以做更多事情,你根本不需要很多人来组建团队才能完成一件事。这样想起来真是有趣,想象一下,有足够的AI支持,你可以拥有一个由10人组成的生物技术团队,而不是100人,而这个由10人组成的团队可以做到以前需要100人才能完成的工作,甚至做得更好。
Derrick Harris:所以从这个层面来看,你认为最大的机遇在哪里?如果你今天要创办一家AI相关的公司,你会怎么做?你认为哪些领域仍然存在着巨大而未被发掘的机遇?
Vijay Pande:是的,我认为在生命科学领域,我对临床试验感到非常兴奋。挑战不仅在于技术方面的挑战,还在于市场推广。在这个过程中,市场营销至少和技术开发一样重要,也需要投入一笔巨大的资金,并且也很可能投入的资金会打水飘。在医疗服务交付方面,我认为未来人类完成的护理工作将与AI结合起来,来处理每一项专业工作,并打造AI专家。我认为我们将会看到这种不同专业领域的寒武纪爆发式的大爆炸增长。
文章来源于“ Z Potentials”,作者“A16z”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/