Hippocratic AI 的使命是打造首个以安全性为核心的医疗领域大语言模型(LLM)。
Hippocratic AI 提供的人工智能代理能够通过电话与患者进行交流,并处理患者的需求。公司致力于通过人工智能减少或消除行政事务,从而降低医护人员的负担。希望通过增强人类医护人员的能力,缓解医疗工作者短缺的问题。
根据联合国的数据,全球65岁及以上人口预计将从2020年的7.27亿增长到2030年的10亿,占全球总人口的比例将从9.3%提高到12%。这种人口结构的变化显著增加了医疗需求,进一步加剧了医疗行业人力资源的短缺问题。据预测,到2025年,美国注册护士可能短缺多达45万人,而中国则预计在2025年有100万名全科医生空缺。
然而,人工智能可以通过支持行政任务来改变这种局面,使医生和护士能够将更多的精力用于患者护理,而非文书工作,从而缓解人力资源短缺的影响并改善患者的治疗效果。
为应对这些挑战,Hippocratic AI 致力于打造首个以安全性为核心的医疗领域大语言模型(LLM)。Hippocratic AI 以“希波克拉底誓言”命名,彰显了对西方医学伦理基石的深深敬意,同时也表达了对人类生命尊严的坚定维护。这一名字象征着其对医学道德的承诺,特别是践行“DO NO HARM”(不伤害)这一古老而深刻的医学信条。
该公司提供的 AI 代理能够通过电话与患者沟通并处理其他面向患者的任务。通过减少或消除行政工作负担,Hippocratic AI 希望增强医护人员的能力,帮助解决医疗行业的人力资源短缺问题,同时提升医疗服务的整体效率。
Hippocratic AI 由 Munjal Shah(首席执行官)、Vishal Parikh(首席产品官)、Meenesh Bhimani(首席医疗官)、Subho Mukherjee(首席科学官)、Saad Godil(首席技术官)、Alex Miller(AI运营高级副总裁)和 Kim Parikh(数据与内容高级副总裁)于2023年共同创立。
Munjal Shah 是一位连续创业者,他对技术的兴趣始于大学时期。在加州大学圣地亚哥分校(UCSD)攻读计算机科学专业时,他的毕业论文聚焦于利用神经网络预测3D模型药物中蛋白质-配体结合的有效性。1995年本科毕业后,Shah 进入斯坦福大学攻读硕士学位,专攻计算机科学和机器学习。
毕业后,Shah 曾担任一家软件公司的市场总监两年,随后在1999年创办了他的第一家公司 Andale,帮助中小型商家在 eBay 等市场上进行交易管理。经过大约五年的发展,Andale 于2006年被 Vendio 收购。
接着,Shah 于2004年创立了 Like.com,这是一家利用机器学习和计算机视觉技术的公司,能够分析商品的颜色、形状和图案等细节,帮助用户在不同网站上比较类似商品的价格。Like.com 于2010年被 Google 收购。
在售出 Like.com 的第二天,Shah 因胸痛住院,这次健康危机引发了他对医疗领域的兴趣。2014年,他创立了 Health IQ,这是一家通过为健康生活方式的客户提供更低保险费率来鼓励健康行为的公司。在创立 Health IQ 之前,Shah 曾短暂领导 Google Shopping 的产品管理团队,并在业余时间学习健康相关课程。
尽管 Health IQ 获得了 a16z 等投资机构的支持,但最终在2023年申请破产。然而,a16z 仍然支持 Shah 的下一次创业,并于2023年协助他创立了 Hippocratic AI。这一全新项目融合了他对机器学习的早期热爱以及他近年来在医疗领域的探索与投入。
自创立以来,Hippocratic AI 一直对早期招聘设立了极高的标准。公司审阅了近5000份申请,最终从斯坦福大学、加州大学伯克利分校以及印度理工学院中选拔出优秀的工程人才。此外,公司还聘请了一批临床专家,包括三名全职医生和两名全职护士,以确保技术符合安全标准。Hippocratic AI 的团队和办公室位于位于硅谷的中心,斯坦福大学所在地帕洛阿尔托。
Polaris 是 Hippocratic AI 的核心产品,也是医疗领域首个以安全性为核心的大语言模型(LLM)。它通过电话等音频沟通方式,为患者提供关于饮食建议或药物剂量等非诊断性话题的指导。Polaris 利用总参数超过 1 万亿的多个大语言模型组成的系统,每个模型作为代理协同工作。
Polaris 1.0 通过一个高度优化的对话管理系统运作,专注于通过语音交流处理各种动态因素,包括语音质量、音调、语速、响应长度、打断处理和通信延迟。由于电话仍然是医疗服务的主要沟通方式,该系统旨在自然地完成如预约确认、初步检查或实验室结果传达等任务。
Polaris 的主要代理(primary agents)和辅助代理(support agents)协同工作,解决复杂任务。例如,患者询问某种药物对其健康的影响时,实验室代理和药物代理会与主要代理合作,确保提供准确的答案。Polaris 的模块化系统允许以下多种专业辅助代理进行扩展和支持:
辅助代理在与患者对话中提供第二层安全保障,实时监听并根据患者需求提供帮助。例如,若患者提供的数据存在不一致,辅助代理会中断主要代理的任务并要求重新验证。
Hippocratic AI 创始人 Shah 主张采用“自下而上”的方式进行 AI 监管,即依靠相关领域的专业人士评估安全性。这一原则在构建 Polaris 时得到了体现,Hippocratic AI 在 2024 年雇佣了超过 1000 名美国注册护士和 130 名医生参与产品安全性评估。此外,Hippocratic AI 的多代理 LLM 架构通过允许代理交叉验证关键信息,进一步增强了系统的安全性和准确性。
2024 年 9 月发布的 Polaris 2.0 相较于 1.0 实现了显著提升:
Hippocratic AI 的最终用户主要是传统由护士、社工或营养师服务的患者。然而,其直接客户则包括医院、远程医疗服务提供商、诊所、制药公司以及所有开展电子健康检查的医疗服务机构。此外,面对医疗行业的人力短缺问题,Hippocratic AI 为诊所等医疗服务机构提供了一种可行的解决方案。通过代替护士处理多项预约,该产品能够让护士专注于其他更重要的工作任务。
2023 年,美国远程医疗市场74% 的医生在其诊所中提供了远程医疗服务,显示出远程医疗在医疗行业中的广泛应用。2022 年,美国远程医疗市场规模为 296 亿美元。预计从 2023 年到 2030 年,该市场的复合年增长率(CAGR)将达到 22.9%,到 2030 年市场规模将增至 1501 亿美元。
2022 年,全球人工智能医疗市场估值为 163 亿美元。预计到 2029 年,该市场将以 40.2% 的复合年增长率(CAGR)增长至 1736 亿美元。
根据硅谷科技评论(svtr.ai)创投库,生命科学是17个AI应用赛道里,最受投资机构关注的赛道之一。全球有200余家初创公司获得知名机构的押注。无论从融资次数还是从融资规模来看,生命科学在17个AI应用赛道中排名首位;从单笔交易融资规模来看,生命科学以3255万美元排名第7位。
我们之前分享过医疗大模型(Healthcare LLMs)市场地图,以及AI医疗工具市场研究报告,大家会发现,Hippocratic AI 是市场上为数不多的拥有医疗大模型的初创公司。
GPT-4 是全球最广泛使用的 LLM 工具,支持文本、图像和语音理解,并能够在几秒内响应用户,提供类似实时对话的体验。其训练数据覆盖整个互联网,适用于多领域任务,与 Hippocratic AI 类似,具备一定的医疗对话能力。然而,GPT-4 缺乏专门的医疗领域训练,回答医疗问题时可能不如 Polaris 这样聚焦于医疗知识的模型准确和深刻。截至 2024 年 12 月,OpenAI 已从 Microsoft、Thrive Capital 和 Founders Fund 等投资者处累计筹集 179 亿美元。
Nabla 成立于 2018 年,专注于通过实时生成医生与患者对话的临床笔记来优化工作流程。该 AI 助手能够记录患者的诊断、病史和处方信息,让医生将更多时间用于与患者的直接互动。到 2024 年 11 月,已有超过 4.5 万名医生使用 Nabla。2024 年 1 月,Nabla 完成 2400 万美元的 B 轮融资,累计融资总额达 4300 万美元,估值为 1.8 亿美元。
Nabla 解决了医生记录负担的问题,但产品主要聚焦于临床文档记录,而非直接面向患者的沟通支持。同时,其功能仅针对医生,未能有效减轻护士、营养师等其他医护人员的工作负担,与 Hippocratic AI 更广泛的应用范围相比略显局限。
Diligent Robots 的产品 Moxi 是一款服务于医院流程的机器人,专注于解决医疗物资管理问题。Moxi 可帮助医院工作人员传递药物、实验室样本和其他物资,每年为医院节省大量时间和成本。此外,Moxi 通过友好的肢体语言(如挥手问候)提升患者的情绪体验。截至 2024 年 11 月,Diligent Robots 已累计融资 8030 万美元,其投资者包括 Canaan、True Ventures 和 DNX Ventures。
Moxi 聚焦于线下医院场景,主要在物资管理和任务分配中展现价值。然而,它无法进行语言交互或远程医疗支持,这使得其在患者沟通和智能对话领域难以与 Hippocratic AI 的 LLM 模型相媲美。
Hippocratic AI 的创始人 Shah 在 2023 年表示,公司在确保构建安全且成熟的语言模型后再考虑具体的商业化模式。考虑到Hippocratic AI 的潜在客户群体主要包括医院和医疗机构,这些客户可能通过订阅或许可费用的方式为该服务付费。
此外,Hippocratic AI 的代理还可以为医疗人力市场服务。医疗人力市场(为医院或护理院等机构提供医护专业人员的组织)可利用 Hippocratic AI 的代理来处理低风险、非诊断类的患者服务,降低对人类医护人员的需求。据 Hippocratic AI 透露,其代理服务定价为每小时 9 美元,显著低于 2024 年人类护士平均 45 美元/小时 的薪资。这一价格优势使得 Hippocratic AI 对医疗行业具备较强的吸引力,不仅能够缓解人员短缺问题,还能帮助医疗机构控制成本。
通过这些商业模式,Hippocratic AI 不仅能满足医院和医疗业务的实际需求,还能拓展至更广泛的医疗生态系统,为整个行业带来效率和经济性上的变革。
根据 Hippocratic AI 于 2024 年发布的研究,其 AI 代理在与患者互动的舒适度上得分与人类护士相近。在向患者解释疾病相关知识的环节,AI 代理甚至略高于人类护士。此外,AI 代理在理解患者个人需求方面得分比护士高出 20% 以上。这种优势可能部分归因于模型的训练方法,例如 Polaris 在医疗知识上的专注性训练。通过在医疗从业考试中的测试对比,Polaris 在 114 项考试中击败 GPT-4 的场次达到 105 项,展现了其在医疗领域的显著优势。
2024 年 9 月,Hippocratic AI 与 WellSpan(一个服务于宾夕法尼亚州中部和马里兰州北部的医疗系统)合作,推出了一款用于癌症筛查的会话式医疗 AI 代理。该代理已与超过 100 名西班牙语和英语患者互动,旨在提升患者对“救命”筛查项目的参与度。WellSpan 还使用了 Hippocratic AI 的另一款代理,帮助低风险患者完成结肠镜检查准备工作。WellSpan 的首席护士官 Kasey Paulus 表示:
“通过确保患者安全的 AI 工具,我们进一步巩固了高质量的医疗保障方式。”
2024 年 3 月,Hippocratic AI 与 NVIDIA 合作,共同开发更具共情能力的 AI 代理。测试表明,低延迟的语音交互对于患者与 AI 代理建立情感连接至关重要。NVIDIA 提供技术支持,帮助实现“共情推理”(Empathy Inference),即 Hippocratic AI 提出的解决低延迟问题的方法,以提升 AI 的人性化互动能力。
根据硅谷科技评论(svtr.ai)创投库,Hippocratic AI 在 2024 年 3 月完成 5300 万美元的 A 轮融资,估值达到 5 亿美元。本轮融资由 Premji Invest 和 General Catalyst 共同领投,其他参投方包括 SV Angel 和 Memorial Hermann Health System。此前的种子轮投资方还包括 Andreessen Horowitz、辛辛那提儿童医院、WellSpan Health 和 Universal Health Services。
2024 年 9 月,Hippocratic AI 从 NVIDIA 的风投部门筹集了 1700 万美元,作为 A 轮融资的追加资金,使其截至 2024 年 12 月的总融资金额达到 1.37亿美元。
Polaris 有机会通过长期与患者建立个人化的连接,提升服务质量。由于每次通话可能长达 20 分钟,接近大型上下文处理的极限,要实现这种个性化服务需要研究如何将前几次通话中的知识融入 LLM(大型语言模型)。例如,如果患者尝试改变饮食习惯或戒烟,LLM 代理需要基于患者的既有习惯与历史对话,深入沟通以找到切实可行的解决方案。这要求 LLM 能够从先前的对话中“学习”患者的信息。
强化学习中的人类反馈(RLHF)是一种模型通过人类提供的反馈进行学习的技术。用户与模型交互并根据其表现进行评分,这种评分作为奖励机制,推动模型未来输出的改进。Hippocratic AI 已通过 Polaris 2.0 开始探索这种机制,并在 2024 年 9 月引入了记忆架构,为实现个性化铺平了道路。
针对患者提出的具体问题,例如药物的经济适用性或处方与患者的基因概况兼容性,支持代理常常需要花费大量时间和资源进行查询。通过改进,LLM 可以实时掌握对话状态,并为患者提供具体建议。这样的优化不仅能减少支持代理的工作负担,还能大幅提升服务效率,帮助患者迅速找到所需信息。
截至 2024 年 11 月,Polaris 的代理尚未能全面整合语音信号。(语音信号指的是在语音交互中捕捉到的音频特性,如患者的语音、语调、音高、停顿等,这些细微之处传递了超越语言本身的意义和情感背景)。例如,当人们讲述故事时,简单的回应如“嗯”或“对”能够传达出听者正在认真倾听。这种细微的人类反应是同理心的体现。
Hippocratic AI 计划通过集成语音信号(如音调和声音线索)来增强 LLM 代理的沟通能力,使之能够表现出更高层次的情感智能。这样不仅可以帮助患者更自然、更开放地与代理交流,还能让互动更加真实和贴心。这也是 Hippocratic AI 与 NVIDIA 合作的主要原因之一。
通过这些技术改进,Hippocratic AI 希望打造一个能够提供个性化、自然交互并富有同理心的 AI 系统,为患者提供更加贴心和高效的服务。
尽管 Hippocratic AI 的模型在与其他 LLM 的对比中表现出色,但随着技术的不断进步,LLM 的诊断能力甚至超越医生。Polaris 2.0 基于来自医疗数据的三万亿参数训练,被认为是医疗领域的领先 LLM。然而,Hippocratic AI 必须持续提供准确和有用的结果,以避免被像 OpenAI 这样的竞争对手超越。
2024 年 10 月的一项研究表明,许多医生未意识到 ChatGPT 需要更详细的病例信息输入才能更有效地提供诊断支持,而是将其当作传统搜索引擎来使用。这种情况凸显了 Hippocratic AI 所面临的一大风险:如果医护人员没有经过专门的培训,不会充分利用 AI 工具的诊断潜力,其结果可能低于预期,进而影响患者的治疗效果以及外界对 Hippocratic AI 工具的评价。
此外,医疗对话本质上复杂而严谨。医护人员不仅需要向患者解释清楚信息,还要确保信息的准确性。对于自主 LLM 来说,这是最大的风险所在。LLM 与患者沟通的每一句话都必须确保无误,因为任何不准确或有害的信息都可能对 Hippocratic AI 的声誉造成严重损害。因此,Hippocratic AI 自成立以来始终强调其基础设施的安全性,以确保提供可靠的服务。
作为医疗领域的 AI 系统,必须严格保护患者的隐私。Polaris 将接触到大量的患者数据,这些数据如果被滥用或泄露,将带来严重的后果。特别是,Hippocratic AI 的 LLM 在试图与患者建立情感连接时,可能会了解到患者的一些高度敏感的信息。如果此类信息泄露,不仅会给 Hippocratic AI 带来毁灭性的打击,还会直接危害患者的利益。
医疗信息是最私密且法律保护最严格的数据之一。因此,即便 Hippocratic AI 在安全性上足够重视,这一问题仍然是一个重要的隐患。如何平衡情感连接与数据隐私保护,将是 Hippocratic AI 必须长期关注和解决的核心挑战。
全球医疗行业人力短缺问题严重,远程医疗虽然为护士、社工和营养师提供了远程服务患者的便利,但由于日常工作(如药物和饮食评估)占据了大量时间,专业人员难以专注于高优先级任务。
Hippocratic AI 正在开发首个专注于医疗领域的大型语言模型(LLM),致力于打造能够与患者进行深度对话的人性化医疗代理,以及执行各类任务的支持代理。Hippocratic AI 强调安全性和保障的重要性,并表示其“产品需要比人类完成同类工作更安全”。公司聘请了数千名护士和数百名医生,对产品安全性进行测试和反馈。目前完成第三阶段,Hippocratic AI 在缓解医疗人力短缺的同时,能够显著提升医疗工作者的效率。
文章来自于“硅谷科技评论”,作者“svtrai”。
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。
项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/