ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI医疗来「敲门」,是江湖郎中还是华佗再世?
8006点击    2024-08-07 11:45

AI医疗,「钱」路漫漫。


看得好病(质量)、看得起病(成本)和看得上病(效率),这三个关键要素一直以来被认为是医疗领域的「不可能三角」。 


在大模型的浪潮下,AI能打破这个「医疗不可能三角」吗? 


乐观者不在少数。曾参与医疗大模型Med-PaLM 2训练的谷歌高管Greg Corrado在接受媒体采访时表示,“在医疗领域AI可以带来好处的环节,它能创造10倍的价值”。 


然而一旦视角切换到患者或是医疗工作者,态度立马会变得谨慎起来。 


去年5月份,世卫组织在一篇声明中强调,应该AI与医疗服务的整合采取“非常谨慎”的态度。Greg Corrado同样在谈及到家人时话锋一转,“我并不觉得这种技术现在已经达到了我愿意让家人使用的程度”。 


将视野拉回到国内。 


AI医疗尚未在企业的财报中兑现,技术落地的动作却丝毫不慢。从去年2月开始,互联网巨头相继与医院、医疗企业达成合作,推出医疗大模型,落地样板工程,忙得不亦乐乎。 


值得一提的是,AI医疗并非新物种,上一轮以计算机视觉为核心的AI浪潮兴起后,AI诊断的故事就不停在市场上空飘荡。但多年下来,普通人所能感受到的改变并不强烈。 


于是问题随之而来,以生成式AI为核心的AI医疗会重蹈覆辙吗?参与者又是如何推动它向更务实的地方发展的?而我们,距离更优质的AI医疗还有多远?


1、AI医疗的「本手」与「妙手」


AI医疗,一开始就被寄予重望。去年6月大多数企业还在大炼模型时,北京市科委、中关村管委会发布了首批10个人工智能行业大模型应用案例,将AI引导向产业落地。其中,医疗健康是唯一入选了两个案例的领域。 


根据IDC数据,预计到2025年,全球AI应用市场总值将达1270亿美元,其中医疗行业将占总规模的五分之一。 


那么,价值千亿人民币的AI医疗,能做什么? 


目前,AI医疗主要有医学影像、药物研发、医疗文本处理、学术科研四个大方向。


其中,药物研发和学术科研两个方向目前受限于数据量较少,因此进展相对缓慢。 医疗文本处理和医学影像涌现出大量案例。 


其中,医疗文本处理是目前AI应用落地最密集的方向。凭借极强的信息检索和文本生成能力,AI可以大幅度减少医生的重复性工作。 


据百度大健康事业群策略研发总经理黄海峰给出的例子,原先需要医生写一份出院病例大概需要一个半小时甚至两个小时,在AI的辅助下,时长可以压缩到二十分钟以内。 



而医学影像,则是商业化潜力最强的方向。


潜力主要来源于两方面,一是将AI与CT、X光机相结合。从过去的经验来看,在购买医疗器械设备方面,医院向来不会手软。 


二是促成网上问诊到实际成交的转化,譬如用户拍照识别皮肤病后,进一步付费向医生寻求建议。根据京东披露的数据,京东健康皮肤医院基于大模型的AI辅诊准确率超过95%,专病随访服务患者付费转化率已达20%。 


沿着文本处理和医疗影像两大方向,AI企业大多已经形成了「大而全」的AI医疗布局,目前正在紧锣密鼓将其结合到实际的医疗场景中去。在这场角逐中,大厂们有必须要做好的「本手」,也有出奇制胜的「妙手」。


所谓「本手」,关键在稳扎稳打,为未来积蓄潜能。 


所有企业想在AI医疗领域有所作为都离不开两点,数据和工具。数据是AI进化的基础,丰富的AI工具使其尽可能多地参与到产业链中去。 


百度、京东、腾讯、华为等科技企业,均在过去的一年多时间里与多家医疗机构建立起了紧密的合作关系,并推动多款AI医疗产品。 


譬如,早在去年2月文心一言推出之前,百度就曾宣布与莫廷医疗、东软医疗等多家医疗相关企业建立合作。现已形成面向医疗场景下的各个群体的五大产品,分别是面向普通用户的AI健康助手,面向医患双端的在线医疗Copilot,面向医院的「AI智慧门诊」,大模型的私有化产品CDSS(临床决策支持系统),以及面向企业的灵医开放平台产品。 


其中,CDSS因为能有效提高基层医生的诊疗能力,降低误诊与漏诊,已落地4000余家基层医疗机构。 



「本手」之外,更值得关注的是大厂们的「妙手」。这些「妙手」源自于企业自身的优势,力求在同质化的竞争中脱颖而出。


例如,京东利用物流系统的优势,将线上问诊做向了线下。 


在AI问诊的基础上,京东近日宣布对京东健康互联网医院患者服务全新升级。线上诊断时如有进一步检查的必要,可通过京东到家快检下单,由护士上门采血、采样并送检,平均3小时出结果。 



而华为则凭借自身软硬件两条腿走路的优势,将AI医疗的生意做向了产业链上游。 


「硅基研究室」发现,在华为与医渡科技、润达医疗、金域医学、万达信息的合作中,除了推出医检行业大模型之外,还包含基于昇腾AI基础软硬件打造医疗大模型一体机,为客户提供开箱即用的AI全栈解决方案。 


整体而言,AI医疗发展至今,行业的目光已经不局限于某一环节技术能力的强弱,而更关注是否形成了具体的落地方案,用户能否从中获得更好的体验。 


不过,相比于产业界的烈火烹油,投资者仍保持着一定的冷思考。 


“我不认为医疗大模型目前是一个风口,大模型只是一种能力,技术的进展想要真正改变一个行业,还是很漫长的,尤其是医疗。”启明创投副总裁孙墨陶此前在接受采访时透露,在对AI祛魅后,投资圈对医疗大模型目前还是显得更加实际,就他而言,在国内能看到一家能有明确商业化路径的公司才能在这个领域真正扣下投资的「板机」。


2、「多模态」或许是超车的契机


正如百度大健康事业群组总裁何明科所说的那样,医疗是少见的「三位分离」的行业:决策者是医生、医院,付费者是保险、医保,使用者是患者。 


复杂的「决策-付费-使用」链条以及医疗行业自带的严肃性,使得医疗大模型的落地相较其他行业受到更严格的审视,因此在过程中逐渐呈现出从轻到重的趋势。


从轻到重,即率先应用在容易落地、用户感知强、不容易导致医疗事故的领域,然后再向更细分的场景挺进。


值得一提的是,从轻到重一方面是基于企业自身的避险逻辑,另一方面也是硬性规定。去年9月,北京市卫健委牵头制定的《北京市互联网诊疗监管实施办法(试行)》明确,禁止AI在没有医生监督的前提下进行诊疗,或是自动生成处方。 



对从业者来说,从轻到重的趋势是一个忧喜参半的消息。一方面入局的技术门槛不高,但鉴于医疗领域的特殊性,它也意味着后起之秀将很难有机会超过那些有钱有「人脉」的大厂。 


具体来说,医疗数据相对敏感,同时未来变更合作方有可能对医院经营产生较大影响,因此在最初选择合作方时,则会更加倾向于信誉和风险控制能力有保障的大厂。 


因此,考虑到与大厂错位竞争,小厂往往借助多模态实现弯道超车。


与单模态相比,多模态涉及的技术面更广,同时多模态是AI医疗的必经之路。就像医生在给出诊断前需要通过多种检查积累信息,AI想要给出准确的判断,同样需要综合多种形式的信息。 


举例来说,多模态AI给出判断的前提,是能从信息中找到异常。相比于生成式AI,最后结论正确与否,更大程度上取决于视觉AI的检测能力。 


也就是说,若是企业能展示出足以「赢在未来」的多模态能力,医院同样有可能基于长期稳定性的考量与其展开合作。 


市场也已经证明了多模态AI的号召力。在2024世界人工智能大会期间,商汤医疗联合瑞金医院、华西医院等多家医院,率先启动了行业内医疗多模态AI赋能智慧医院的创新示范项目。 


公开信息显示,各方将以商汤医疗大语言模型作为智慧医院建设「中枢大脑」,智能调度覆盖医学文本、放射影像、病理图像等多种数据模态的专用模型,辅助医生完成跨科室、跨模态的复杂诊断推理。 



3、AI医疗离我们还有多远?


如果要给科技巨头吹过的牛排个名,AI医疗大概可以排进前三。2012年深度学习浪潮兴起时,深度学习三巨头之一Hinton曾放言:5年内AI可以取代放射科医生。 


但10多年过去了,AI并没有如他的愿,Hinton显然过于乐观了。 


那么,这轮AI医疗浪潮会像从前那样「雷声大、雨点小」吗? 


目前来看,有喜有忧。 


「喜」在于,过去的一些技术难关确实正在被生成式AI慢慢攻破。


一直以来,缺少高质量数据集是摆在AI企业面前的大问题,在医疗场景中尤其突出。 


譬如,常见病有足够多的数据,但罕见病和遗传病很难满足信息量要求,即便采用「大数据+精标注」的传统AI训练范式,由于每个医生撰写报告,使用医疗器械的习惯都不同,同样是一项几乎是不可能完成的任务。 


但生成式AI能够缓解这一问题,例如上海交通大学的一项研究,利用医学语言模型所包含的对医学图像和概念的理解,引导通过自然自然图像训练的视觉模型迁移至病例图像,从而完成病理图像少样本分类任务。 


这类技术已经在产业界得到了应用。商汤近期发布的病理大模型PathOrchestra,就是通过对海量数据的自监督学习,在无需大量精标注的基础上「触类旁通」学会分析各种器官病理图像。 



而「忧」在于,这些企业走向商业化的过程中,还有难关要闯,其中最主要的是资金问题。


从企业的立场思考,虽然当前AI医疗领域的竞争已经从技术走向了落地,但推动力更多来源于各地打造样板工程的诉求,而非由利益驱动的扩张。 


在缺少成熟方案整合商的情况下,这一趋势对牵头企业提出了很高的要求,不仅需要有非常强的垫资和管理能力对上下游进行整合,甚至有可能在建成后还需要持续为相关方提供专人服务团队。 


同时,AI医疗的严肃性和专业性决定了,企业不太可能在短时间内通过快速复制来摊薄成本,叠加这类科技企业本就居高不下的研发投入,财务状况不够乐观或规模不够大的企业很有可能会倒在路上。 


虽然资金压力巨大,但这些企业没有别的选择,想要真正满足医生和患者的需求,AI就必须进入到真实的医疗场景中进行迭代。 



如中国科学院香港创新院AI中心执行主任刘宏斌接受采访时所说的那样:“很多大模型研发过程中没有医院的参与,缺乏临床方面的因素,导致一些看上去很炫酷的技术,实际上并不能满足医生的需求。” 


将视角切换到医院,撇开那些样板工程不谈,实际上「钱」也是大问题。


现阶段,大部分医院的算力资源以CPU为主,部署AI所需的GPU很少。因而,想要落地AI医疗,需要同时配备GPU并保证足够的存储和高速网络连接。 


在全球缺芯的当下,这是一笔许多医院都难以承受的成本。按照一个科室一张H20进行估算,平均每个院区需要医院投入百万元级别的成本进行芯片配置。 


从这个角度来说,AI医疗企业如果想要实现新技术的规模落地,就必须做出一个杀手级应用,这样才能让医院为了购置AI心甘情愿地对部署环境进行升级。 


整体来说,医疗大模型目前虽然已经在一些场景开始落地,但尚未抵达真正可以改变人们生活的转折点。毕竟,让人们信任AI看病,本来就是一件很难的事。 


文章来源于“硅基研究室”



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI医疗影像

【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。

项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI