卷赢大模型训练成本之后,DeepSeek正在重塑全球AI竞争格局。
微信、飞书、百度等上百家企业一个赛一个地宣布接入DeepSeek,表面喧腾之下,实则是更多应用场景的进一步落地。
随着各行各业的领导者全面拥抱AI,整个社会以及我们每个人其实都正在接入AI。
不过,作为AI领域最被看好,且一直不缺讨论度的AI医疗,目前始终存在“缺少领头羊”的局面。
原因不外乎三点:
然而,也是在这样的环境下,杭州的一家科技公司“智诊科技”所推出的产品——好伴AI,上线了一些令人眼前一亮的医疗AI功能和差异化技术,获得了人们的目光。
更重要的是,与DeepSeek登陆App Store人人可用一样,好伴AI现在也以APP的形态,人人可体验。
没病纯保健,可以让好伴AI帮看看——
比如当你拿到了一份最新的体检报告,里面的专业名词让你一看一个不吱声,没关系,上传一下它就能帮你解读。
有症状想先问问——
它能结合真实医生的临床经验、医学手记、科研论文,给三甲医院专家建立了数字分身,不用挤破头挂号就能在家问诊。
由于观察到用户增长速度很快,我们也决定对这个AI进行一次深度测评。
目前这款产品有网页版和APP版,下面我们直接用APP实测。
首页打开是酱紫的,一眼就能看到几个核心功能:
这第一关,我们直接从最常见的检测单/体检报告解读开启。
只需一个上传多图的动作,两张令人懵逼的检测单就秒秒钟被解读出来了。
(考虑到个人对准确性的要求,一开始就打开了深度慢思考)
仔细看,在一步步思考后,好伴AI最终做出了两个主要判断:
而这也都和检测单原版结论完全对上了。
比较贴心的是,回答过程中它还和线下医生一样,不仅明确了复查时间,还会提醒各种注意事项。
看来小小几张检测单是难不倒它了。
那么,让难度再次升级,直接扔给它一份辣么长的体检报告PDF呢?(里面有各种检测单、超声图、心电图等)
点进右上角的「体检报告解读」,可以看到有两种上传方式:
一种是直接传PDF文件,另一种是复制粘贴报告链接。
这里要插一嘴,为了真实考验好伴AI的能力,我们提前将报告里的结论页都删去了。
实测过程中,它先花了大约两分钟解析PDF,然后会要求你回答一些个人健康状况(20道题),再之后你就可以和AI医生交流各项异常指标了。
整体测下来,大约10分钟内就可以获得一份详尽报告。挨个比对其结果和原版结论,竟然也都完全吻合。
对了,眼尖的朋友想必也发现这里还有一个历史报告记录,作用就是收集整理你的历次体检报告。
如此一来,以后想要随时查看自己的健康史也就更方便了。
接下来,我们再来测一下好伴AI的另一大亮点——医学专家分身系统。
一眼望去,光看头衔就知道这群专家线下的“号”很难挂了。
王利权(浙大医学附属二院/妇产科主任医师)、邬玲仟(中南大学湘雅医院/妇产科主任医师)、张炜(复旦大学附属妇产科医院/主任医师)……
等等,先解决一个好奇,这些数字分身从何而来呢?
原来,这些是通过融合真实医生的临床经验、医学手记、科研论文、授课视频等个人独有的资料,利用AI技术打造而来。
像王利权医生的“数字分身”,不仅掌握了他40余篇论文和近400个视频中的专业知识,还能模拟他的诊疗思路和沟通风格,从而为用户提供高度个性化的建议(如孕
期健康管理、唐筛报告解读)。
言归正传,每一个数字分身点进去,其主页都有各自擅长领域的介绍。
添加图片注释,不超过 140 字(可选)
鉴于王医生擅长妊娠并发症等,我们直接咨询一个最近刚上过热搜的案例。
只见“王医生”慢慢思考之后,非常细致地列出了这位高危产妇在手术过程中需要注意的点。
而且深扒其思考过程,也终于解答了当时看热搜引发的好奇:
为啥要让胎儿在胎膜囊未破的情况下出生?(原来是为了保护早产儿)
整体测试下来,这个功能不仅解答确实专业,而且相当利国利民,毕竟这就意味着最顶尖的医疗专家资源,每个人都能无差别共享,还是7x24小时响应那种。
当然,除了找专家处理复杂问题,医疗场景中更日常普遍的还是“全科门诊和咨询”。
但整体实用下来,好伴AI效果不错,或许是由于它背后是730亿参数的全科医学通用大语言模型WiseDiag-Z1,因此我们可以像对话一样,让其帮忙提供症状分析、
用药咨询以及个性化健康指导。
比如身为打工人,一旦觉得身体疲劳了,我们就总是想问:
难道是气血不足了?(笑死,这个问题还经常冲上热搜)
随机找一位全科医学专家,问问他有没有哪些判断小技巧。
结果,他直接从中医角度给了一套自检小连招,看脸色、查舌头、观眼睛、看头发,这就马上get!
此外,还有从现代医学角度的“症状”诊断:
很好,是谁全中了我不说,而且建议的第一条还是不要熬夜。
emmm……发出皇后娘娘的委屈,毕竟实测的时候我就在熬夜:
不过,虽然建议咱确实做不到,但情绪价值也给拉满了——AI还能够以非常温柔、积极的姿态关心俺们……
作为一个线上医疗产品,必须要具备的是能长“陪伴”,能够对用户过往问诊记录有记忆,不必每次都重新表达。
所以我们也测试了一下,比如模糊记得,很早之前和它聊过肝功能的问题,刚好随机抽查一下……
没想到,它准确回忆起上次聊到还是6个月前,并且建议近期去复查。
再来一次,前一阵有落枕的毛病,到现在还没缓解,于是又问了一遍。
从其思考过程来看,它明确意识到了用户之前就有落枕这一点:
已知前一天有落枕史……
这种记忆和上下文联想的能力,基本上能够实现长期健康追踪与个性化服务了。
当然,出色的产品体验背后,一定是基于技术上的领先。
当我们把体验反馈给好伴AI的出品团队时,他们也分享了背后的技术关键。
简单说无非就是两点,一是基座模型,另一方面在则是产品化——
模型上,团队精心训练了全学科医学基座大模型WiseDiag-Z1;产品化上,则针对市面上同类医疗AI进行了全方位改进。
先说模型训练。
第一步,垂直领域要想训练出真正有用的AI模型,大量高质量数据必不可少。
于是,团队给模型“喂”了超3万亿token的专业医学数据,包括权威教材(如《内科学》、《妇产科学》)、最新临床指南(如NCCN、中华医学会系列)、50万篇医
学论文及真实病例库。
打好地基之后,接下来的关键是如何处理这些素材。
这里,团队祭出了一项关键法宝——医学编码模型(Med-Embedding)。与普通向量编码模型不同,它能通过捕捉医学术语的临床意义,将这些信息转化为高维向
量,确保AI在诊断时不会混淆关键细节。
通俗地说,有些表达在日常语言中看似区别不大,但到了医学场景,往往失之毫厘谬以千里。
就像“发烧38度三天”和“反复低热”,前者更接近急性感染的向量,而后者则是慢性
。
这种关键但又细微的差别,往往普通向量编码模型无法准确区分,不过医学编码模型会结合医学知识库和临床背景,对术语进行精准编码。
这还不算完,训练过程中,团队还邀请了临床医生深度参与。
通过监督微调(SFT)和直接偏好优化(DPO),人类医生的诊疗思考逻辑(如鉴别诊断优先级、风险权衡等)也被引入模型。
最终,团队为好伴AI自研出了全学科医学基座大模型WiseDiag-Z1,拥有730亿参数,支持32K上下文长度。
它采用了独特的多层次推理机制,能够像专家医生一样,进行深入细致的分析思考和反复权衡;且在病因分析、鉴别诊断、制定治疗方案等关键环节,它能模拟专家
医生层层思考,直至找到最优解。
而基于这一具备推理能力的强大专业模型,团队更是在打磨具体产品上下足了功夫。
分析目前市面上的医疗AI,无外乎有以下几种形态:
但不管是哪种形态,都有些共同的缺点:1)首先还是技术不够成熟,大多数仍采用非推理式的模型,无法处理复杂医学推理(鉴别诊断能力差);2)顶尖医学专家
供给有限,无法提供大规模服务;3)更偏向通用,无法实现个性化服务,尤其在个人身体情况本身千差万别的情况下。
针对这些竞品的不足之处,好伴AI逐渐走出了自己的差异化特征:
技术层面,730亿参数WiseDiag-Z1大模型+医学编码模型,能够支持多模态医学数据解析。
举个例子,以川崎病皮疹为例,由于传统医疗AI依赖关键词匹配,因此很容易将它误判为普通过敏,但实际上它是一种以全身血管炎为主要病理改变的急性发热性疾
病。
服务方面,借助三甲医院顶尖医生的数字分身,AI诊疗也变得更加专业化、个性化了,真·人均三甲。
最重要的是,借助多层记忆存储+动态知识库(1.2万种疾病),跨周期健康追踪也不在话下。
正如实测部分所展示的,它不仅能帮你回忆起一些旧诊疗记录,还能及时比对动态知识库,快速锁定潜在风险。
事实上,就在上周智诊科技连开几场发布会,一口气发布了三款专业模型:
文章最开始我们有说了,不论是智诊还是好伴AI,都在越来越破圈、被热议,被视为宝藏杭州冉冉升起的明星。
但实际上,不论是技术还是产品,都离不开智诊科技创办之日就对优质医疗普惠化的坚定追寻。
在中国乃至全世界,都存在着医疗资源分布不均、优质专家稀缺这一痛点。
与之形成鲜明对比的是,每个人都渴望有一个随叫随到的专家级私人医生。
现在,好伴AI做到了。
它没有以“医生助手”的形态示人,而是直接触达普通用户,这种做法不仅最奥卡姆剃刀,也最大程度满足了普通人对医疗资源的渴求。
而且不仅是从无到有,具体到其中的各项功能,也是个个直戳人们的内心。
人们认可专家的名号,更青睐于让专家给自己坐诊,好伴AI就直接把专家复刻成数字人;
人们希望AI助手能够更懂自己,动态掌握自己长期的健康状况,好伴AI就加入了长期记忆;
人们希望专家不仅能够提供实质的帮助,态度上也要友好亲和,好伴AI就给人们输出情绪价值……
作为一款APP,作为24小时在线的“口袋专家”,好伴AI精准地狙击了人们的痛点,架起了医疗大模型和普通用户之间的桥梁,让人们必装的APP又多了一个。
目光上升到宏观层面,好伴AI也实打实地降了低就医门槛。尤其对一些落后偏远的不发达地区来说,这一工具对避免延误诊疗至关重要。
另一方面,好伴AI对医生来说也是一种极大解放。通过上面提到的专家分身系统,他们的宝贵临床经验被转化成了可复用的数字资产。如此一来,这群人也能更加专
注疑难杂症,从而最大限度发挥智力资源。
道虽远,行则将至,虽然面临着诸多困难和不确定性,但好伴AI已然在AI+医疗领域披荆斩棘,开辟出了新的道路。
虽然成立还不到两年(2023年6月),但从其一路问鼎全球最强医疗AI模型可以窥见,它可能会成为现阶段发展最快、应用价值最高的医疗AI之一。
网页已经就绪,APP也能公开下载,实力如何,可以自己上手试试了~
网页端(APP端需自行下载好伴AI):
https://chat.wisediag.com
文章来自于微信公众号 “量子位”,作者 :克雷西 一水
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。
项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales