支付宝医疗大模型亮相!
中英文医疗考试、基准测试达到甚至超过GPT-4水准。
此外,其医疗专业能力在中文医疗LLM评测榜单promptCBLUE中,位列A榜第一,B榜第二。
模型在识别报告、药品、毛发等图像准确率中达90%以上。
WAIC现场,支付宝还联合人民卫生出版社、北京大学医学部、浙江省卫生健康委等20家机构,联合发起AI医疗共建计划。
不同于其他领域大模型,医疗大模型在多模态、安全性、专业性能力上面都提出了更高的挑战。
首先是多模态,它是以百灵大模型为基座模型。
今年年初,蚂蚁就判断了原生多模态的技术方向,并持续投入。目前,百灵大模型已经具备看、听、说、画原生多模态能力。
换言之,能直接理解并训练音频、视频、图、文等多模态数据。
在此基础之上,它添加了包括添加了包含报告、影像、药品等百亿级中英文图文、千亿级医疗文本语料及千万级高质量医疗知识图谱。
目前,该多模态医疗大模型不仅能提供智能问答、病历结构化和检索、辅助诊断;还能识别药品以及上百种医学报告、进行毛发健康检测等。
这些能力都可以直接嵌入医院等机构医疗环节全流程,快速应用。
其次在专业可靠方面,蚂蚁大模型应用负责人顾进杰透露,支付宝在研发、模型测试阶段采取了这些举措。
在研发阶段,支付宝还与数百个专业医学团队、专家进行合作标注数据,保障信息权威可信。
与此同时,还联合上海仁济医院推出首个中文医疗专科问答推理数据集RJUA-QA。
模型测试阶段,用户、患者、医生参与问答反馈。
最后在安全性方面,医疗场景下,保障技术可靠与数据隐私安全至关重要。而蚂蚁本身在安全领域就有多年的深耕。
此次,支付宝还面向行业推出“医疗可信一体机+可信云”的解决方案。
前者实现训推一体,国产算力软硬件协同优化加速,解决医院算力不足的痛点;后者通过公有云和私有云部署密态推理,解决数据隐私安全方面的问题。
在此大模型能力基础之上,发布了全模态数字人、智能体相关产品以及行业解决方案。
其实早在去年,就已经开始了AI在医疗场景方面的布局。
去年11月,浙江卫健委应用支付宝开放的“AI就医助理”解决方案,并打造了全国首个数字健康人“安诊儿”,给浙江居民提供云陪诊、健康咨询等服务,上线以来,服务了1000多家医疗机构。
而前段时间,上海市第一人民医院,应用AI大模型,不仅上线了上海首个可语音交互的“数字陪诊师”,还在业内首创了生成式电子病历,将繁杂的文书工作从原本的10分钟缩减到了15秒。
更早之前,蚂蚁就已经在如何解决用户看病难等实际问题进行了相关探索。2014年支付宝就支持全国第一笔远程挂号缴费。
经过10年发展,平台已服务超6亿看病就医人群,是国内规模最大的医保第三方在线服务平台、一站式的医疗健康服务平台。
目前,全国300多个城市、超3600家医院在支付宝上提供一站式数字医疗服务。
蚂蚁十年医疗生态积累,也成为他们医疗大模型的独特优势和核心壁垒。
医疗作为蚂蚁落地三大核心应用领域之一,也就不奇怪了。
医疗、金融、生活。
大模型进入应用时代,蚂蚁也正式公开他们落地的三大领域,表现形态为专业智能体:
AI就医助理、AI金融助理、支付宝智能助理。
其中,支付宝智能助理在WAIC上首次亮相,并入选今年的镇馆之宝。
在支付宝上,只需首页往下拉就可以唤醒它,通过对话就能完成办事、问诊、打车等服务,随时调用起自带的上千个小程序。
比如点单茶饮or咖啡,目前支付宝支持包括星巴克、瑞幸、喜茶、霸王茶姬、蜜雪冰城等首批12个茶饮品牌小程序。
你只需下达指令,“我想点一杯星巴克的中杯冰拿铁”,AI便会进入小程序自动下单,用户确认并付款后,就能到附近的线下门店取到咖啡。
之所以选择专业智能体这一形态,蚂蚁集团董事长兼CEO井贤栋透露了背后的原因。
业界普遍认为,通用大模型落地严谨产业面临着三个“能力短板”:领域知识相对缺乏、复杂决策难以胜任,以及对话交互不等于有效协同。
而为了破解这些难题,专业智能体或许会是一条有效路径。
从我们的实践来看,专业智能体是大模型落地严谨产业的有效路径。
值得一提的是,此次支撑起这三大智能体的关键技术——智能认知决策技术与平台,也获得本次大会重要奖项“卓越人工智能奖(SAIL)TOP30”。
这项技术由蚂蚁集团和浙江大学,历时7年联合攻关,大幅提升了人工智能服务严谨产业的专业能力、准确性和自我学习能力,让AI和大模型做决策更聪明、更可靠。
截至目前,项目技术已广泛应用于医疗民生、金融、政务等行业,服务了上海仁济医院、上海市一医院、浙江省卫健委等2600余家医院和机构,人保健康、浦发银行等数10家金融机构,推动人工智能真正规模化落地产业。该项目还获授权发明专利100余项,部分成果获2022年中国电子学会科技进步一等奖、2023年吴文俊人工智能科技进步一等奖等多个奖项。
文章来源于:微信公众号量子位
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MONAI是一个专注于医疗影像分析的深度学习框架,它可以让医院高效、准确地从医疗影像数据中提取有价值的信息,以辅助医生进行诊断和治疗。
项目地址:https://github.com/Project-MONAI/MONAI?tab=readme-ov-file
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales