从有问必答的大模型,到吟诗作画的大模型,大模型如何求医问药,尤其是将中华优秀传统文化的代表中医药,也收入人工智能(AI)的智囊之中?
多家高校和科研机构联合研发的“数智岐黄”中医药大模型,19日在大零号湾科创大厦发布。值得一提的是,这个中医药大模型是“中西医结合”模式,成为全面融合中西药数据与知识的智能系统,支持向量检索,精确提供生成式输出,以支持中西医药物研发与医疗决策。从参数量来看,不论中医还是西医的“智库”均拥有130亿以上参数,在同类大模型中堪称最大规模。
解放日报·上观新闻记者体验了新的大模型,随机考一考它。比如简单提问:“乙流吃什么药?”它在不到10秒之内快速解答:“乙流是由流感病毒引起的呼吸道疾病,中医认为乙流属于‘外感风寒’范畴,治疗时可以采用中草药和中药方剂进行治疗。”同时,它开出4个药方,包括4种常用的中药方剂和中草药:防风通圣散、桂枝汤、荆防败毒散和羚羊角冲剂。另外,它也提醒:需要根据个人病情和体质进行选择和调配,建议在医生指导下使用。
据悉,“数智岐黄”中医药大模型由华东师范大学、上海中医药大学、华东理工大学、海军军医大学、临港实验室、华润江中现代中药全国重点实验室联合开发,由陈凯先院士和钱旭红院士作为项目总指导。它的“大脑”装下海量知识库,其数据基础以《黄帝内经》、《伤寒杂病论》等著名中医典籍及1000多本古籍和中医药文献为核心,形成高质量的中药知识图谱,涵盖超过9000种中药材、超过4万种中药成分、超过1.8万种靶点、超过2000种疾病等,基于这些结构化及非结构化数据构建起1000万个节点及3.2亿个关系对。
在研发过程中,该大模型采用四层递进的训练方式。从预训练到监督微调,进一步从奖励模型到强化学习,实现从宏观的中药、方剂、证候,到微观的疾病、靶点与药物成分之间的互联互通。通过团队不懈努力和医药专家评估,“数智岐黄”大模型持续提升其回复的准确性和专业性,为用户提供更高质量和有益可信的答案。
解放日报·上观新闻记者了解到,“数智岐黄”中医药大模型之前参加了中医执业医师资格模拟考试。这项考试对于真人医师也难度很大,目前接受测评的各种大模型基本在“及格线”上下,比如GPT4的准确率为59.86%,GPT3.5为43.98%,而“数智岐黄”则为66.91%,首次通过了这一执业资格模拟考。
目前,作为垂直领域应用的大模型,“数智岐黄”已形成网页版与微信小程序的测试版,通过方剂推荐、中药性味归经、炮制方法等性质解读、证候辅助诊断,已实现中医药领域知识智能问答、健康对话咨询、中医药知识图谱动态交互这三大核心功能。令人兴奋的是,它与专业人士交流互动下,可能探索出人类在传统医学中未知未验的“灵丹妙药”方子。
研讨AI赋能下的未来药学产学研发展时,华东师范大学校长钱旭红表示,当前,以人工智能等为代表的新一代信息技术在药学领域的应用越来越广泛,极大地提升了新药研发的效率。然而,AI赋能未来药学,在药物研发上需要算法工程师和药学家、化学家紧密合作。“面向未来,我们更需要从现在开始就培养同时掌握人工智能技术和药物设计研发手段的复合型创新人才。”他说,这也是华东师大创办药学院的核心理念和发展目标。
华东师大与临港实验室去年共建华东师大药学院,中国科学院院士陈国强为名誉院长,临港实验室副主任李洪林教授为首任院长,拥有药学博士点和生物与医药工程博士点,重点发展人工智能药物设计、核酸及细胞药物、药物超限制造、数字药物等。在此基础上,学校与闵行区成立“华东师大-大零号湾生物医药产学研联盟”,进一步加强优秀药学人才的校企联合培养,推进科研成果落地转化。
本文作者:徐瑞哲
文章来自于 “上观”,作者 “徐瑞哲”
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner