摘要
本说明书提供一种基于大语言模型的皮肤检测方法及装置,所述方法包括:获取对待检测的皮肤区域进行拍摄得到的至少一幅图像,并将所述至少一幅图像输入多模态模型,由所述多模态模型基于所述至少一幅图像,生成与所述皮肤区域对应的第一描述文本;获取用于描述所述皮肤区域的音频,并对所述音频进行语音识别,以将所述音频转换为与所述皮肤区域对应的第二描述文本;基于所述第一描述文本和所述第二描述文本,构建提示文本,并将所述提示文本输入大语言模型,由所述大语言模型在所述提示文本的引导下,生成与所述皮肤区域对应的皮肤检测结果文本。