摘要
本发明公开了一种基因大模型与ML联合鉴定Cas靶点有效性的方法,属于生物技术和人工智能领域。方法包括:构建A种联合序列以及靶向联合序列的检测阵列,检测阵列具有A个检测单元;在每个检测单元中分别加入一种联合序列,进行孵育反应,获取各个检测单元的荧光值并进行归一化处理;对各联合序列采用特征提取模型进行关键特征提取;构建标签集和训练集,构建集成模型并采用标签集和训练集进行训练;将特征提取模型与训练好的集成模型组成机器学习模型;对于新的靶标序列和PAM序列,将其结合为待分析的联合序列,再输入机器学习模型,得到预测荧光值,基于荧光值判断Cas蛋白对联合序列的识别能力。本发明可助力靶向治疗检测。