纳米材料与蛋白质相互作用数据集构建方法、装置及介质
申请号:CN202510976790
申请日期:2025-07-16
公开号:CN120877849A
公开日期:2025-10-31
类型:发明专利
摘要
本发明涉及一种纳米材料与蛋白质相互作用数据集构建方法、装置及介质,其中方法包括:处理文献语料,提取得到一个或多个第一信息组;进行语义对齐获得未填充结构化特征数据;对所有第一信息组中的结构化特征数据填充缺失特征得到填充后的结构化特征数据;分别计算第一信息组内纳米材料和各检测到的蛋白质之间的交互作用强度,生成第一类样本;根据来自于同一文献语料的所有第一信息组,进行局部填充得到第二类样本;根据来自于不同的文献语料的所有第一信息组,进行全局填充得到第三类样本;对第一类样本根据其交互作用强度进行标注,并将第二类样本和第三类样本作为负样本,构建得到数据集。与现有技术相比,本发明具有加快数据构建速度以及提高样本的质量和数量等优点。
技术关键词
数据集构建方法
样本
纳米材料表面修饰
体液
生物
标识符
纳米颗粒
强度
指数
仪器设备
程序
分析方法
语义
参数