训练数据的生成方法和电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
训练数据的生成方法和电子设备
申请号:CN202511311808
申请日期:2025-09-15
公开号:CN120803426B
公开日期:2025-12-12
类型:发明专利
摘要
本申请公开了一种训练数据的生成方法和电子设备,涉及模型数据训练技术领域,通过训练后解析树模型的精准符号追踪和跨文件引用解析,生成的结构化数据更准确地反映了代码库中符号的使用情况和语义关系,为后续生成的训练数据提供了坚实的基础。关联结构化数据与技术规范文档,生成的知识库包含了代码符号的官方定义和功能描述,这能够极大地增强大模型对底层系统代码的理解能力。全局符号表的构建考虑到了条件编译和多架构支持,这使得生成的训练数据能够覆盖不同的编译配置和架构,增强了模型的泛化能力和实用性。因此,可以解决现有方案难以在复杂场景下生成有效训练数据的问题。
技术关键词
生成方法 符号 关系 对源代码 定义 生成训练数据 节点 编辑距离算法 逻辑 目录 电子设备 代码库 标记 参数 程序 文本 列表 变量 存储器