非结构化数据的预处理方法、设备、介质及程序产品
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
非结构化数据的预处理方法、设备、介质及程序产品
申请号:
CN202411917537
申请日期:
2024-12-24
公开号:
CN119690351A
公开日期:
2025-03-25
类型:
发明专利
摘要
本申请提供一种非结构化数据的预处理方法、电子设备、可读存储介质及计算机程序产品,该方法包括:识别非结构化数据的分层维度,并基于分层维度确定分层标准;基于分层标准对非结构化数据进行分层处理,得到分层数据;识别分层数据的数据特性,并基于数据特性确定对应的分块算法和分块大小;基于分块算法和分块大小对分层数据进行分块处理,得到分块数据;对分块数据进行去重处理,得到预处理数据。该方法能够确保系统能够灵活应对多种数据格式的存储需求,从而保障数据存储效率,降低存储成本和管理难度。
技术关键词
分块算法
分层
计算机程序产品
计算机程序指令
数据识别模型
数据存储效率
可读存储介质
数据访问
电子设备
场景
存储计算机程序
处理器
数据格式
指针
存储器
频率
实体
定义