一种关键信息的搜索方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种关键信息的搜索方法及装置
申请号:CN202411933788
申请日期:2024-12-26
公开号:CN119669547A
公开日期:2025-03-21
类型:发明专利
摘要
本发明提供一种关键信息的搜索方法及装置,对目标网站进行爬取得到网页内容;从网页内容中提取出文本信息;判断网页内容是否通过特定关键词爬取得到;若是,则利用正则匹配公式,将文本信息与特定关键词进行匹配,得到文本信息对应的关键信息评价分;若否,则从文本信息中识别出多个预设的关键指标对应的关键指标值,基于每一关键指标的初始评分、每一关键指标对应的权重和加权值算法,计算得到关键信息评价分;若关键信息评价分大于评分阈值,则确定文本信息为关键信息。在本方案中,利用爬虫批量获取网页内容,对可能的关键信息进行判断打分,将关键信息评价分大于评分阈值的信息确定为关键信息,实现了提高效率和持续化搜索关键信息的目的。
技术关键词
分布式爬虫系统 关键词 文本 报文 指标 搜索词 文字识别技术 明文 多线程方式 搜索方法 图片 层次分析法 格式 标签 矩阵 动态 参数 算法 批量
系统为您推荐了相关专利信息
论坛 帖子 多模态 多任务学习模型 文本
路径规划方法 包络 列表 账户 路径规划装置
评估预测方法 架空输电线路 预测输电线路 蚁群算法优化 层次结构模型
构建行业知识库 语义向量 多轮对话 切片 界面