一种基于分词器分类与适用性分析的视觉令牌压缩方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于分词器分类与适用性分析的视觉令牌压缩方法
申请号:CN202511396074
申请日期:2025-09-28
公开号:CN120876890A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了一种基于分词器分类与适用性分析的视觉令牌压缩方法,涉及图像识别技术领域,主要包括步骤:以统一强度的压缩操作算子与一致的性能指标要求建立统一压缩评测协议下面向视觉分词器的评测框架;根据视觉分词器对视觉信息的处理流程将压缩位置进行阶段划分;应用评测框架,针对各类分词器中的每一类,分别在所有压缩位置插入压缩操作,并量化每一组合情况下的性能指标值;根据性能指标值,分析各类分词器在不同压缩位置的适用规律;基于适用规律,确定不同类型视觉分词器所适用的压缩位置,并据此执行基于适用规律优化的视觉令牌压缩策略。本发明提供了一个无需训练、即插即用、兼具高效性与通用性的视觉令牌压缩解决方案。
技术关键词
视觉 令牌 阶段 编码器架构 语义 分支 图像识别技术 鲁棒性 框架 策略 图像块 协议 强度 分辨率 聚类 指标 定义