一种缓存管理方法、装置、设备、介质和产品
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种缓存管理方法、装置、设备、介质和产品
申请号:
CN202511517812
申请日期:
2025-10-23
公开号:
CN120994714A
公开日期:
2025-11-21
类型:
发明专利
摘要
本发明涉及人工智能技术领域,特别是涉及一种缓存管理方法、装置、设备、介质和产品,方法包括:实时评估不同注意力头对当前推理任务的重要性分值,并根据重要性分值,动态地为每个注意力头的键值缓存分配不同层级的存储资源,包括存储位置和数值精度,从而在保证模型输出质量,尤其是关键信息不丢失的前提下,最大化的节省内存,进而提升推理速度。
技术关键词
缓存管理方法
键值
注意力
层级
分层
模式
指令
精度
缓存管理装置
信息不丢失
可读存储介质
存储计算机程序
序列
人工智能技术
多层感知机
计算机程序产品
处理器
存储模块
矩阵