一种基于模型网格的云原生人工智能模型部署与管理系统
申请号:CN202510301385
申请日期:2025-03-14
公开号:CN120186150A
公开日期:2025-06-20
类型:发明专利
摘要
本发明特别涉及一种基于模型网格的云原生人工智能模型部署与管理系统。该基于模型网格的云原生人工智能模型部署与管理系统,包括控制平面层、数据平面层、缓存层、安全模块、资源调度器和监控与日志模块。该基于模型网格的云原生人工智能模型部署与管理系统,将模型服务视为网络中的独立节点,通过模型网格来协调和管理模型服务,实现了在云原生环境中对大规模人工智能模型服务的高效部署与管理,安全可靠,扩展性强,易于管理。
技术关键词
人工智能模型
管理系统
资源调度器
集成智能算法
网格
LRU算法
分布式缓存技术
监控日志
缓存策略
下发安全策略
令牌
负载均衡策略
模块
数据
认证服务器
分发策略
决策
加密