大语言模型推理性能评估与优化方法、电子设备和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
大语言模型推理性能评估与优化方法、电子设备和存储介质
申请号:CN202510359521
申请日期:2025-03-25
公开号:CN120297409A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种大语言模型推理性能评估与优化方法、电子设备和存储介质,方法包括:初始化测试环境;动态生成并发用户请求;基述并发用户请求收集性能数据;基于性能数据进行实时监控与报告;基于性能数据生成性能评估报告。通过以上步骤,本发明能够全面评估LLM在高并发场景下的推理性能,确保系统在不同硬件环境中的最优表现。
技术关键词
大语言模型 报告 收集器 数据 时延 动态 电子设备 计算机存储介质 异步方式 处理器通信 服务器 存储器 网络 会话 指令 参数 校正 场景 算法