基于PCIE的流量处理方法及Scale-up网络架构

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于PCIE的流量处理方法及Scale-up网络架构
申请号:CN202511305132
申请日期:2025-09-11
公开号:CN120811988B
公开日期:2025-11-14
类型:发明专利
摘要
本申请实施例提供基于PCIE的流量处理方法及Scale‑up网络架构。本实施例中,通过在原有Scale‑up网络架构上增加部署至少一个PCIE Switch系统,该Scale‑up网络架构原有的N个GPU通过PCIE链路连接至对应的PCIE Switch系统,该Scale‑up网络架构中原有的N个GPU还通过Scale‑up网络连接。基于此,可利用本第一GPU连接至PCIE Switch系统的第一PCIE链路将第一类数据发送至第二GPU,这样能够有效避免如KV缓存流量这类数据对于原有Scale‑up网络链路的带宽占用,从而降低对如TP流量和EP流量等这类数据的传输延迟和稳定性的影响。
技术关键词
网络架构 链路负载分担 数据 计算机扩展总线 GPU并行 图形处理器 内存