摘要
本发明涉及车联网无线通信与资源优化领域,公开了一种基于多智能体深度强化学习的频谱共享方法,通过构建每条V2V链路为智能体的协同学习环境,采用近端策略优化算法训练策略网络,实现子带与功率的联合控制,以提高频谱利用率与通信成功率。本方法在集中训练、分布执行框架下,通过联合设计状态、动作与奖励函数,在优化V2V通信性能的同时兼顾V2I通信需求,显著提升了系统整体服务质量。该方法具备良好的收敛稳定性与策略泛化能力,适用于动态变化、密集干扰的车联网场景,具有低通信开销、高实时性与强扩展性等优势,可广泛应用于城市道路等智能交通环境下的车载通信资源管理任务中。