多智能体协同传输的事件触发通信与控制的深度强化学习(ICRA-2021)
摘要本文探讨了一种多智能体强化学习方法来解决多智能体协作传输的通信和控制策略设计问题。典型的端到端深度神经网络策略可能不足以覆盖通信和控制;这些方法不能决定通信的时间,只能工作在固定速率的通信。因此,我们的框架采用了七触发架构,即一个反馈控制器,计算通信输入,以及一个触发机制,决定输入何时必须再次更新。利用多智能体深度确定性策略梯度,可以有效地优化此类事件触发控制策略。通过数值模拟,我们证实了我们的方法可以平衡传输性能和通信节省。引语应用协同运输是多智能体系统中的一个重要任务,在配送服务、工厂物