概述
hello,这是鑫鑫鑫的论文分享站,今天分享的文章是Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments,是一篇关于多智能体语言的论文,我们一起看看吧~
本篇论文是继OpenAI团队之前的工作,《Emergence of Grounded Compositional Language in Multi-Agent Populations》发表之后,针对智能体产生symbol(词汇)后,又一个新作,描述了在一个竞争-合作型环境中,有两种不同的角色,行动者(actor)和评论者(critic)。评论者观察行动者的行为,而通过语言沟通,行动者可以从评论者那里获得其他行动者的状态和目标等信息,以此调整自己的行为。
摘要:
- 分析了传统算法在多智能体情况下的困难:Q-learning受到环境内在的非平稳性的挑战,而策略梯度则受到随着智能体数量的增加而增加的方差的挑战。
- 提出了一种actor-critic方法,该方法考虑了其他智能体的行动策略,并且能够成功地学习需要复杂的多智能体协调的策略。
- 引入了一个训练方案,利用每个智能体的策略集合,从而导致更健壮的多智能体策略。
- 展示了与现有的合作和竞争场景中的方法相比,我们的方法的长处,在这种情况下,智能体群体能够发现各种物理和信息协调策略。
1. 引言
强化学习(RL)最近已经被应用于解决具有挑战性的问题,从游戏[24,29]到机器人[18]。在工业应用
最后
以上就是简单朋友为你收集整理的智能体语言4的全部内容,希望文章能够帮你解决智能体语言4所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复