当联邦学习碰上老虎机当联邦学习碰上老虎机
当联邦学习碰上老虎机原论文:Federated Multi-Armed BanditsFMAB框架FL和MAB的自然结合—我们的动机是从非IID的(可能大量的)本地强盗模型中,以通信效率和隐私保护的方式解决全局随机MAB问题。新的联邦MAB框架(FMAB)第一次系统地尝试将FL(联邦学习)和MAB连接起来。FMAB框架是通用的,可以包含各种与FL原则相同的bandit问题。我们首先研究了一个近似的FMAB模型,证明了该框架的优点,其中全局bandit模型作为地面真相存在,而局部bandit模型是