虚心冰棍

文章
5
资源
0
加入时间
2年10月18天

DQN的e-greedy策略理解

阅读蘑菇书源码时,在写DQN网络的智能体是这样写的:class DQN: def __init__(self, state_dim, action_dim, cfg): self.action_dim = action_dim # 总的动作个数 self.device = cfg.device # 设备,cpu或gpu等 self.gamma = cfg.gamma # 奖励的折扣因子 # e-greedy策略相关参数