Resource Management with Deep Reinforcement Learning论文总结Resource Management with Deep Reinforcement Learning三.结果分析四.细节补充
Resource Management with Deep Reinforcement Learning算法说明:本次实验采用策略梯度强化学习算法,并附加同SJF,Packer,Tetris三种调度策略的对比。代码运行之初,可选则Sjf或者Packer进行调度,获得决策数据,运用监督学习进行神经网络的初始化。一.先进行监督学习1.监督学习流程图2.剖析监督学习流程图2.1数据收集,获取数据先用“SJF”或者“PACKER”的数据进行调度,获得决策轨迹,在这里,如果获得SJF,就进行get_s