大胆康乃馨

文章
7
资源
0
加入时间
3年0月9天

基于强化学习方法的PID参数整定前言环境模型利用控制系统调节器整定PI控制器创建环境以训练agent训练agent比较控制器的控制效果一些函数的定义

前言PID控制器在工业界应用非常广泛,但是PID的参数调节一般需要人工根据经验法来试。对于有经验的工程师来说,一般试几次就可以获得满足调节的参数。然而对于新手工程师却很难确定一套比较好的参数。这里我们采用强化学习的方法来调节PID参数。这个例子展示了如何使用双延迟深度确定性策略梯度(TD3:twin-delayed deep deterministic policy gradient)强化学习算法来调整PI控制器。整定控制器的性能与使用Control System Tuner app整定的控制器