我是靠谱客的博主 善良衬衫,最近开发中收集的这篇文章主要介绍【MATLAB强化学习工具箱】学习笔记--在Simulink环境中训练智能体【进一步说明-分析基线】,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

原文章见如下链接

【MATLAB强化学习工具箱】学习笔记--在Simulink环境中训练智能体【进一步说明】https://mp.csdn.net/mp_blog/creation/editor/121349410在上文中已对 m文件与simulink的接口、水箱模型、奖励函数、控制效果等方面进行了分析,本文专门对分析基线进行分析。

分析基线为帮助文档中的示例结果,如下所示。

奖励函数:

(1)。具体参数如下 

 (2)具体参数如下。

 

(3) 应是即刻达到了最优条件,注水与放水速率几乎相同,reward立即达到最大。神经网络里面出现了类似PI控制中积分项的效果。

 放大仿真开始的局部视图,如下所示。水位还是略有下降,将误差从一开始的0.05变到0.02左右。应该是在大量的网络训练中,h的实际值与href越接近,后续动作作用后超出0.1误差界的可能性越小,得分越高,所以h还是略有变化。

说明,仿真中的修改是通过以下修改如下重置函数进行的,目前没有找到更好的方法。

function in = localResetFcn(in)
h_ref = 12;
h_0
= 12.05;
sl_name = 'rlwatertank_20211116';
% reference signal
blk = [sl_name '/Desired Water Level'];
in = setBlockParameter(in,blk,'Value',num2str(h_ref));
% initial height
blk = [sl_name '/Water-Tank System/H'];
in = setBlockParameter(in,blk,'InitialCondition',num2str(h_0));
end

最后

以上就是善良衬衫为你收集整理的【MATLAB强化学习工具箱】学习笔记--在Simulink环境中训练智能体【进一步说明-分析基线】的全部内容,希望文章能够帮你解决【MATLAB强化学习工具箱】学习笔记--在Simulink环境中训练智能体【进一步说明-分析基线】所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(90)

评论列表共有 0 条评论

立即
投稿
返回
顶部