魁梧夏天

文章
5
资源
0
加入时间
3年2月3天

深度学习之强化学习(1)强化学习案例强化学习案例

深度学习之强化学习(1)强化学习案例强化学习案例1. 平衡杆游戏2. 策略网络3. 梯度更新4. 平衡杆游戏实战完整代码人工智能=深度学习+强化学习——David Silver 强化学习时机器学习领域除有监督学习、无监督学习外的另一个研究分支,它主要利用智能体与环境进行交互,从而学习到能获得良好结果的策略。与有监督学习不同,强化学习的动作并没有明确的标注信息,只有来自环境的反馈的奖励信息,它通常具有一定的滞后性,用于反映动作的“好与坏”。 随着深度学习神经网络的兴起,强化学习这一领域也获得了蓬勃

Vrrp协议实验

1、实验环境:2、实验需求:1,LSW2为192.168.10.0/24网段的主路由,192.168.20.0/24网段的备用路由2,LSW3为192.168.20.0/24网段的主路由,192.168.10.0/24网段的备用路由3,当断掉某个网段的主路由时,通过vrrp协议备用路由自动启用。3、实验步骤:第一步:lsw3交换机属于底层设备无路由转换需求。只需要划分子网。(-vlan batch 10 20-int e0/0/1-port link-type access-port