阔达可乐

文章
5
资源
0
加入时间
3年0月21天

qlearningα越大或越小_Q-learning 算法

Q-learning 是一个经典的强化学习算法。为了便于描述,这里依然定义一个“世界”:令空白格子的奖励为1.Q-TableQ-table 是 Q-learning 的核心。它是一个表格,记录了每个状态下采取不同动作,所获取的最大长期奖励期望。通过此,就可以知道每一步的最佳动作是什么。Q-table 的每一列代表一个动作,每一行表示一个状态。则每个格子的值就是此状态下采取此动作获得的最大长期奖励期...

前端使用水印的代码实现

第一点很好实现。我们create一个dom元素,插入到body中就可以了。 const divObj = document.createElement('div'); const styleStr = ` position:fixed; top:0; left:0; bottom:0; right:0;