过时心情

文章
9
资源
0
加入时间
3年0月27天

强化学习入门例子

flappy bird 为例子来讲看完这个我好像脑子里有个程序了 :https://www.zhihu.com/question/26408259 小鸟飞例子-建模关键点:增强学习有三个要素:状态S,动作A,奖惩R的策略QS:d(x,y)表示小鸟离下一根柱子的距离和高度差A:飞一下 或者 不飞,两种可选动作Q(S+A->R):为一个策略表,也称...