强化学习入门例子 flappy bird 为例子来讲看完这个我好像脑子里有个程序了 :https://www.zhihu.com/question/26408259 小鸟飞例子-建模关键点:增强学习有三个要素:状态S,动作A,奖惩R的策略QS:d(x,y)表示小鸟离下一根柱子的距离和高度差A:飞一下 或者 不飞,两种可选动作Q(S+A->R):为一个策略表,也称... 人工智能 2024-09-17 34 点赞 0 评论 51 浏览