重要信封

文章
6
资源
1
加入时间
2年10月21天

《深度强化学习实践》Actor-Critic算法小结应用

最近想拿出一些时间,把《深度强化学习时间》好好过一遍,这一节总结的是AC和A3C的内容。Actor-Critic方差策略梯度算法目标:通过训练,增加好动作的概率,减小不好动作被采集到的概率。实现:▽J≈E[Q(s,a)▽log⁡π(a∣s)]{\triangledown }J\approx E[Q(s,a){\triangledown }\log \pi (a|s)]▽J≈E[Q(s,a)▽logπ(a∣s)]缺点:不稳定,收敛速度慢的缺点(因此actor-critic算法致力于解决这两个问.

Android中Activity出现与退出的自定义动画

由于安卓系统开源的原因,很多厂家都重写了activity的出现和退出的样式,有些时候为了开发的需要,需要某些activity呈现一定的出现样式,这个时候就需要开发者自己去自定义样式了自定义Activity的进入和退出效果有两种方法:一种是通过代码的方式MainActivity.this.overridePendingTransition(enterAnim,exitAnim)其