陶醉酸奶

文章
9
资源
0
加入时间
3年0月21天

深度强化学习详解与实例(一)1. 概率论与蒙特卡洛

1. 概率论与蒙特卡洛1.1 概率论基础在强化学习中会反复用到概率质量函数(Probability Mass Function,PMF)或者概率密度函数(Probability Density Function,PDF)。PMF用来描述离散概率分布,例如抛硬币的概率质量函数如下:∑x∈Xp(x)=1\sum_{x \in \mathcal{X}} p(x)=1x∈X∑​p(x)=1PDF用来描述连续概率分布,例如正态分布就是一种常见的连续概率分布,随机变量XXX的取值范围是所有实数RRR

react、redux什么的都用起来 【2】异步action和redux中间件

现代web页面里到处都是ajax,所以处理好异步的代码非常重要。这次我重新选了个最适合展示异步处理的应用场景——搜索新闻列表。由于有现成的接口,我们就不用自己搭服务了。 我在网上随便搜到了一个新闻服务接口,支持jsonp,就用它吧。一开始,咱们仍然按照action->reducer->components的顺序把基本的代码写出来。先想好要什么功能, 我设想的就是有一个输入框,旁...

android(ics)vold,mountservice

android usb挂载分析---MountService启动Android SDCard UnMounted 流程分析(一)Android SDCard UnMounted 流程分析(二)Android SDCard UnMounted 流程分析(三) usb + MTPandroid usb流程(转载加整理)   android的USB for MTP