2023年09月归档_机智毛衣的博客_JavaScript,Windows 8,Photoshop教程,python编程,DC学习,强化学习,Python,Java基础,算法,k8s领域博主

机智毛衣

文章

资源

加入时间

2年10月18天

强化学习 # 概述强化学习算法分类图概述学术性的导入代码实现：Reference

博主在学习强化学习和深度强化学习中对RL/DRL的归纳总结。1 Introduction强化学习的关键是：exploitation（利用）和 exploration （探索），也可以解读为trial和reward。和监督学习算法的区别是：监督学习：已知数据、标签强化学习：一开始没有标签，通过try获得data和labelRL的一些基本算法：通过行为的价值来选取特定行为的方法, 包括使用表格学习的 q learning, sarsa, 使用神经网络学习的 deep q network,.

强化学习 2023-09-13 52 点赞 0 评论 78 浏览

他的专栏

JavaScript（0）

Windows 8（0）

Photoshop教程（2）

python编程（1）

DC学习（1）

强化学习（1）

Python（1）

Java基础（1）

算法（1）

k8s（1）

他的归档

2023年09月（1）

热门文章

Photoshop 照片加上漂亮的卡通装饰

让python json encode datetime类型

Photoshop将外景图片调成梦幻的紫色调

DC实战问题汇总

强化学习 # 概述强化学习算法分类图概述学术性的导入代码实现：Reference

python的selenium的自动化点击简单应用

【14】集合1_集合框架，迭代器，List集合，Set集合

归并排序、快速排序、随机数1 归并排序2 快速排序3 随机数4 选取数组中第k大的数

k8s学习笔记3-搭建k8s metrics server一.介绍二.原理三.部署四.验证五.参考资料