忧郁钻石

文章
8
资源
0
加入时间
3年1月10天

强化学习经典算法笔记(一):价值迭代算法Value Iteration强化学习经典算法笔记——价值迭代算法

强化学习经典算法笔记——价值迭代算法  由于毕业设计做的是强化学习相关的内容,感觉有必要把强化学习经典算法实现一遍,加强对算法和编程的理解。所以从这一篇开始,每一篇实现一个算法,主要包括Value Iteration,Policy Iteration,Q Learning,Actor-Critic算法及其衍生的DDPG等。期间还会在代码中介绍OpenAI Gym中的游戏环境。  强化学习的基本...

谈谈对零信任的理解

最近几年,零信任这个词被提及的频率很高,搞安全的不知晓一二可能会被人鄙视,所以本篇简单的学习了解一下,大部分观点和内容来在网上,仅供参考,也帮着普及扫盲一下。