淡淡小甜瓜

文章
7
资源
0
加入时间
2年10月21天

强化学习7日打卡营-学习小结

我在今年6月份参加了百度的强化学习7日打卡营。我把这几天来的学习简要总结一下。强化学习(RL)分为两部分:agent、enviroment,有三要素:state、action、reward。RL应用于游戏、机器人、推荐、金融、交通等领域。监督学习处理认知问题,强化学习处理决策问题。强化学习有两种学习方案:基于价值(value-based)、基于策略(policy-based)。强化学习环境有算法库PARL和环境库GYM。Sarsa全称是state-action-reward-state'-act

tcp/ip协议栈,商用的几万美金

tcp/Ip协议栈真贵呀,商用的要几万美金呀开源的有lwip想起我们写的wimax 网络管理,也买了几万刀呀看来,好的软件真的值钱!这是劳动,大量的劳动才能搞出来的东西!!

彻底搞懂JS无缝滚动代码

在做个东西要滚动代码而且是无缝的搞了半天还是不行 决心一定要把这个问题搞定经过研究也不难代码如下: 程序