尊敬大侠的博客_JavaScript,python编程,高德地图,强化学习相关知识点领域博主

尊敬大侠

文章

资源

加入时间

4年6月5天

强化学习中的两种探索-平衡策略强化学习中的两种探索-平衡策略

强化学习中的两种探索-平衡策略ε-greedy方法UCB（Upper Confidence Bound）方法为了解决强化学习中的一个经典问题：exploration and exploitation tradeoff 即：到底我们应该花精力去探索从而对收益有更精确的估计，还是应该按照目前拥有的信息，选择最大收益期望的行为？这样看上去可能不好理解，一个小例子帮助理解:假如你想在淘宝上买一本书，你一输入书的名字就看到，第一个链接的价格为10元，第二个链接为9.9元，第三个为11元，此时你有两

强化学习相关知识点 2024-09-17 177 点赞 2 评论 268 浏览

fetch,解决高德地图公共api,跨域问题

目录1.功能需求2.遇到的问题3.解决的办法1.功能需求功能需求是需要做一个可以选择各街道的滚动功能,但是由于后端没有街道数据,只有自己去第三方寻找,最后用的高德地图的api. 预期效果如下2.遇到的问题不知什么情况,我在请求高德公共api的时候,遇到了跨域问题 CORS error.如下图3.解决的办法通过查阅 fetch文档,并使用fetch解决了改跨域问题,如下图...

高德地图 2023-11-01 179 点赞 2 评论 271 浏览

Python实现以时间换空间的缓存替换算法

缓存是指可以进行高速数据交换的存储器，它先于内存与CPU交换数据，因此速度很快。缓存就是把一些数据暂时存放于

python编程 2022-04-03 305 点赞 4 评论 462 浏览

他的专栏

JavaScript（0）

python编程（1）

高德地图（1）

强化学习相关知识点（1）

他的归档

2024年09月（1）

2023年11月（1）

2022年04月（1）