饱满草莓的博客_PHP编程,Windows 10,Mssql,Php,Python,神经网络,数字信号处理,强化学习领域博主

饱满草莓

文章

资源

加入时间

2年10月21天

K摇臂赌博机 --ε-贪心算法(原理与Python代码实现模拟)

K摇臂赌博机 K摇臂赌博机对应单步强化学习模型，K摇臂赌博机有K个摇臂，赌徒投币后按下其中一个摇臂，摇臂以一定的概率吐出硬币，赌徒事先并不知道每个摇臂吐出概率的的情况，需要使得赌徒获得硬币最大？解决这个问题，其中有两种简单的解法：仅利用：选择目前为止平均奖赏最大的摇臂，缺点没有很好地估计摇臂的期望奖赏，可能经常选择不到最优的奖赏，仅探索：将选择的机会平

强化学习 2024-09-17 42 点赞 0 评论 63 浏览

Matlab产生参数可变的时变信号

波形长度可调，时变特性可配function Waveform = TimeVarying_Signal_Para(Length,Step)Frequency=1000; %采样率1KHzTime_Interval=1/Frequency; %点时间间隔0.001sTimes=floor(Length/Step); %向下取整%Steps=500;Waveform=zeros(1,Length);%Trunca

数字信号处理 2023-11-09 44 点赞 0 评论 66 浏览

胶囊神经网络：Dynamic Routing Between Capsules，NIPS2017

Introduction本文的三位作者来自Google Brain，Toronto。胶囊（Capsule）是一组神经元，其活动向量（activity vector）表示特定类型实体(如对象或对象部分)的实例化参数。换句话说，越低级的胶囊捕获越细粒度的特征。我们拿人脸来举例，轮廓、五官都可以被视为低级别的特征，被低级别的胶囊的活动向量所表示。当多个低级别的胶囊预测一致，激活更高级别的胶囊（比如，...

神经网络 2023-08-26 49 点赞 0 评论 74 浏览