喜悦白昼

文章
7
资源
0
加入时间
3年0月21天

uoj#209【UER #6】票数统计

题目做UER的A题涨信心首先我们注意到这个所谓的至少有一条正确在\(x\)和\(y\)不相等的时候非常弱,当\(x<y\)时,只有可能是后\(y\)位用户有\(x\)个通过;当\(x>y\)时,只有可能是前\(x\)位用户有\(y\)个通过。也就是说这些信息都能被转化成一些用来限制前后缀和的信息。设\(pre_i\)表示序列的前缀和,对于一条前\(x\)位用户有\(y\...

python用logging模块写循环日志

在程序运行的过程中需要打印一些有用的信息,但如果需要打印的信息比较多的话且运行时间较长则磁盘容量可能不够用。因此就需要写循环日志。比如设置日志的大小为3M,设置日志的个数为3个,设置日志名称为Log。则程序开始时,开始往Log文件写日志,一旦Log超过3M,则将Log存为Log.1,并重新往Log里写日志。以此类推,Log.1满了则存为Log.2,Log.2满了则存为Log.3。都满了...

MATLAB强化学习入门——二、网格迷宫、Q-learning算法、Sarsa算法一、多步决策问题和网格迷宫二、 Windy Grid World的编程实现三、 Q-Learning算法总结

本文为《MatLab强化学习入门》系列的第二篇。在解决了单步决策问题以后,我们可以将多步问题分解为多个单步问题进行处理。使用ε-greedy等策略的基础在于对智能体当前的状态有良好的估计。如何对不同的状态均形成良好的估计呢,Q学习应运而生。本文将主要介绍Q-Learning的一系列基本算法,包括Q-Learning、Sarsa、Sarsa-λ算法;分析网格迷宫的编程实现,并对结果进行讨论。