小巧大侠

文章
6
资源
0
加入时间
2年10月17天

Task01:强化学习基础

Reinforcement Learning一些概念强化学习讨论的问题是一个 智能体(agent) 怎么在一个复杂不确定的环境(environment)里面去极大化它能获得的奖励。当 agent 的状态跟环境的状态等价的时候,我们就说这个环境是 full observability,就是全部可以观测。换句话说,当 agent 能够观察到环境的所有状态时,我们称这个环境是完全可观测的(fully observed)。在给定的环境中,有效动作的集合经常被称为动作空间(action space)。像

在C中用struct实现C++中class的函数声明和定义

原先对C中的struct理解只局限在数据结构体上,看了部分linux内核代码发现struct用处很多,功能很强大,可以在C环境下实现几乎所有C++中class的用处,我写了一个很简单的一个例子:#includestruct MyClass{        char* name;        int age;        void (*funnull) ();        void (*f

使用ffmpeg编码h264,降低CPU使用率的几个方法

ffmpeg做h264编码,使用了libx264;想要降低cpu使用率,就需要牺牲图像质量;由于已经使用 baseline,就无需考虑B帧了。目前能想到的,主要是需要调控以下一些参数:1.qp值此值范围为0~51 。值越小,量化步长越小,量化的精度就越高,意味着同样画质的情况下,产生的数据量可能会更大。数值越大,图像越模糊,CPU使用率越低。2.设置编码速度preset指定编码速度,速度越慢,画质越好,cpu占用越高,可取值:ultrafast,superfast,veryfast