自抗扰控制中的扩张状态观测器收敛性分析1

325 阅读 0 评论 215 点赞

我是靠谱客的博主儒雅小虾米，这篇文章主要介绍自抗扰控制中的扩张状态观测器收敛性分析1，现在分享给大家，希望可以做个参考。

扩张状态观测器(extended state observer, ESO)是自抗扰控制(active disturbance rejection control, ADRC)的核心组成部分，在自抗扰控制的相关文献中大都会反复出现ESO和ADRC这两个英文缩写词。关于ADRC的具体思想和设计方法可以参见其发明者韩京清的专著[1]，不过，专著[1]中更多地从工程角度对ADRC进行分析，而本文则主要是分析ESO论文证明的套路，也作为自己学习ADRC的一个总结，涉及到的文献则主要为[2]和[3]。

ESO的主要思想在于将包括干扰在内的系统中所有不确定的部分统一视为系统的一个新状态，即对原系统扩张了一个状态，然后设计观测器去估计这个状态。一旦实现对这个新状态的估计，那么在后面的控制律中直接将这个估计值减去，就认为达到了消除不确定性的目的，然后就可以采用任何能够保证剩下已知部分模型稳定的控制律来保证控制性能。从这个角度说，ESO其实承担了ADRC的绝大部分压力，ADRC有效的前提是ESO能够实现对扩张状态快速有效的估计。需要指出的是，ESO在设计过程中也借鉴了现有观测器的经验，而且与HK Khalil的专著[4]中提到的高增益观测器有类似之处，本质上均属于奇异摄动，即需要观测器的状态足够快。特别地，在线性情形下，ESO与文献[5]中的扩张高增益观测器具有相同形式，可见奇妙的思想总是相通的。

下面以文献[2]为主要内容，对ESO的收敛性分析进行说明。控制理论方面的论文喜欢利用微分方程(包括常微分方程和偏微分方程)作为工具进行数学公式推导，从这个角度来说，我一直将控制理论的研究等效描述成微分方程解的稳定性，过分关注数学模型也是导致控制理论和控制工程存在巨大gap很重要的原因，这里不展开说了，毕竟我们这里的关注重点是ESO论文的思路，为想自己撰写ADRC方面论文的读者提供借鉴和参考。

我们主要考虑如下 $n$ 阶常微分方程描述的模型(或者所谓的积分形式系统)：

$&dot{x}_1(t)=x_2(t),;x_1(0)=x_{10},\ &dot{x}_2(t)=x_3(t),;x_2(0)=x_{20},\ &vdots\ &dot{x}_n(t)=f(t,x_1(t),x_2(t),ldots,x_n(t))+w(t)+u(t),;x_n(0)=x_{n0},\ &y(t)=x_1(t), end{aligned}right.tag{1}$

其中， $x_1,ldots,x_n$ 为状态， $u$ 为控制输入， $y$ 为输出， $f$ 为未知非线性函数， $w$ 为外部干扰， $x_{10},ldots,x_{n0}$ 为状态初值，式(1)也称为单输入单输出系统。ESO将 $f + w$ 称为“总扰动”，并令 $x_{n+1}=f+w$ ， $x_{n+1}$ 称为扩张状态(即相对于原系统多出了一阶)，进而设计观测器去估计这个扩张状态，这就是ESO名称的主要由来。为了理论推导可以继续，首先需要假设可导，具体地，有

假设1 ： $f$ 和 $w$ 对各自的自变量连续可导，且有

$+sumlimits_{i=1}^{n}leftvertfrac{partial f}{partial x_i}rightvertleq c_0+sumlimits_{j=1}^{n}c_jleftvert x_jrightvert^k,$

其中， $c_j$ ， $j = 0, 1, \dots, n$ 为正常数， $k$ 为正整数。

在假设1的前提下，系统(1)可重新写为
$&dot{x}_1(t)=x_2(t),;x_1(0)=x_{10},\ &dot{x}_2(t)=x_3(t),;x_2(0)=x_{20},\ &vdots\ &dot{x}_n(t)=x_{n+1}(t),;x_n(0)=x_{n0},\ &dot{x}_{n+1}(t)=dot{L}(t),;x_{n+1}(0)=L(0),\ &y(t)=x_1(t), end{aligned}right.tag{2}$
其中， $L(t)=f(t,x_1(t),x_2(t),ldots,x_n(t))+w(t)$ 。针对系统(2)，ESO设计为如下形式：
$&dot{hat{x}}_1(t)=hat{x}_2(t)+epsilon^{n-1}g_1left(frac{y(t)-hat{x}_1(t)}{varepsilon^n}right),\ &dot{hat{x}}_2(t)=hat{x}_3(t)+epsilon^{n-2}g_2left(frac{y(t)-hat{x}_1(t)}{varepsilon^n}right),\ &vdots\ &dot{hat{x}}_n(t)=x_{n+1}(t)+g_nleft(frac{y(t)-hat{x}_1(t)}{varepsilon^n}right)+u(t),\ &dot{hat{x}}_{n+1}(t)=frac{1}{epsilon}g_{n+1}left(frac{y(t)-hat{x}_1(t)}{varepsilon^n}right), end{aligned}right.tag{3}$
其中， $g_i$ ， $i = 1, 2, \dots, n + 1$ 为设计函数， $ε$ 为增益，当 $g_i$ 取线性形式时，即可得到扩张高增益观测器：
$&dot{hat{x}}_1(t)=hat{x}_2(t)+frac{alpha_1}{epsilon}left(y(t)-hat{x}_1(t)right),\ &dot{hat{x}}_2(t)=hat{x}_3(t)+frac{alpha_2}{epsilon^2}left(y(t)-hat{x}_1(t)right),\ &vdots\ &dot{hat{x}}_n(t)=x_{n+1}(t)+frac{alpha_n}{epsilon^n}left(y(t)-hat{x}_1(t)right)+u(t),\ &dot{hat{x}}_{n+1}(t)=frac{alpha_{n+1}}{epsilon^{n+1}}left(y(t)-hat{x}_1(t)right), end{aligned}right.tag{4}$
其中， $alpha_i$ ， $i = 1, 2, \dots, n + 1$ 为设计常数。

下面开始分析ESO(3)的收敛性，为此，进一步有下面两个假设，在后面可以看到作出这两个假设的作用，简单来说就是先用Lyapunov函数推导稳定性，然后发现如果不作这样的假设就推导不下去，因此就这样假设了(可以说这是大部分控制理论领域论文偏离工程实际的主要原因，一切为Lyapunov稳定性推导服务，最后演变成做数学习题模式，颇有自娱自乐之意)：

假设2： $w$ 和系统(1)的解满足对各自的自变量连续可导，且对 $i = 1, 2, \dots, n$ 均有 $x_i(t)rightvertleq B$ ， $B > 0$ 为常数， $t \geq 0$ 。

假设3：存在常数 $lambda_i(i=1,2,3,4)$ ， $α$ ， $β$ 和正定连续可微函数 $V$ ， $W$ ： $mathbb{R}^{n+1}rightarrowmathbb{R}$ 使得

$lambda_1Vert yVert^2leq V(y)leqlambda_2Vert yVert^2$ ， $lambda_3Vert yVert^2leq W(y)leqlambda_4Vert yVert^2$ ，
$sumlimits_{i=1}^{n}frac{partial V}{partial y_i}(y_{i+1}-g_i(y_1))- frac{partial V}{partial y_{n+1}}g_{n+1}(y_1)leq -W(y)$ ，
$y_{n+1}}rightvertleqbeta Vert yVert$ ，

其中， $y=(y_1,y_2,ldots,y_{n+1})$ ， $∥ \cdot ∥$ 为Euclid范数。

下面就可以提出定理了(控制理论论文的通常模式就是提出一个定理，然后用大量篇幅去证明，各种秀公式，当然，为了使得公式能秀下去，先在前面作出一大堆假设，事实上，一般是先推导，根据推导进行的程度作出假设，因此可以说是先有证明，后有假设)。

定理1：若假设1-假设3成立，则有
(i) 对每一个正常数 $a$ ， $limlimits_{varepsilonrightarrow 0}vert x_i(t)-hat{x}_i(t)vert=0$ 对 $t \in [a, \infty)$ 一致成立；
(ii) $limlimits_{trightarrow infty}vert x_i(t)-hat{x}_i(t)vertleq O(varepsilon^{n+2-i})$ 。
其中， $x_i$ ， $hat{x}_i$ 分别为系统(1)和ESO(3)的解， $i = 1, 2, \dots, n + 1$ ， $x_{n+1}=f+w$ 为系统(1)的扩张状态。

证明：首先分析 $\dot{L} (t)$ （或者说是 $dot{x}_{n+1}(t)$ ）的有界性，写出其表达式且变换时间坐标，有
$Delta(t)=&left.frac{mathrm{d}}{mathrm{d}s}f(s,x_1(s),ldots,x_n(s))right|_{s=varepsilon t}+dot{w}(varepsilon t)\ =&frac{partial}{partial t}f(varepsilon t,x_1(varepsilon t),ldots,x_n(varepsilon t)) +sum_{i=1}^{n}x_{i+1}(varepsilon t)frac{partial}{partial x_i}f(varepsilon t,x_1(varepsilon t),ldots,x_n(varepsilon t))\ &+u(varepsilon t)frac{partial}{partial x_n}f(varepsilon t,x_1(varepsilon t),ldots,x_n(varepsilon t)) +dot{w}(varepsilon t). end{aligned}tag{5}$

发现了没有？ $Δ (t)$ 其实就是 $L (t)$ （或者说是 $x_{n+1}(t)$ ）在 $ε t$ 处导数的取值。根据假设1和假设2，只要 $ε$ 为正，不管 $ε$ 取值多小， $Δ (t)$ 都是有界的，也就是说存在 $ε$ 和无关的正常数 $M > 0$ 使得 $∥ Δ (t) ∥ \leq M$ 对所有 $t \geq 0$ 均成立。注意到“不确定项 $L (t)$ 导数的界和 $Δ (t)$ 无关”这个性质相当重要，是证明ESO收敛和整个ADRC稳定的关键，该性质表明，在Lyapunov稳定性框架下，理论上可以通过任意改变 $ε$ 的取值(前提是 $ε$ 为正)来压缩与不确定项有关的交叉项来使得闭环系统稳定，在下面的分析中可以很明显地看到这一点。

既然要分析ESO的收敛性，自然要看估计误差的表现，因此定义

$e_i(t)=x_i(t)-hat{x}_i(t),;eta_i(t)=frac{e_i(varepsilon t)}{varepsilon^{n+1-i}},;i=1,2,ldots,n+1,tag{6}$

其中，定义 $eta_i(t)$ 的技巧来自于文献[4]，这里对时间坐标稍作改变，不影响实质，或者说 $e_i(t)$ 是直接的估计误差，而 $eta_i(t)$ 则是处于收敛性分析需要而定义的一种尺度化估计误差，令 $eta=[eta_1,eta_2,ldots,eta_{n+1}]^mathrm{T}$ ，写出 $η$ 系统应满足的微分方程，则有

$&dot{eta}_1(t)=eta_2(t)-g_1(eta_1(t)),eta_1(0)=frac{e_1(0)}{varepsilon^n},\ &dot{eta}_2(t)=eta_3(t)-g_2(eta_1(t)),eta_2(0)=frac{e_2(0)}{varepsilon^{n-1}},\ &vdots\ &dot{eta}_n(t)=eta_{n+1}(t)-g_n(eta_1(t)),eta_n(0)=frac{e_n(0)}{varepsilon},\ &dot{eta}_{n+1}(t)=-g_{n+1}(eta_1(t))+varepsilonDelta(t),eta_{n+1}(0)=e_{n+1}(0). end{aligned}right.tag{7}$

现在可以看到假设3的作用了，假设3是在Lyapunov稳定性框架下作出的，即相当于认为一旦设计选取的函数 $g_i$ ， $i = 1, 2, \dots, n + 1$ 确定好以后，就存在一个合适的Lyapunov函数 $V$ ，使得该Lyapunov函数 $V$ 沿着 $η$ 系统的导数满足一定性质，这是Lyapunov稳定性证明的常用套路。有些论文为了所谓的严谨性，会在证明中说选取一个准Lyapunov函数，因为它们认为只有最后证明了一个函数沿系统的导数满足Lyapunov稳定性框架下的性质，才能称之为Lyapunov函数，不过这也只是玩玩文字游戏罢了，不改变问题实质。为了在理论上凸显逼格，这里没有限定 $g_i$ 的具体形式，因此也无法给出Lyapunov函数的一般形式。根据假设3，可以得到

$=&sum_{i=1}^{n}frac{partial V}{partial eta_i}(eta_{i+1}-g_i(eta_1)) -frac{partial V}{partial eta_{n+1}}g_{n+1}(eta_1) +frac{partial V}{partial eta_{n+1}}varepsilonDelta\ leq&-W(eta)+varepsilon MbetaVertetaVert leq-frac{lambda_3}{lambda_2}V(eta)+frac{sqrt{lambda_1}}{lambda_1}varepsilon Mbetasqrt{V(eta)}.end{aligned}tag{8}$

根据 $V (η (t))$ 和 $V (η (t))$ 的关系，进一步有

$-frac{lambda_3}{2lambda_2}sqrt{V(eta(t))}+frac{sqrt{lambda_1}varepsilon Mbeta}{2lambda_1}.tag{9}$

再一次根据假设3，有

$Verteta(t)Vertleqsqrt{frac{V(eta(t))}{lambda_1}} leqfrac{sqrt{lambda_1V(eta(0))}}{lambda_1}mathrm{e}^{-frac{lambda_3}{2lambda_2}t} +frac{varepsilon Mbeta}{2lambda_1}int_{0}^{t}mathrm{e}^{-frac{lambda_3}{2lambda_2}(t-s)}mathrm{d}s.tag{10}$

最后根据 $η (t)$ 和 $e (t)$ 的关系可得

$e_i(t)vert&=varepsilon^{n+1-i}leftverteta_ileft(frac{t}{varepsilon}right)rightvert leqvarepsilon^{n+1-i}leftVertetaleft(frac{t}{varepsilon}right)rightVert\ &leqvarepsilon^{n+1-i}left[ frac{sqrt{lambda_1V(eta(0))}}{lambda_1}mathrm{e}^{-frac{lambda_3 t}{2lambda_2varepsilon}} +frac{varepsilon Mbeta}{2lambda_1}int_{0}^{frac{t}{varepsilon}}mathrm{e}^{-frac{lambda_3}{2lambda_2}(t/varepsilon-s)}mathrm{d}sright].end{aligned}tag{11}$

可见对 $t \in [a, \infty)$ ，当 $ε \to 0$ 时 $e_i(t)vertrightarrow 0$ 一致成立，定理1的两个结论都可以从上式推得，证毕。

需要说明的是，当 $g_i$ 取为线性形式时，Lyapunov函数可以取为系统状态的二次函数，因为此时 $η$ 系统可以写为

$&dot{eta}_1(t)=eta_2(t)-alpha_1eta_1(t),eta_1(0)=frac{e_1(0)}{varepsilon^n},\ &dot{eta}_2(t)=eta_3(t)-alpha_2eta_1(t),eta_2(0)=frac{e_2(0)}{varepsilon^{n-1}},\ &vdots\ &dot{eta}_n(t)=eta_{n+1}(t)-alpha_neta_1(t),eta_n(0)=frac{e_n(0)}{varepsilon},\ &dot{eta}_{n+1}(t)=-alpha_{n+1}eta_1(t)+varepsilonDelta(t),eta_{n+1}(0)=e_{n+1}(0). end{aligned}right.tag{12}$

此时，只要如下矩阵为Hurwitz：

$-alpha_1 & 1 & 0 & cdots & 0\ -alpha_2 & 0 & 1 & cdots & 0\ vdots & vdots & vdots &ddots &vdots\ -alpha_n & 0 & 0 & cdots & 1\ -alpha_{n+1} & 0 & 0 & cdots & 0\ end{matrix}right],tag{13}$

令 $P$ 为满足Lyapunov方程 $PE+E^mathrm{T}P=-I$ 的正定矩阵， $I$ 为 $n + 1$ 维单位矩阵，则假设3中的函数 $V$ ， $W$ ： $mathbb{R}^{n+1}rightarrowmathbb{R}$ 可以定义为

$V(eta)=eta^mathrm{T}Peta,;;W(eta)=eta^mathrm{T}eta,;;forall etainmathbb{R}^{n+1}.tag{14}$

则有
$lambda_{min}(P)VertetaVert^2leq V(eta)leqlambda_{max}(P)VertetaVert^2,$

$sum_{i=1}^{n}frac{partial V}{partial eta_i}(eta_{i+1}-alpha_ieta_1)- frac{partial V}{partial eta_{n+1}}alpha_{n+1}eta_1 =-eta^mathrm{T}eta=-VertetaVert^2=-W(y),$

以及

$eta_{n+1}}rightvert leqleftVertfrac{partial V}{partial eta}rightVert =Vert2eta^mathrm{T}PVertleq 2Vert PVert VertetaVert =2lambda_{max}(P)Vert etaVert,$

其中， $lambda_{max}(P)$ 和 $lambda_{min}(P)$ 分别为 $P$ 的最大和最小特征值。可见此时假设3中的条件是满足的，因此对于线性形式的ESO可以直接利用上面的证明过程得到收敛性结论。

到这里，关于ESO的收敛性分析已经完成了第一部分，文献[2]进一步放宽了假设3的条件，将ESO的收敛性分析进行推广，而文献[3]则进一步考虑了下三角形式系统的ESO设计和收敛性分析，我们将在下一篇博客中再详细分析。

参考文献

[1]韩京清. 自抗扰控制技术: 估计补偿不确定因素的控制技术[M]. 国防工业出版社, 2008.

[2]Guo B Z, Zhao Z. On the convergence of an extended state observer for nonlinear systems with uncertainty[J]. Systems & Control Letters, 2011, 60(6): 420-430.

[3]Zhao Z L, Guo B Z. Extended state observer for uncertain lower triangular nonlinear systems[J]. Systems & Control Letters, 2015, 85: 100-108.

[4]Khalil H K. Nonlinear systems[M]. Prentice-Hall, 2001.

[5]Freidovich L B, Khalil H K. Performance recovery of feedback-linearization-based designs[J]. IEEE Transactions on automatic control, 2008, 53(10): 2324-2334.