伦伯杰(Luenberger)状态观测器
状态观测器 (英语:State observer )是控制理论 中配合受控体的系统,在已知受控体架构的情形下,可以根据受控体的输入及输出而估测其内部的状态 ,是许多实务应用的基础。
许多的控制理论都会假设可以知道系统的状态,例如利用全状态回授 来稳定线性系统的例子。不过许多系统都无法直接量测到实际的状态,只能用状态对输出的影响来间接估计状态。像隧道中的车辆就是一个例子。车辆在隧道中的速度不易直接量测,只可以用隧道中的实际状态来估计。假如系统可观测 ,可以从输出配合状态观测器来完全估测系统的状态。
典型的观测器模型
针对线性系统的状态观测器,最常用的是线性观测器、滑动模式观测器 ,也有在线性观测器中加入立方项的观测器。以下会说明线性观测器的结构。
离散系统
线性非时变离散系统的状态方程式如下:
x
(
k
+
1
)
=
A
x
(
k
)
+
B
u
(
k
)
{\displaystyle x(k+1)=Ax(k)+Bu(k)}
y
(
k
)
=
C
x
(
k
)
+
D
u
(
k
)
{\displaystyle y(k)=Cx(k)+Du(k)}
在时间
k
{\displaystyle k}
时,
x
(
k
)
{\displaystyle x(k)}
是系统状态,
u
(
k
)
{\displaystyle u(k)}
是输入,
y
(
k
)
{\displaystyle y(k)}
是输出。状态方程式提到系统目前的输出以及未来的状态是由目前状态以及目前输入所决定。若系统有可观测性 ,可以用系统输出
y
(
k
)
{\displaystyle y(k)}
来调整状态观测器的状态。
受控体的观测器模型可以用上式来推导,也可以加入额外的项,确保观测器在持续收到系统的输入及输出时,其状态可以收敛到受控体的状态。可以将系统的输出减去观测器的输出,再乘以矩阵
L
{\displaystyle L}
,再加到状态观测器的方程式中,以产生如下式定义的伦伯杰(Luenberger)观测器。其中的状态观测器的变数会加上hat:
x
^
(
k
)
{\displaystyle {\hat {x}}(k)}
和
y
^
(
k
)
{\displaystyle {\hat {y}}(k)}
,以区隔实际系统的变数。
x
^
(
k
+
1
)
=
A
x
^
(
k
)
+
L
[
y
(
k
)
−
y
^
(
k
)
]
+
B
u
(
k
)
{\displaystyle {\hat {x}}(k+1)=A{\hat {x}}(k)+L\left[y(k)-{\hat {y}}(k)\right]+Bu(k)}
y
^
(
k
)
=
C
x
^
(
k
)
+
D
u
(
k
)
{\displaystyle {\hat {y}}(k)=C{\hat {x}}(k)+Du(k)}
观测器渐近收敛的条件是观测器误差
e
(
k
)
=
x
^
(
k
)
−
x
(
k
)
{\displaystyle e(k)={\hat {x}}(k)-x(k)}
在
k
→
∞
{\displaystyle k\rightarrow \infty }
时,可以收敛到0。此离散系统的伦伯杰观测器渐近收敛的条件是矩阵
A
−
L
C
{\displaystyle A-LC}
的特征值都在单位圆内。
因为控制的需求,观测器的输出除了作为观测器的输入,也会透过增益矩阵
K
{\displaystyle K}
,成为受控体的输入。
u
(
k
)
=
−
K
x
^
(
k
)
{\displaystyle u(k)=-K{\hat {x}}(k)}
观测器的方程式会变成:
x
^
(
k
+
1
)
=
A
x
^
(
k
)
+
L
(
y
(
k
)
−
y
^
(
k
)
)
−
B
K
x
^
(
k
)
{\displaystyle {\hat {x}}(k+1)=A{\hat {x}}(k)+L\left(y(k)-{\hat {y}}(k)\right)-BK{\hat {x}}(k)}
y
^
(
k
)
=
C
x
^
(
k
)
−
D
K
x
^
(
k
)
{\displaystyle {\hat {y}}(k)=C{\hat {x}}(k)-DK{\hat {x}}(k)}
或是
x
^
(
k
+
1
)
=
(
A
−
B
K
)
x
^
(
k
)
+
L
(
y
(
k
)
−
y
^
(
k
)
)
{\displaystyle {\hat {x}}(k+1)=\left(A-BK\right){\hat {x}}(k)+L\left(y(k)-{\hat {y}}(k)\right)}
y
^
(
k
)
=
(
C
−
D
K
)
x
^
(
k
)
{\displaystyle {\hat {y}}(k)=\left(C-DK\right){\hat {x}}(k)}
因为控制理论中的分离原理 ,可将估测器以及控制器分开设计, 因此可以选择
K
{\displaystyle K}
和
L
{\displaystyle L}
,以达到系统的整体稳定性。根据经验法则,会选择观测器
A
−
L
C
{\displaystyle A-LC}
的极点,使其比系统
A
−
B
K
{\displaystyle A-BK}
极点快十倍以上。
连续系统
连续系统中的观测器和离散系统中的类似。会选择观测器增益
L
{\displaystyle L}
使连续系统误差可以渐近收敛到0(当
A
−
L
C
{\displaystyle A-LC}
为赫维兹矩阵 时会成立)
针对连续时间线性系统
x
˙
=
A
x
+
B
u
,
{\displaystyle {\dot {x}}=Ax+Bu,}
y
=
C
x
+
D
u
,
{\displaystyle y=Cx+Du,}
其中
x
∈
R
n
,
u
∈
R
m
,
y
∈
R
r
{\displaystyle x\in \mathbb {R} ^{n},u\in \mathbb {R} ^{m},y\in \mathbb {R} ^{r}}
,观测器类似以上离散系统的例子:
x
^
˙
=
A
x
^
+
B
u
+
L
(
y
−
y
^
)
{\displaystyle {\dot {\hat {x}}}=A{\hat {x}}+Bu+L\left(y-{\hat {y}}\right)}
.
y
^
=
C
x
^
+
D
u
,
{\displaystyle {\hat {y}}=C{\hat {x}}+Du,}
观测器误差
e
=
x
−
x
^
{\displaystyle e=x-{\hat {x}}}
会满足下式
e
˙
=
(
A
−
L
C
)
e
{\displaystyle {\dot {e}}=(A-LC)e}
.
若
[
A
,
C
]
{\displaystyle [A,C]}
有可观测性 ,可以适当选择观测器增益
L
{\displaystyle L}
,以调整矩阵
A
−
L
C
{\displaystyle A-LC}
的特征值。另外,也可以使矩阵
A
−
L
C
{\displaystyle A-LC}
为赫维兹矩阵 ,让观测器误差
e
(
t
)
{\displaystyle e(t)}
可以渐近收敛到0。
峰值现象以及其他的观测器技术
若观测器增益
L
{\displaystyle L}
很高,线性的伦伯杰观测器会很快收敛,但大增益会造成峰值现象(peaking phenomenon),初始的观测器误差会非常大,在实际使用上不安全[ 1] 。因此,会用非线性高增益观测技术,可以快速收敛,又没有峰值现象。例如可以在观测器中使用滑动模式控制 技术(滑动模式观测器 ),使观测器在有量测误差的情形下,在有限时间内使观测器状态误差变成零,其他有误差的状态,其行为会类似峰值减弱后的伦伯杰观测器。滑动模式观测器类似卡尔曼滤波 ,有较理想的抗噪声能力[ 2] [ 3] 。
另一种作法是用多观测器(multi observer),可以显著的改善暂态,抑制观测器的过冲。多观测器可以适用在所有适用高增益的系统[ 4] 。
非线性系统的状态观测器
针对非线性系统 ,最常用的是高增益状态观测器、滑动模式观测器 以及扩展观测器。
为了说明非线性系统中的状态观测器,先考虑以下的无输入非线性系统:
x
˙
=
f
(
x
)
{\displaystyle {\dot {x}}=f(x)}
其中
x
∈
R
n
{\displaystyle x\in \mathbb {R} ^{n}}
,也假设有量测输出
y
∈
R
{\displaystyle y\in \mathbb {R} }
如下
y
=
h
(
x
)
.
{\displaystyle y=h(x).}
有许多设计观测器的非近似式作法。以下提到的观测器也可以适用于有输入的系统
x
˙
=
f
(
x
)
+
B
(
x
)
u
,
{\displaystyle {\dot {x}}=f(x)+B(x)u,}
y
=
h
(
x
)
,
{\displaystyle y=h(x),}
.
线性化误差动态系统
Krener和Isidori[ 5] ,以及Krener和Respondek[ 6] 有针对状态观测器的研究,若存在可线性化的转换(微分同胚 ,类似回授线性化 )
z
=
Φ
(
x
)
{\displaystyle z=\Phi (x)}
,使新变数的系统方程如下
z
˙
=
A
z
+
ϕ
(
y
)
,
{\displaystyle {\dot {z}}=Az+\phi (y),}
y
=
C
z
.
{\displaystyle y=Cz.}
伦伯杰观测器可以设计为
z
^
˙
=
A
z
^
+
ϕ
(
y
)
−
L
(
C
z
^
−
y
)
{\displaystyle {\dot {\hat {z}}}=A{\hat {z}}+\phi (y)-L\left(C{\hat {z}}-y\right)}
.
转换后变数
e
=
z
^
−
z
{\displaystyle e={\hat {z}}-z}
的观测器误差可以满足同一个方程式
e
˙
=
(
A
−
L
C
)
e
{\displaystyle {\dot {e}}=(A-LC)e}
.
Gauthier、Hammouri和Othman[ 7]
and Hammouri and Kinnaert[ 8] 已证明,若存在变换
z
=
Φ
(
x
)
{\displaystyle z=\Phi (x)}
,使系统可以转换为以下的型式
z
˙
=
A
(
u
(
t
)
)
z
+
ϕ
(
y
,
u
(
t
)
)
,
{\displaystyle {\dot {z}}=A(u(t))z+\phi (y,u(t)),}
y
=
C
z
,
{\displaystyle y=Cz,}
则观测器可以设计如下
z
^
˙
=
A
(
u
(
t
)
)
z
^
+
ϕ
(
y
,
u
(
t
)
)
−
L
(
t
)
(
C
z
^
−
y
)
{\displaystyle {\dot {\hat {z}}}=A(u(t)){\hat {z}}+\phi (y,u(t))-L(t)\left(C{\hat {z}}-y\right)}
,
其中
L
(
t
)
{\displaystyle L(t)}
是时变的观测器增益。
Ciccarella、Dalla Mora和Germani[ 9] 有提供更进阶以及一般性的结果,只需要简单的规律性(regularity)假设,不需要非线性的转换,证明观测状态可以全域收敛到实际状态。
多观测器
多观测器(Multi observer)是高增益观测器的扩展,由一个观测器到多个观测器一起使用,可以让多个模型同时作用。多观测器会分为二层:一层包括了多个高增益观测器,有相关同一组状态旳不同的估测量,第二层决定第一层各估测量的权重。此算法很容易实现,其中也没有微分等有危险性的运算[ 4] 。多观测器的概念最早曾应用在适应控制中,用来取得资讯[ 10] 。
假设高增益观测器有n+1个
x
k
^
˙
(
t
)
=
A
x
k
^
(
t
)
+
B
ϕ
0
(
x
^
(
t
)
,
u
(
t
)
)
−
L
(
y
k
^
(
t
)
−
y
(
t
)
)
{\displaystyle {\dot {\hat {x_{k}}}}(t)=A{\hat {x_{k}}}(t)+B\phi _{0}({\hat {x}}(t),u(t))-L({\hat {y_{k}}}(t)-y(t))}
y
k
^
(
t
)
=
C
x
k
^
(
t
)
{\displaystyle {\hat {y_{k}}}(t)=C{\hat {x_{k}}}(t)}
其中
k
=
1...
n
+
1
{\displaystyle k=1...n+1}
是观测器的编号。第一层的观测器包括了相同的增益
L
{\displaystyle L}
,但其启始状态
x
k
(
0
)
{\displaystyle x_{k}(0)}
不同。在第二层中会将所有
x
k
(
t
)
{\displaystyle x_{k}(t)}
(
k
=
1...
n
+
1
{\displaystyle k=1...n+1}
)观测器的结果合并为一个,以得到单一状态向量的估测值
y
k
^
(
t
)
=
∑
k
=
1
n
+
1
α
k
(
t
)
x
k
^
(
t
)
{\displaystyle {\hat {y_{k}}}(t)=\sum \limits _{k=1}^{n+1}\alpha _{k}(t){\hat {x_{k}}}(t)}
其中
α
k
∈
R
{\displaystyle \alpha _{k}\in \mathbb {R} }
是加权因子。这些因子会改变,以提供第二层的估测用,并且提升观测器的效果。
假设
∑
k
=
1
n
+
1
α
k
(
t
)
ξ
k
(
t
)
=
0
{\displaystyle \sum \limits _{k=1}^{n+1}\alpha _{k}(t)\xi _{k}(t)=0}
且
∑
k
=
1
n
+
1
α
k
(
t
)
=
1
{\displaystyle \sum \limits _{k=1}^{n+1}\alpha _{k}(t)=1}
其中
ξ
k
∈
R
n
×
1
{\displaystyle \xi _{k}\in \mathbb {R} ^{n\times 1}}
是某向量,会和第
k
{\displaystyle k}
个估测器的误差
e
k
(
t
)
{\displaystyle e_{k}(t)}
有关。
经过转换,可以得到以下的线性回归问题
[
−
ξ
n
+
1
(
t
)
]
=
[
ξ
1
(
t
)
−
ξ
n
+
1
(
t
)
…
ξ
k
(
t
)
−
ξ
n
+
1
(
t
)
…
ξ
n
(
t
)
−
ξ
n
+
1
(
t
)
]
T
[
α
1
(
t
)
⋮
α
k
(
t
)
⋮
α
n
(
t
)
]
{\displaystyle [-\xi _{n+1}(t)]=[\xi _{1}(t)-\xi _{n+1}(t)\dots \xi _{k}(t)-\xi _{n+1}(t)\dots \xi _{n}(t)-\xi _{n+1}(t)]^{T}{\begin{bmatrix}\alpha _{1}(t)\\\vdots \\\alpha _{k}(t)\\\vdots \\\alpha _{n}(t)\end{bmatrix}}}
根据上式,有可能估算
α
k
(
t
)
{\displaystyle \alpha _{k}(t)}
。为了要建构流形,需要映射
m
:
R
n
→
R
n
{\displaystyle m:\mathbb {R} ^{n}\rightarrow \mathbb {R} ^{n}}
在
ξ
k
(
t
)
=
m
(
e
k
(
t
)
)
{\displaystyle \xi _{k}(t)=m(e_{k}(t))}
之间,并且保证可以用可量测的讯号来计算
ξ
k
(
t
)
{\displaystyle \xi _{k}(t)}
。
首先要从观测器误差中消除
α
k
(
t
)
{\displaystyle \alpha _{k}(t)}
的峰值现象
e
σ
(
t
)
=
∑
k
=
1
n
+
1
α
k
(
t
)
e
k
(
t
)
{\displaystyle e_{\sigma }(t)=\sum \limits _{k=1}^{n+1}\alpha _{k}(t)e_{k}(t)}
.
将
η
k
(
t
)
=
y
^
k
(
t
)
−
y
(
t
)
{\displaystyle \eta _{k}(t)={\hat {y}}_{k}(t)-y(t)}
针算
n
{\displaystyle n}
的微分,可以找到以下的值
ξ
k
(
t
)
{\displaystyle \xi _{k}(t)}
ξ
k
(
t
)
=
[
1
0
0
⋯
0
C
L
1
0
⋯
0
C
A
L
C
L
1
⋯
0
C
A
2
L
C
A
L
C
L
⋯
0
⋮
⋮
⋮
⋱
C
A
n
−
2
L
C
A
n
−
3
L
C
A
n
−
4
L
⋯
1
]
[
∫
t
−
t
d
t
n
−
1
⋯
∫
t
−
t
d
t
η
k
(
τ
)
d
τ
⋮
η
(
t
)
−
η
(
t
−
(
n
−
1
)
t
d
)
]
{\displaystyle \xi _{k}(t)={\begin{bmatrix}1&0&0&\cdots &0\\CL&1&0&\cdots &0\\CAL&CL&1&\cdots &0\\CA^{2}L&CAL&CL&\cdots &0\\\vdots &\vdots &\vdots &\ddots \\CA^{n-2}L&CA^{n-3}L&CA^{n-4}L&\cdots &1\end{bmatrix}}{\begin{bmatrix}\int \limits _{t-t_{d}}^{t}{{n-1} \atop \cdots }\int \limits _{t-t_{d}}^{t}\eta _{k}(\tau )d\tau \\\vdots \\\eta (t)-\eta (t-(n-1)t_{d})\end{bmatrix}}}
其中
t
d
>
0
{\displaystyle t_{d}>0}
是某时间常数。
ξ
k
(
t
)
{\displaystyle \xi _{k}(t)}
和
η
k
(
t
)
{\displaystyle \eta _{k}(t)}
和其积分有关,因此可以应用在控制系统上。
而且
α
k
(
t
)
{\displaystyle \alpha _{k}(t)}
是在估测律中指定,因此此流形可以量测。第二层
α
^
k
(
t
)
{\displaystyle {\hat {\alpha }}_{k}(t)}
,其中
k
=
1
…
n
+
1
{\displaystyle k=1\dots n+1}
是用来估测
α
k
(
t
)
{\displaystyle \alpha _{k}(t)}
系数。其映射误差定义为
e
ξ
(
t
)
=
∑
k
=
1
n
+
1
α
^
k
(
t
)
ξ
k
(
t
)
{\displaystyle e_{\xi }(t)=\sum \limits _{k=1}^{n+1}{\hat {\alpha }}_{k}(t)\xi _{k}(t)}
其中
e
ξ
(
t
)
∈
R
n
×
1
,
α
^
k
(
t
)
∈
R
{\displaystyle e_{\xi }(t)\in \mathbb {R} ^{n\times 1},{\hat {\alpha }}_{k}(t)\in \mathbb {R} }
。若系数
α
^
(
t
)
{\displaystyle {\hat {\alpha }}(t)}
等于
α
k
(
t
)
{\displaystyle \alpha _{k}(t)}
,映射误差
e
ξ
(
t
)
=
0
{\displaystyle e_{\xi }(t)=0}
。因此可用上式来计算
x
^
{\displaystyle {\hat {x}}}
,因为流形的特形,可以减少峰值现象。所创建的映射提供估测过程中许多的弹性。甚至可以在第二层估计
x
(
t
)
{\displaystyle x(t)}
的值,以计算状态
x
{\displaystyle x}
[ 4]
边界观测器
边界观测器(Bounding observers)[ 11] 或区间观测器(Interval observers)[ 12] [ 13] 是一组特殊的观测器,会同时提供一个状态的二个估测值,分别是真实值的上限和下限。真实值会在上下限估测范围内。
边界范围在实际应用上非常重要[ 14] [ 15] ,可以知道每一个估测的精准度。
在数学上,若适当的选择
L
{\displaystyle L}
,可以用二种伦伯杰观测器来达到正向系统 特性[ 16] :一个是上限
x
^
U
(
k
)
{\displaystyle {\hat {x}}_{U}(k)}
(在没有噪声及不确定性 的情形下,确保在
k
→
∞
{\displaystyle k\rightarrow \infty }
时,
e
(
k
)
=
x
^
U
(
k
)
−
x
(
k
)
{\displaystyle e(k)={\hat {x}}_{U}(k)-x(k)}
在零以上收敛到零),另一个是下限
x
^
L
(
k
)
{\displaystyle {\hat {x}}_{L}(k)}
(确保在
k
→
∞
{\displaystyle k\rightarrow \infty }
时,
e
(
k
)
=
x
^
L
(
k
)
−
x
(
k
)
{\displaystyle e(k)={\hat {x}}_{L}(k)-x(k)}
在零以下收敛到零)。因此
x
^
U
(
k
)
≥
x
(
k
)
≥
x
^
L
(
k
)
{\displaystyle {\hat {x}}_{U}(k)\geq x(k)\geq {\hat {x}}_{L}(k)}
恒成立。
参考资料
^ Khalil, H.K., Nonlinear Systems 3rd, Upper Saddle River, NJ: Prentice Hall, 2002 [2021-02-19 ] , ISBN 978-0-13-067389-3 , (原始内容存档 于2017-07-25)
^ Utkin, Vadim; Guldner, Jürgen; Shi, Jingxin, Sliding Mode Control in Electromechanical Systems, Philadelphia, PA: Taylor & Francis, Inc., 1999, ISBN 978-0-7484-0116-1
^ Drakunov, S.V., An adaptive quasioptimal filter with discontinuous parameters, Automation and Remote Control, 1983, 44 (9): 1167–1175
^ 4.0 4.1 4.2 Bernat, J.; Stepien, S., Multi modelling as new estimation schema for High Gain Observers, International Journal of Control, 2015, 88 (6): 1209–1222, Bibcode:2015IJC....88.1209B , S2CID 8599596 , doi:10.1080/00207179.2014.1000380
^ Krener, A.J.; Isidori, Alberto, Linearization by output injection and nonlinear observers, System and Control Letters, 1983, 3 : 47–52, doi:10.1016/0167-6911(83)90037-3
^ Krener, A.J.; Respondek, W., Nonlinear observers with linearizable error dynamics, SIAM Journal on Control and Optimization, 1985, 23 (2): 197–216, doi:10.1137/0323016
^ Gauthier, J.P.; Hammouri, H.; Othman, S., A simple observer for nonlinear systems applications to bioreactors, IEEE Transactions on Automatic Control, 1992, 37 (6): 875–880, doi:10.1109/9.256352
^ Hammouri, H.; Kinnaert, M., A New Procedure for Time-Varying Linearization up to Output Injection, System and Control Letters, 1996, 28 (3): 151–157, doi:10.1016/0167-6911(96)00022-9
^ Ciccarella, G.; Dalla Mora, M.; Germani, A., A Luenberger-like observer for nonlinear systems, International Journal of Control, 1993, 57 (3): 537–556, doi:10.1080/00207179308934406
^ Narendra, K.S.; Han, Z. A new approach to adaptive control using multiple models. International Journal of Adaptive Control and Signal Processing. August 2012, 26 (8): 778–799. ISSN 1099-1115 . doi:10.1002/acs.2269 .
^ 存档副本 (PDF) . [2021-02-19 ] . (原始内容存档 (PDF) 于2015-05-06).
^ 存档副本 (PDF) . [2021-02-19 ] . (原始内容存档 (PDF) 于2016-03-04).
^ 存档副本 . [2021-02-19 ] . (原始内容存档 于2020-03-19).
^ 存档副本 (PDF) . [2021-02-19 ] . (原始内容存档 (PDF) 于2020-05-18).
^ Hadj-Sadok, M.Z.; Gouzé, J.L. Estimation of uncertain models of activated sludge processes with interval observers. Journal of Process Control. 2001, 11 (3): 299–310. doi:10.1016/S0959-1524(99)00074-8 .
^ Ait Rami, M., Tadeo, F., Helmke, U. (2011),
"Positive observers for linear positive systems, and their implications",
International Journal of Control 84
Sontag, Eduardo, Mathematical Control Theory: Deterministic Finite Dimensional Systems. Second Edition, Springer, 1998, ISBN 0-387-98489-5
相关条目