跳转到内容

LQR控制器

维基百科，自由的百科全书

此条目需要补充更多来源。 (2018年2月13日)
请协助补充多方面可靠来源以改善这篇条目，无法查证的内容可能会因为异议提出而被移除。
致使用者：请搜索一下条目的标题（来源搜索："LQR控制器" — 网页、新闻、书籍、学术、图像），以检查网络上是否存在该主题的更多可靠来源（判定指引）。

最优控制理论主要探讨的是让动力系统以在最小成本来运作，若系统动态可以用一组线性微分方程表示，而其成本为二次泛函，这类的问题称为线性二次（LQ）问题。此类问题的解即为线性二次调节器（英语：linear–quadratic regulator），简称LQR。

LQR是回授控制器，方程式在后面会提到。LQR是LQG（线性二次高斯）问题解当中重要的一部份。而LQG问题和LQR问题都是控制理论中最基础的问题之一。

简介

控制机器（例如飞机）的控制器，或是控制制程（例如化学反应）的控制器，可以进行最佳控制，方式是先设定成本函数，再由工程师设定加权，利用数学演算法来找到使成本函数最小化的设定值。成本函数一般会定义为主要量测量（例如飞行高度或是制程温度）和理想值的偏差的和。演算法会设法调整参数，让这些不希望出现的偏差降到最小。而控制量的大小本身也会包括在成本函数中。

LQR演算法减少了工程师为了让控制器最佳化，而需付出的心力。不过工程师仍然要列出成本函数的相关参数，并且将结果和理想的设计目标比较。因此控制器的建构常会是迭代的，工程师在模拟过程中决定最佳控制器，再去调整参数让结果更接近设计目标。

在本质上，LQR演算法是找寻合适状态回授控制器的自动化方式。因此也常会有控制工程师用其他替代方式，例如全状态回授（也称为极点安置）的作法，此作法对控制器参数和控制器性能之间的关系比较明确。而LQR演算法的困难之处在找合适的加权因子，这也限制了以LQR控制器合成的相关应用。

有限时间长度，连续时间的LQR

方程式如下的连续时间线性系统， $t\in [t_{0},t_{1}]$ ：

{\dot {x}}=Ax+Bu

其二次成本泛函为

J=x^{T}(t_{1})F(t_{1})x(t_{1})+\int \limits _{t_{0}}^{t_{1}}\left(x^{T}Qx+u^{T}Ru+2x^{T}Nu\right)dt

其中F、Q和R都是正定矩阵。

可以让成本最小化的回授控制律为

u=-Kx\,

其中 $K$ 为

K=R^{-1}(B^{T}P(t)+N^{T})\,

而 $P$ 是连续时间Riccati方程的解：

A^{T}P(t)+P(t)A-(P(t)B+N)R^{-1}(B^{T}P(t)+N^{T})+Q=-{\dot {P}}(t)\,

边界条件如下

P(t_{1})=F(t_{1}).

J_min的一阶条件如下

(i) 状态方程

{\dot {x}}=Ax+Bu

(ii) 协态方程

-{\dot {\lambda }}=Qx+Nu+A^{T}\lambda

(iii) 静止方程

0=Ru+N^{T}x+B^{T}\lambda

(iv) 边界条件

x(t_{0})=x_{0}

且 $\lambda (t_{1})=F(t_{1})x(t_{1})$

无限时间长度，连续时间的LQR

考虑以下的连续时间线性系统

{\dot {x}}=Ax+Bu

其成本泛函为

J=\int _{0}^{\infty }\left(x^{T}Qx+u^{T}Ru+2x^{T}Nu\right)dt

可以让成本最小化的回授控制律为

u=-Kx\,

其中 $K$ 定义为

K=R^{-1}(B^{T}P+N^{T})\,

而 $P$ 是代数Riccati方程的解

A^{T}P+PA-(PB+N)R^{-1}(B^{T}P+N^{T})+Q=0\,

也可以写成下式

{\mathcal {A}}^{T}P+P{\mathcal {A}}-PBR^{-1}B^{T}P+{\mathcal {Q}}=0\,

其中

{\mathcal {A}}=A-BR^{-1}N^{T}\qquad {\mathcal {Q}}=Q-NR^{-1}N^{T}\,

有限时间长度，离散时间的LQR

考虑离散时间的线性系统，定义如下 ^[1]

x_{k+1}=Ax_{k}+Bu_{k}\,

其性能指标为

J=x_{N}^{T}Qx_{N}+\sum \limits _{k=0}^{N-1}\left(x_{k}^{T}Qx_{k}+u_{k}^{T}Ru_{k}+2x_{k}^{T}Nu_{k}\right)

可以让性能指标最小化的最佳控制序列为

u_{k}=-F_{k}x_{k}\,

其中

F_{k}=(R+B^{T}P_{k+1}B)^{-1}(B^{T}P_{k+1}A+N^{T})\,

而 $P_{k}$ 是由动态Riccati方程倒退时间佚代计算而得

P_{k-1}=A^{T}P_{k}A-(A^{T}P_{k}B+N)\left(R+B^{T}P_{k}B\right)^{-1}(B^{T}P_{k}A+N^{T})+Q

从终端条件 $P_{N}=Q$ 开始计算。注意 $u_{N}$ 没有定义，因为 $x$ 是由 $Ax_{N-1}+Bu_{N-1}$ 推导到其最终状态 $x_{N}$ 。

无限时间长度，离散时间的LQR

考虑离散时间的线性系统，定义如下

x_{k+1}=Ax_{k}+Bu_{k}\,

其性能指标为

J=\sum \limits _{k=0}^{\infty }\left(x_{k}^{T}Qx_{k}+u_{k}^{T}Ru_{k}+2x_{k}^{T}Nu_{k}\right)

可以让性能指标最小化的最佳控制序列为

u_{k}=-Fx_{k}\,

其中

F=(R+B^{T}PB)^{-1}(B^{T}PA+N^{T})\,

而 $P$ 是离散代数Riccati方程（DARE）的唯一正定解。

P=A^{T}PA-(A^{T}PB+N)\left(R+B^{T}PB\right)^{-1}(B^{T}PA+N^{T})+Q

.

可以写成

P={\mathcal {A}}^{T}P{\mathcal {A}}-{\mathcal {A}}^{T}PB\left(R+B^{T}PB\right)^{-1}B^{T}P{\mathcal {A}}+{\mathcal {Q}}

其中

{\mathcal {A}}=A-BR^{-1}N^{T}\qquad {\mathcal {Q}}=Q-NR^{-1}N^{T}

.

而求解代数Riccati方程的一个方式是迭代计算有限时间的动态Riccati方程，直到所得的解收敛为止。

参考资料

^ Chow, Gregory C. Analysis and Control of Dynamic Economic Systems. Krieger Publ. Co. 1986. ISBN 0-89874-969-7.

Kwakernaak, Huibert & Sivan, Raphael. Linear Optimal Control Systems. First Edition. Wiley-Interscience. 1972. ISBN 0-471-51110-2.

Sontag, Eduardo. Mathematical Control Theory: Deterministic Finite Dimensional Systems. Second Edition. Springer. 1998. ISBN 0-387-98489-5.

外部链接

MATLAB function for Linear Quadratic Regulator design （页面存档备份，存于互联网档案馆）
Mathematica function for Linear Quadratic Regulator design （页面存档备份，存于互联网档案馆）

检索自“https://zh.wikipedia.org/w/index.php?title=LQR控制器&oldid=73989069”

分类：

最佳控制

隐藏分类：