基于线性单级倒立摆的lqr和nmpc控制方法对比研究-凯发娱乐官网

期刊菜单

基于线性单级倒立摆的lqr和nmpc控制方法对比研究
comparison study of lqr and nmpc control methods based on linear single-stage

doi: , , html, ,
作者: 邵红福：上海理工大学机械工程学院，上海；杨坤：西安西电高压开关操动机构有限责任公司，陕西西安
关键词: lqr；nmpc；拉格朗日方程；对比实验；lqr； nmpc； lagrange equation； comparative experiment

摘要: 针对目前欠驱动系统较成熟的控制方法对比缺乏的问题，研究线性单级倒立摆系统在全状态反馈控制下，采用线性二次型调节器(lqr)与非线性模型预测控制(nmpc)两种控制策略的效果。通过对比这两种控制方法的动态性能，评估它们在线性单级倒立摆系统中的适用性。首先，通过拉格朗日方程推导出系统的非线性数学模型，并进一步通过线性化理论假设得到系统的线性化数学模型。随后对其进行了稳定性、可控性和可观性分析。基于这些分析，设计了lqr和nmpc控制器。最后，在matlab/simulink中进行联合仿真实验。通过设置相同的初始条件和加权矩阵q与r，对仿真结果的小车位移、摆动角度、小车速度、摆动角速度四个指标进行了对比分析。结果表明，lqr控制使小车在2.5 s内回到初始位置，比nmpc控制快37.5%，并且位移最大超调量减少了38.7%，从−0.3522 m降至−0.2160 m。同时，lqr控制还缩短了摆杆达到竖直状态的时间至2.5 s，比nmpc快28.6%，且摆杆角度的最大超调量从nmpc的−0.2381 rad减少至−0.1050 rad，降低了56%。结论指出，对于线性化后的单级倒立摆系统，lqr比nmpc更具优势，提供了更高效的控制效果，对以后欠驱动系统的控制具有一定的参考价值。

abstract: to address the current lack of comparison between mature control methods for underactuated systems, this study investigates the performance of linear quadratic regulator (lqr) and nonlinear model predictive control (nmpc) for a linear single-stage inverted pendulum system under full state feedback control. by comparing the dynamic performance of these two control strategies, the study evaluates their applicability to the linear single-stage inverted pendulum system. first, the nonlinear mathematical model of the system is derived using the lagrangian method, and subsequently, the system’s linearized mathematical model is obtained through linearization theory. stability, controllability, and observability analyses are then conducted. based on these analyses, lqr and nmpc controllers are designed. finally, joint simulation experiments are conducted using matlab/simulink. with the same initial conditions and weighting matrices q and r, the simulation results for the cart displacement, pendulum angle, cart velocity, and angular velocity are compared. the results indicate that lqr control returns the cart to its initial position within 2.5 seconds, which is 37.5% faster than nmpc control. additionally, the maximum displacement overshoot is reduced by 38.7%, from −0.3522 meters to −0.2160 meters. lqr control also shortens the time required for the pendulum to reach the vertical state to 2.5 seconds, which is 28.6% faster than nmpc, and reduces the maximum pendulum angle overshoot from −0.2381 radians to −0.1050 radians, a decrease of 56%. the conclusion highlights that, for the linearized single-stage inverted pendulum system, lqr provides more efficient control compared to nmpc, offering valuable insights for the control of underactuated systems in the future.

文章引用：邵红福, 杨坤. 基于线性单级倒立摆的lqr和nmpc控制方法对比研究[j]. 建模与仿真, 2024, 13(6): 5826-5835.

1. 引言

单级倒立摆系统作为经典的动态系统模型，广泛应用于控制理论的研究与实践中。其独特的动态特性，包括多因子、高关联性及非线性，使其成为研究欠驱动系统的理想平台。由于倒立摆系统的复杂性，它为控制策略的开发与验证提供了一个有挑战性和价值的环境。控制倒立摆系统的目标是确保摆杆在垂直方向上保持稳定，同时使得整个系统在受到扰动或变化时能够迅速恢复到稳定状态。

针对单级倒立摆控制系统，国内研究人员如么洪飞等[1]通过仿真研究了lqr最优控制在单级倒立摆系统中的应用，确认了反馈控制理论在这种系统中的有效性；文献[2] [3]则忽略了系统的自然不稳定性和摩擦阻力，应用了二次型最优控制理论，并在matlab上进行仿真，证明了lqr控制方法能够确保系统的稳定性和鲁棒性；文献[4]证明了lqr控制器的有效性与可行性；文献[5]比较了pid控制、极点配置控制和lqr控制三种算法在单级倒立摆系统中的性能，并通过simulink仿真显示了这三种算法的优良控制效果；文献[6]研究了单级倒立摆系统的非线性问题，验证了最优控制方法的有效性；文献[7]介绍了倒立摆系统的主要控制方法，如线性控制、模糊控制、拟人智能控制和鲁棒控制，分析了这些方法的特点及其相互关系，突显了倒立摆在控制理论研究中的重要作用。综合上述文献可知，尽管这些控制方法各具优势，但多数对比实验仅以单一的lqr控制方法作为参照，这在一定程度上降低了对比实验的参考价值。本文基于线性单级倒立摆系统，对当前较为理想的lqr和nmpc两种控制方法在相同初始条件下进行了仿真实验对比。因为，nmpc不仅适用于复杂的非线性系统，也可以求解线性系统的控制问题。nmpc通过在每个控制周期内解决一个优化问题，预测未来的系统行为并优化控制输入。即使在面对线性系统时，nmpc仍然能够利用其优化框架来实现控制目标。通过在预测模型中进行实时优化，nmpc能够处理线性系统中的各种约束条件，如控制输入和状态约束条件。结果表明，尽管nmpc在处理复杂约束和非线性问题时表现出色，但对于像单级倒立摆这样的简单线性系统，lqr控制器的动态响应性能更为优越。

2. 单级倒立摆线性数学模型构建

简化单级倒立摆系统模型，作如下假设：

1) 不考虑小车轮子与地面接触时的滑动摩擦以及摆杆转动时关节处的摩擦力矩的影响；

2) 小车运动仅限于x轴，其小车质心在y轴的位置相对世界坐标系而言维持不变；

3) 摆杆质量省略不计；

4) 系统输出量等价于系统状态量。

二维简化模型如图1所示：

figure 1. two-dimensional simplified model

图1. 二维简化模型

图中，m、m、q、l分别为重物的重量、小车的重量、摆杆摆动角度、摆杆长度； $x, q, \dot{x}, \dot{q}$ 为反馈量； $f$ 为控制量； $(x, y)$ 为小车质心位置； $(\dot{x}, \dot{y})$ 为小车质心速度。

推导单级倒立摆系统的动力学模型过程如下：

重物质心位置：

${\begin{cases} x_{m} = x - l \sin (q) \\ y_{m} = y \frac{h}{2} l \cos (q) \end{cases}$ (1)

式(1)中：h代表小车质心与旋转关节之间的垂直距离。

重物质心速度：

${\begin{cases} {\dot{x}}_{m} = \dot{x} - l \cos (q) \dot{q} \\ {\dot{y}}_{m} = - l \sin (q) \dot{q} \end{cases}$ (2)

系统总动能(t)：

$t = \frac{1}{2} (m m) {\dot{x}}^{2} \frac{1}{2} m l^{2} {\dot{q}}^{2} - m l \cos (q) \dot{q} \dot{x}$ (3)

系统总势能(v)：

$v = m g [l \cos (q) \frac{h}{2}]$ (4)

通过公式(3)和(4)，推到出拉格朗日方程式如下：

$ℒ = \frac{1}{2} (m m) {\dot{x}}^{2} \frac{1}{2} m l^{2} {\dot{q}}^{2} - m l \cos (q) \dot{q} \dot{x} - m g [l \cos (q) \frac{h}{2}]$ (5)

由图1可知，单级倒立摆系统只在x轴方向上受到控制量f的作用，可推出：

${\begin{cases} \frac{d}{d t} \frac{δ ℒ}{δ \dot{x}} - \frac{δ ℒ}{δ x} = f \\ \frac{d}{d t} \frac{δ ℒ}{δ \dot{q}} - \frac{δ ℒ}{δ q} = 0 \end{cases}$ (6)

由公式(6)，推导其非线性动力学模型如下：

${\begin{array}{l} (m m) \ddot{x} m l s i n (q) {\dot{q}}^{2} - m l c o s (q) \ddot{q} = f \\ m l^{2} \ddot{q} - m l c o s (q) \ddot{x} - m g l s i n (q) = 0 \end{array}$ (7)

由公式(7)可知，该系统动力学模型是非线性的，依据线性化理论假设 $q \approx 0$ 可推出 $s i n (q) \approx q, \cos (q) \approx 1, {\dot{q}}^{2} \approx 0$ ，据此可得局部线性化动态模型为：

${\begin{array}{l} (m m) \ddot{x} - m l \ddot{q} = f \\ m l^{2} \ddot{q} - m l \ddot{x} - m g l q = 0 \end{array}$ (8)

这个系统是由四个关键状态变量组成的：小车的移动位移、摆杆的摆动角度、小车的速度以及摆杆的角速度。状态向量与控制输入构建如下：

$x = {[x q \dot{x} \dot{q}]}^{t}$ (9)

$f = u (t) = k (x_{d} - x)$ (10)

式(10)中：理想状态 $x_{d} = {[0 0 0 0]}^{t}$ ， $y = x$ 。

由公式(8)求得局部线性化后的状态空间方程，如下：

${\begin{cases} \dot{x} = a x b u \\ y = c x d u \end{cases}$ (11)

式(11)中：a表示状态矩阵，b表示输入矩阵，c表示输出矩阵，d表示前馈矩阵，x表示状态矢量，u表示控制变量，y表示输出变量，其中：

$a = [\begin{matrix} 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & m g / m & 0 & 0 \\ 0 & (m m) g / (m l) & 0 & 0 \end{matrix}]$ (12)

$b = {[0 0 1 / m 1 / (m l)]}^{t}$ (13)

$c = [\begin{matrix} 1 & 0 & 0 & 0 \\ 0 & 1 & 0 & 0 \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{matrix}]$ (14)

$d = {[0 0 0 0]}^{t}$ (15)

摆杆长度(l)影响倒立摆的重心和运动轨迹。重物质量(m)决定了系统的重心位置和惯性特性。小车质量(m)则对系统的稳定性和响应能力产生影响。最后，重力加速度(g)直接关系到系统的稳定平衡状态。这些参数可影响倒立摆系统的动态行为和控制性能，因此在lqr与nmpc控制对比实验中，选取相同参数值，以免对其对比结果的影响。如表1所示。

table 1. structure parameters of the single-stage inverted pendulum system

表1. 单级倒立摆系统结构参数表

符号	物理意义及单位	数值
m	小车质量/kg	0.5
m	重物质量/kg	0.5
l	摆杆长度/m	0.3
g	重力加速度/(m·s⁻²)	9.81

将表1所列参数代入公式(12)和(13)，可以得该系统矩阵a和矩阵b的具体数值如下：

$a = [\begin{matrix} 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \\ 0 & 9.8100 & 0 & 0 \\ 0 & 65.4000 & 0 & 0 \end{matrix}]$ (16)

$b = {[0 0 2 .0000 6 .6667]}^{t}$ (17)

对该系统稳定性分析：其开环系统的特征方程如下[8]：

$\det (λ e - a) = 0$ (18)

对公式(14)，求解特征值如下：

$λ = [0 0 8 .0870 -8 .0870]$ (19)

根据李雅普诺夫稳定性判定可知，该开环系统特性方程中有正值解，该系统不稳定。

对该系统可控性分析：对于线性系统 $\dot{x} = a x b u, y = c x d u$ ，其能控性矩阵为：

$m = [b a b a^{2} b a^{3} b]$ (20)

由公式(20)计算可得，该矩阵的秩为4，该系统完全可控，可以针对该系统构建lqr控制器，使该系统稳定。

对该系统可控性分析：对于线性系统 $\dot{x} = a x b u, y = c x d u$ ，其可观性矩阵为：

$t = [c a c a c^{2} a c^{3} a]$ (21)

由公式(21)计算可得，该矩阵的秩为4，该系统完全可观。

3. lqr控制器设计

lqr核心理念基于一个可控制的线性时不变系统，该系统的状态空间方程可以表示为：

${\begin{cases} \dot{x} = a x b u \\ y = c x d u \end{cases}$ (22)

寻求最优控制u (t)，使公式(23)取最小值：

$j = \frac{1}{2} \int_{0}^{\infty} (e^{t} (t) q e (t) u^{t} (t) r u (t)) d t$ (23)

式(23)中： $e (t) = x_{r} - x$ ， $x_{r}$ 为系统期望输出，q，r分别为输出误差变量和输人变量的加权矩阵，决定了系统误差与控制能量消耗之间的相对重要性(q为正定或半正定对称矩阵；r为正定实对称矩阵)。

公式(18)、(20)、(21)揭示了开环系统固有的不稳定性、可控性以及可观性问题。鉴于该体系仅接受单一控制变量f=u的作用，该系统被定义为单一输入单控制率系统。因此，在单级倒立摆系统的lqr控制器性能指标里，加权矩阵 $q = diag {q_{1} q_{2} q_{3} q_{4}}$ ，r为单元素矩阵。

通过解算riccatti方程：

$p (t) a a^{t} p (t) - p (t) b r^{- 1} b^{t} p (t) q = 0$ (24)

可以获得p (t)和最优反馈增益矩阵k的数值，以及使得性能指标j达到最小的控制律u (t)，该控制律u (t)的表达式为：

$u (t) = - k x (t)$ (25)

式(25)中： $k = r^{- 1} b^{t} p (t)$ ， $x (t) = x_{d} - x$ 。

由上述可知，在lqr控制中，其控制精度高度依赖于性能指标中权重矩阵q和r的选择[9]。

经过多次仿真测试，加权矩阵q和r的最终配置为：

r = 0.01

$q = d i a g {600 1000 100 40}$

对于lqr控制器，在matlab中，调用lqr ( )函数，便可计算得到状态反馈的增益矩阵 $k = [-244 .9490 769 .3336 -218 .9282 137 .1540]$ 。

联立公式(9)、(10)、(25)和权重矩阵q和r，在matlab中对公式(8)求解lqr控制输入u (t)，其图像如图2所示：

figure 2. lqr control input graph

图2. lqr控制输入图

由图2可知，lqr控制输入u (t)在经过大约1 s趋于稳定，加权矩阵q和r的最终配置合理。

在构建lqr控制器的过程中，一旦确定了加权矩阵q与r，便可利用matlab软件的lqr ( )函数计算出系统的状态反馈增益阵 $k = lqr (a, b, q, r)$ ，进而实现lqr控制器的设计。

4. nmpc控制器设计

nmpc的核心理念是在每个时刻通过求解一个在线优化问题来预测未来系统的行为并计算最优控制输入，该系统的状态空间方程如下：

${\begin{cases} x (k 1) = f (x (k), u (k)) \\ y (k) = g (x (k), u (k)) \end{cases}$ (26)

式(26)中： $f (k) = u (k)$ ，x (k)是系统状态，u (k)是控制输入，y (k)是系统输出，函数f ( )和g ( )表示系统的动态行为。

nmpc通过求解一个带有约束的优化问题来计算控制输入u (k)。使公式(27)中的性能参数降至最低[10]：

$j = \min_{x, u} \sum_{i = 0}^{n} (e {(k)}^{t} q e (k)) u {(k)}^{t} r u (k)$ (27)

式(27)中： $e (t) = x_{r} - x$ ， $x_{r}$ 为系统期望输出，n是预测时域的长度。

引入控制输入约束条件，如公式(28)所示：

$u_{\min} \leq u (k) \leq u_{\max}$ (28)

式(28)中： $u_{\min} = - 100, u_{\max} = 100$

引入状态约束条件，如公式(29)所示：

$x (k 1) = f (x (k), u (k))$ (29)

在构建nmpc控制器的过程中，一旦建立了控制目标的成本函数和约束条件，便可利用casadi工具包和ipopt求解器对公式(8)进行求解控制输入，进而实现nmpc控制器的设计，其控制输入u (k)图像如图3所示：

figure 3. nmpc control input graph

图3. nmpc控制输入图

根据图3，nmpc控制输入u (k)在大约4 s后趋于稳定，而相比之下，lqr控制在1 s内即可实现稳定。表明，对于线性单级倒立摆的控制任务，lqr控制器在响应速度和稳定性方面表现更为优越。

5. 联合仿真对比分析

仿真初始条件，如表2所示：

table 2. initial conditions table

表2. 初始条件表

$x (m)$	$q (rad)$	$\dot{x} (m / s)$	$\dot{q} (rad / s)$
0	0.349	0	0

在相同的初始条件和加权矩阵q与r下，对两种控制方法进行了比较，仿真时长设置为10 s。

在下图4~图7的分析中，可以观察到lqr和nmpc控制策略在控制小车和摆杆动态性能方面的差异。首先，lqr控制策略使得小车约在2.5 s回到初始位置，较nmpc控制的约4 s快37.5%。此外，lqr控制策略下的小车约在0.417 s时达到位移最大超调−0.2160 m，较nmpc控制的约在0.509 s时达到的位移最大超调−0.3522 m减少了38.7%。这表明lqr控制在调节小车速度和位移超调量上均优于nmpc控制。对于摆杆控制，lqr控制策略使得摆杆约在2.5 s时达到竖直状态，较nmpc控制的约3.5 s快28.6%。lqr策略下摆杆角度的最大超调量为−0.1050 rad，较nmpc策略的最大超调量−0.2381 rad减少了56%。这一结果显示lqr控制不仅反应更迅速，且摆杆的超调也显著减少。在小车速度方面，lqr控制策略使得小车速度在约2.5 s时趋近于零，较nmpc控制的约4 s快37.5%。尽管nmpc控制下的小车速度最大超调量−1.166 m/s略低于lqr控制的−1.273 m/s，但lqr控制在速度恢复到平衡状态的时间上具有优势。最后，在摆杆角速度方面，lqr控制策略在1.5 s内使摆杆速度达到稳定状态，较nmpc控制的2.5 s快40%。虽然nmpc控制下摆杆角速度最大超调量−2.153 rad/s较lqr控制的−3.747 rad/s略低，但lqr控制的摆杆角速度达到平衡的时间显著更短。

figure 4. displacement comparison diagram

图4. 位移对比图

figure 5. pole angle comparison diagram

图5. 摆动角度对比图

figure 6. comparison of cart speeds

图6. 小车速度对比图

figure 7. comparison of pendulum angular velocities

图7. 摆动角速度对比图

6. 总结

本研究通过对比lqr与nmpc控制在线性单级倒立摆系统中的动态性能方面的表现，得出以下结论：lqr使小车在约2.5 s内迅速回到初始位置，相较于nmpc的4 s快37.5%；摆杆在2.5 s内达到竖直状态，较nmpc的3.5 s快28.6%。lqr的小车位移最大超调量为−0.2160 m，较nmpc的−0.3522 m减少了38.7%；摆杆角度最大超调量为−0.1050 rad，远低于nmpc的−0.2381 rad，减少了56%。此外，小车速度在2.5 s时趋近于零，而nmpc需4 s，摆杆角速度在1.5 s内稳定，较nmpc的2.5 s快40%。这些数据充分证明了lqr在动态性能和实时响应中的显著优势。尽管nmpc在某些超调量指标上有所优势，但lqr在恢复速度和达到稳定状态的时间上表现更为突出，显示出其在控制线性单级倒立摆系统中的适用性。值得注意的是，本研究的局限性在于仅限于单级倒立摆这一特定线性系统，未来的研究应拓展至更复杂的系统和非线性问题，以验证本研究结论的广泛适用性并为控制策略的选择和优化提供更深入的见解。

参考文献

[1]	么洪飞, 陆仲达, 徐凤霞. 基于最优控制lqr的单级倒立摆系统仿真研究[j]. 齐齐哈尔大学学报(自然科学版), 2011, 27(4): 34-37.
[2]	张慧慧, 侯伯杰, 高建设, 等. 基于lqr对直线倒立摆的稳摆控制研究及实现[j]. 机械设计与制造, 2024, 395(1): 186-190.
[3]	刘惠超, 孔庆忠. 最优控制方法在直线倒立摆中的应用[j]. 机械制造与自动化, 2015, 44(5): 189-191.
[4]	刘惠超, 孔庆忠. 基于matlab的倒立摆lqr控制方法的研究[j]. 机械工程与自动化, 2014(4): 166-168, 171.
[5]	李艳杰, 佟福奇. 单级倒立摆系统的仿真分析[j]. 上海电气技术, 2021, 14(1): 44-50.
[6]	薛军伟. 基于matlab的单级倒立摆系统仿真研究[j]. 现代工业经济和信息化, 2024, 14(7): 82-84.
[7]	杨世勇, 刘殿通, 谭翚. 倒立摆与控制理论研究[j]. 自动化技术与应用, 2011, 30(5): 1-3, 11.
[8]	刘满禄, 韩帅, 张俊俊, 等. 基于两轮自平衡小车的h_∞和lqr控制方法对比研究[j]. 机械设计与制造, 2019(5): 245-248.
[9]	王仲民, 孙建军, 岳宏. 基于lqr的倒立摆最优控制系统研究[j]. 工业仪表与自动化装置, 2005(3): 6-8, 32.
[10]	刘凯, 李浩然, 许述财, 等. 自主车辆前馈nmpc路径跟踪控制方法研究[j]. 重庆理工大学学报(自然科学), 2024, 38(9): 18-29.

为你推荐

凯发娱乐官网的友情链接