1. 引言
单级倒立摆系统作为经典的动态系统模型,广泛应用于控制理论的研究与实践中。其独特的动态特性,包括多因子、高关联性及非线性,使其成为研究欠驱动系统的理想平台。由于倒立摆系统的复杂性,它为控制策略的开发与验证提供了一个有挑战性和价值的环境。控制倒立摆系统的目标是确保摆杆在垂直方向上保持稳定,同时使得整个系统在受到扰动或变化时能够迅速恢复到稳定状态。
针对单级倒立摆控制系统,国内研究人员如么洪飞等[1]通过仿真研究了lqr最优控制在单级倒立摆系统中的应用,确认了反馈控制理论在这种系统中的有效性;文献[2] [3]则忽略了系统的自然不稳定性和摩擦阻力,应用了二次型最优控制理论,并在matlab上进行仿真,证明了lqr控制方法能够确保系统的稳定性和鲁棒性;文献[4]证明了lqr控制器的有效性与可行性;文献[5]比较了pid控制、极点配置控制和lqr控制三种算法在单级倒立摆系统中的性能,并通过simulink仿真显示了这三种算法的优良控制效果;文献[6]研究了单级倒立摆系统的非线性问题,验证了最优控制方法的有效性;文献[7]介绍了倒立摆系统的主要控制方法,如线性控制、模糊控制、拟人智能控制和鲁棒控制,分析了这些方法的特点及其相互关系,突显了倒立摆在控制理论研究中的重要作用。综合上述文献可知,尽管这些控制方法各具优势,但多数对比实验仅以单一的lqr控制方法作为参照,这在一定程度上降低了对比实验的参考价值。本文基于线性单级倒立摆系统,对当前较为理想的lqr和nmpc两种控制方法在相同初始条件下进行了仿真实验对比。因为,nmpc不仅适用于复杂的非线性系统,也可以求解线性系统的控制问题。nmpc通过在每个控制周期内解决一个优化问题,预测未来的系统行为并优化控制输入。即使在面对线性系统时,nmpc仍然能够利用其优化框架来实现控制目标。通过在预测模型中进行实时优化,nmpc能够处理线性系统中的各种约束条件,如控制输入和状态约束条件。结果表明,尽管nmpc在处理复杂约束和非线性问题时表现出色,但对于像单级倒立摆这样的简单线性系统,lqr控制器的动态响应性能更为优越。
2. 单级倒立摆线性数学模型构建
简化单级倒立摆系统模型,作如下假设:
1) 不考虑小车轮子与地面接触时的滑动摩擦以及摆杆转动时关节处的摩擦力矩的影响;
2) 小车运动仅限于x轴,其小车质心在y轴的位置相对世界坐标系而言维持不变;
3) 摆杆质量省略不计;
4) 系统输出量等价于系统状态量。
二维简化模型如图1所示:
figure 1. two-dimensional simplified model
图1. 二维简化模型
图中,m、m、q、l分别为重物的重量、小车的重量、摆杆摆动角度、摆杆长度;
为反馈量;
为控制量;
为小车质心位置;为小车质心速度。
推导单级倒立摆系统的动力学模型过程如下:
重物质心位置:
(1)
式(1)中:h代表小车质心与旋转关节之间的垂直距离。
重物质心速度:
(2)
系统总动能(t):
(3)
系统总势能(v):
(4)
通过公式(3)和(4),推到出拉格朗日方程式如下:
(5)
由图1可知,单级倒立摆系统只在x轴方向上受到控制量f的作用,可推出:
(6)
由公式(6),推导其非线性动力学模型如下:
(7)
由公式(7)可知,该系统动力学模型是非线性的,依据线性化理论假设
可推出
,据此可得局部线性化动态模型为:
(8)
这个系统是由四个关键状态变量组成的:小车的移动位移、摆杆的摆动角度、小车的速度以及摆杆的角速度。状态向量与控制输入构建如下:
(9)
(10)
式(10)中:理想状态
,
。
由公式(8)求得局部线性化后的状态空间方程,如下:
(11)
式(11)中:a表示状态矩阵,b表示输入矩阵,c表示输出矩阵,d表示前馈矩阵,x表示状态矢量,u表示控制变量,y表示输出变量,其中:
(12)
(13)
(14)
(15)
摆杆长度(l)影响倒立摆的重心和运动轨迹。重物质量(m)决定了系统的重心位置和惯性特性。小车质量(m)则对系统的稳定性和响应能力产生影响。最后,重力加速度(g)直接关系到系统的稳定平衡状态。这些参数可影响倒立摆系统的动态行为和控制性能,因此在lqr与nmpc控制对比实验中,选取相同参数值,以免对其对比结果的影响。如表1所示。
table 1. structure parameters of the single-stage inverted pendulum system
表1. 单级倒立摆系统结构参数表
符号 |
物理意义及单位 |
数值 |
m |
小车质量/kg |
0.5 |
m |
重物质量/kg |
0.5 |
l |
摆杆长度/m |
0.3 |
g |
重力加速度/(m·s−2) |
9.81 |
将表1所列参数代入公式(12)和(13),可以得该系统矩阵a和矩阵b的具体数值如下:
(16)
(17)
对该系统稳定性分析:其开环系统的特征方程如下[8]:
(18)
对公式(14),求解特征值如下:
(19)
根据李雅普诺夫稳定性判定可知,该开环系统特性方程中有正值解,该系统不稳定。
对该系统可控性分析:对于线性系统,其能控性矩阵为:
(20)
由公式(20)计算可得,该矩阵的秩为4,该系统完全可控,可以针对该系统构建lqr控制器,使该系统稳定。
对该系统可控性分析:对于线性系统,其可观性矩阵为:
(21)
由公式(21)计算可得,该矩阵的秩为4,该系统完全可观。
3. lqr控制器设计
lqr核心理念基于一个可控制的线性时不变系统,该系统的状态空间方程可以表示为:
(22)
寻求最优控制u (t),使公式(23)取最小值:
(23)
式(23)中:
,
为系统期望输出,q,r分别为输出误差变量和输人变量的加权矩阵,决定了系统误差与控制能量消耗之间的相对重要性(q为正定或半正定对称矩阵;r为正定实对称矩阵)。
公式(18)、(20)、(21)揭示了开环系统固有的不稳定性、可控性以及可观性问题。鉴于该体系仅接受单一控制变量f=u的作用,该系统被定义为单一输入单控制率系统。因此,在单级倒立摆系统的lqr控制器性能指标里,加权矩阵
,r为单元素矩阵。
通过解算riccatti方程:
(24)
可以获得p (t)和最优反馈增益矩阵k的数值,以及使得性能指标j达到最小的控制律u (t),该控制律u (t)的表达式为:
(25)
式(25)中:
,
。
由上述可知,在lqr控制中,其控制精度高度依赖于性能指标中权重矩阵q和r的选择[9]。
经过多次仿真测试,加权矩阵q和r的最终配置为:
r = 0.01
对于lqr控制器,在matlab中,调用lqr ( )函数,便可计算得到状态反馈的增益矩阵
。
联立公式(9)、(10)、(25)和权重矩阵q和r,在matlab中对公式(8)求解lqr控制输入u (t),其图像如图2所示:
figure 2. lqr control input graph
图2. lqr控制输入图
由图2可知,lqr控制输入u (t)在经过大约1 s趋于稳定,加权矩阵q和r的最终配置合理。
在构建lqr控制器的过程中,一旦确定了加权矩阵q与r,便可利用matlab软件的lqr ( )函数计算出系统的状态反馈增益阵
,进而实现lqr控制器的设计。
4. nmpc控制器设计
nmpc的核心理念是在每个时刻通过求解一个在线优化问题来预测未来系统的行为并计算最优控制输入,该系统的状态空间方程如下:
(26)
式(26)中:
,x (k)是系统状态,u (k)是控制输入,y (k)是系统输出,函数f ( )和g ( )表示系统的动态行为。
nmpc通过求解一个带有约束的优化问题来计算控制输入u (k)。使公式(27)中的性能参数降至最低[10]:
(27)
式(27)中:
,
为系统期望输出,n是预测时域的长度。
引入控制输入约束条件,如公式(28)所示:
(28)
式(28)中:
引入状态约束条件,如公式(29)所示:
(29)
在构建nmpc控制器的过程中,一旦建立了控制目标的成本函数和约束条件,便可利用casadi工具包和ipopt求解器对公式(8)进行求解控制输入,进而实现nmpc控制器的设计,其控制输入u (k)图像如图3所示:
figure 3. nmpc control input graph
图3. nmpc控制输入图
根据图3,nmpc控制输入u (k)在大约4 s后趋于稳定,而相比之下,lqr控制在1 s内即可实现稳定。表明,对于线性单级倒立摆的控制任务,lqr控制器在响应速度和稳定性方面表现更为优越。
5. 联合仿真对比分析
仿真初始条件,如表2所示:
table 2. initial conditions table
表2. 初始条件表
|
|
|
|
0 |
0.349 |
0 |
0 |
在相同的初始条件和加权矩阵q与r下,对两种控制方法进行了比较,仿真时长设置为10 s。
在下图4~图7的分析中,可以观察到lqr和nmpc控制策略在控制小车和摆杆动态性能方面的差异。首先,lqr控制策略使得小车约在2.5 s回到初始位置,较nmpc控制的约4 s快37.5%。此外,lqr控制策略下的小车约在0.417 s时达到位移最大超调−0.2160 m,较nmpc控制的约在0.509 s时达到的位移最大超调−0.3522 m减少了38.7%。这表明lqr控制在调节小车速度和位移超调量上均优于nmpc控制。对于摆杆控制,lqr控制策略使得摆杆约在2.5 s时达到竖直状态,较nmpc控制的约3.5 s快28.6%。lqr策略下摆杆角度的最大超调量为−0.1050 rad,较nmpc策略的最大超调量−0.2381 rad减少了56%。这一结果显示lqr控制不仅反应更迅速,且摆杆的超调也显著减少。在小车速度方面,lqr控制策略使得小车速度在约2.5 s时趋近于零,较nmpc控制的约4 s快37.5%。尽管nmpc控制下的小车速度最大超调量−1.166 m/s略低于lqr控制的−1.273 m/s,但lqr控制在速度恢复到平衡状态的时间上具有优势。最后,在摆杆角速度方面,lqr控制策略在1.5 s内使摆杆速度达到稳定状态,较nmpc控制的2.5 s快40%。虽然nmpc控制下摆杆角速度最大超调量−2.153 rad/s较lqr控制的−3.747 rad/s略低,但lqr控制的摆杆角速度达到平衡的时间显著更短。
figure 4. displacement comparison diagram
图4. 位移对比图
figure 5. pole angle comparison diagram
图5. 摆动角度对比图
figure 6. comparison of cart speeds
图6. 小车速度对比图
figure 7. comparison of pendulum angular velocities
图7. 摆动角速度对比图
6. 总结
本研究通过对比lqr与nmpc控制在线性单级倒立摆系统中的动态性能方面的表现,得出以下结论:lqr使小车在约2.5 s内迅速回到初始位置,相较于nmpc的4 s快37.5%;摆杆在2.5 s内达到竖直状态,较nmpc的3.5 s快28.6%。lqr的小车位移最大超调量为−0.2160 m,较nmpc的−0.3522 m减少了38.7%;摆杆角度最大超调量为−0.1050 rad,远低于nmpc的−0.2381 rad,减少了56%。此外,小车速度在2.5 s时趋近于零,而nmpc需4 s,摆杆角速度在1.5 s内稳定,较nmpc的2.5 s快40%。这些数据充分证明了lqr在动态性能和实时响应中的显著优势。尽管nmpc在某些超调量指标上有所优势,但lqr在恢复速度和达到稳定状态的时间上表现更为突出,显示出其在控制线性单级倒立摆系统中的适用性。值得注意的是,本研究的局限性在于仅限于单级倒立摆这一特定线性系统,未来的研究应拓展至更复杂的系统和非线性问题,以验证本研究结论的广泛适用性并为控制策略的选择和优化提供更深入的见解。