「 机器人 」扑翼飞行器混合控制策略缺点浅谈
前言
将基于模型的控制与强化学习策略融合在扑翼飞行器中,虽然能够兼顾系统稳定性与极限机动能力,但也面临了更高的系统复杂性、对硬件算力与可靠性的额外要求,以及难以回避的能量效率等方面挑战。以下从四个方面进行归纳与分析。
1. 系统复杂性增加
1.1 两种控制方法的并存
• 基于模型的控制依赖精确的系统动力学模型和参数估计,注重飞行器的稳定性控制。
• 强化学习策略往往通过训练得到“经验”式决策,能在极限机动或非线性场景中发挥出更高的灵活性。
• 将两者结合时,需要额外设计用于切换或融合控制信号的机制;不同控制模块之间还需共享或交换信息,极大地增加了系统的整体设计和实现难度。
1.2 任务与环境动态切换
• 在常规、稳定的飞行场景下,多依赖基于模型的控制;在紧急机动或极端环境中,则倾向使用强化学习策略。
• 为此,系统需要持续评估当前状态和环境,判断何时切换控制策略或如何分配控制权重。此过程增加了实时决策逻辑的复杂性。
1.3 控制信号的冲突与协调
• 基于模型的控制更强调系