Python实战：用Scipy库求解最优控制问题（附完整代码）

# Python实战：用Scipy库求解最优控制问题（附完整代码）最近在做一个机器人轨迹优化的项目，团队里一位刚毕业的工程师看着一堆微分方程和性能指标直挠头，问我有没有什么“不那么理论”的实用方法。我直接打开Jupyter Notebook，敲了几行Python代码，用Scipy的`optimize`模块就把一个简化版的最优控制问题给解出来了。他当时那个表情，我现在想起来都觉得有趣——原来那些课本上复杂的变分法和极小值原理，真的可以转化成我们工程师熟悉的“调包”和“调参”。这就是我想和你分享的：**最优控制不是控制理论专家的专属玩具，它完全可以成为Python开发者工具箱里的一件实用利器**。无论你是做自动驾驶的轨迹规划，还是做无人机飞控的能量优化，抑或是化工过程的稳态寻优，其核心数学问题常常可以归结为：在满足系统动力学（一组微分方程）约束的前提下，寻找一组控制输入，使得某个性能指标（比如能耗、时间、误差）达到最优。传统教材会花大量篇幅推导欧拉-拉格朗日方程和庞特里亚金极小值原理，但对于工程实现，我们更关心的是：**如何把这个问题“喂”给计算机，并快速得到一个可用的数值解**。 Scipy的`scipy.optimize`模块，特别是其中的`minimize`函数，就是我们实现这一目标的桥梁。它本质上是一个强大的数值优化求解器，能够处理有约束、多变量的非线性规划问题。而最优控制问题，经过适当的离散化处理，恰好能被“翻译”成这样一个优化问题。本文将彻底抛开繁琐的公式推导，从一个工程师的视角，手把手带你走通这条“理论问题工程化”的路径。我们会从一个最简单的例子出发，逐步构建问题，编写代码，并深入讨论如何将连续的动态系统离散化、如何处理边界条件、以及如何解读和验证数值解。文末提供的完整代码，你可以直接复制到你的项目中修改使用。 ## 1. 问题定义：从物理世界到数学模型在写任何代码之前，我们必须先清晰地定义问题。让我们考虑一个经典且直观的最优控制问题：**最速降线问题**。不过，为了更贴近工程实际，我们把它稍作变形，称为“**最省力爬升问题**”。 **场景设想**：假设我们控制一个质点（可以想象成一个小车或无人机）在垂直平面内沿一条光滑轨道运动。质点从地面（高度为0）静止出发，我们需要设计一个控制力（例如电机的推力），使其在固定时间 `T` 内到达指定高度 `H`，并且在整个过程中消耗的总能量（与控制力的平方成正比）最小。系统会受到重力的作用。 **数学模型建立**： 1. **状态变量**：我们用 `x(t)` 表示质点在 `t` 时刻的高度，`v(t)` 表示其速度。因此状态向量为 `[x(t), v(t)]`。 2. **控制变量**：`u(t)` 表示我们施加的控制力（推力）。 3. **系统动力学（约束）**：这是牛顿第二定律。加速度由控制力减去重力（假设质量为1）产生。 ``` dx/dt = v(t) dv/dt = u(t) - g # g 为重力加速度 ``` 这就是我们的微分方程约束。 4. **边界条件**： ``` 初始时刻 (t=0): x(0) = 0, v(0) = 0 终端时刻 (t=T): x(T) = H, v(T) = 0 # 我们要求它到达目标高度并静止 ``` 5. **性能指标（目标函数）**：我们希望最小化总能量消耗，假设功率与力的平方成正比，则总能量为： ``` J = ∫_0^T u(t)^2 dt ``` 我们的目标就是找到函数 `u(t)`，在满足上述动力学和边界条件的前提下，使 `J` 最小。现在，我们有了一个完整的最优控制问题描述。接下来要做的，就是把这个连续的、无限维的问题（因为我们要寻找一个函数 `u(t)`），转化成一个离散的、有限维的优化问题，以便计算机处理。 > 注意：这里选择“最省力爬升”而非“最速降线”，是为了让控制变量 `u(t)` 的作用更直观（推力），并且目标函数（能量）是工程中非常常见的指标。解析上，这个问题同样有解（与最速降线类似，但边界条件不同），便于我们后续进行数值解与解析解的对比验证。 ## 2. 离散化策略：将连续时间“切片” 计算机无法直接处理连续函数 `u(t)`，我们必须对其进行离散化。最直接的方法是**时间网格化**。我们将总时间 `T` 均匀分成 `N` 段，得到 `N+1` 个时间点：`t_0, t_1, ..., t_N`，其中 `t_0=0`, `t_N=T`。步长 `dt = T / N`。基于这个网格，我们对变量进行近似： * **控制变量离散化**：我们不再寻找函数 `u(t)`，而是寻找一组数列 `{u_0, u_1, ..., u_{N-1}}`。这里 `u_k` 代表在时间区间 `[t_k, t_{k+1})` 内，我们假设控制力保持恒定。这种假设称为**零阶保持**，在工程中非常常用。当然，你也可以用更复杂的插值方式（如分段线性），但零阶保持最简单，也足够有效。 * **状态变量离散化**：相应地，状态 `x(t)` 和 `v(t)` 也只在离散时间点 `t_k` 上被计算。我们得到两组数列 `{x_0, x_1, ..., x_N}` 和 `{v_0, v_1, ..., v_N}`。 **动力学约束的离散化**：微分方程 `dx/dt = v` 和 `dv/dt = u - g` 需要用数值积分方法来近似。对于这类最优控制问题，**前向欧拉法**是一个简单且常用的起点，尽管它的精度是一阶的。对于第 `k` 步： ``` x_{k+1} = x_k + v_k * dt v_{k+1} = v_k + (u_k - g) * dt ``` 这样，只要我们知道了初始状态 `(x_0, v_0)` 和所有控制量 `{u_k}`，就可以通过迭代递推计算出所有未来的状态 `{(x_k, v_k)}`。这个递推关系，将成为我们优化问题中的**等式约束**。 **目标函数的离散化**：连续积分 `J = ∫ u(t)^2 dt` 可以用矩形法近似： ``` J ≈ sum_{k=0}^{N-1} (u_k^2) * dt ``` 至此，我们成功地将一个连续的最优控制问题，转化成了一个**非线性规划问题**： * **决策变量**：`u_0, u_1, ..., u_{N-1}`，共 `N` 个。 * **目标函数**：最小化 `J = dt * sum(u_k^2)`。 * **等式约束**：对于 `k = 0, 1, ..., N-1`，有 ``` x_{k+1} - (x_k + v_k * dt) = 0 v_{k+1} - (v_k + (u_k - g) * dt) = 0 ``` 注意，这里的 `x_k` 和 `v_k` 也是变量，但它们由初始条件和动力学约束唯一确定（一旦 `u_k` 给定）。在优化问题中，我们有两种处理方式：1）将 `x_k`, `v_k` 也作为决策变量，并添加上述等式约束；2）将 `x_k`, `v_k` 视为由 `u_k` 和初始状态计算出的中间量，从而消去它们，只对 `u_k` 优化。后一种方法更高效，我们将在代码中采用。 * **边界条件**：作为额外的等式约束施加。 ``` x_0 = 0, v_0 = 0 x_N = H, v_N = 0 ``` 这个离散化框架是通用的。下表总结了连续问题与离散化后问题的对应关系： | 连续问题要素 | 离散化后对应 | 说明 | | :--- | :--- | :--- | | 控制函数 `u(t)` | 控制序列 `[u_0, u_1, ..., u_{N-1}]` | 零阶保持，在子区间内恒定 | | 状态函数 `x(t)`, `v(t)` | 状态序列 `[x_0, ..., x_N]`, `[v_0, ..., v_N]` | 在时间网格点上取值 | | 微分约束 `dx/dt = v` | 差分约束 `x_{k+1} = x_k + v_k * dt` | 前向欧拉离散 | | 微分约束 `dv/dt = u-g` | 差分约束 `v_{k+1} = v_k + (u_k - g) * dt` | 前向欧拉离散 | | 积分目标 `∫ u^2 dt` | 求和目标 `dt * Σ u_k^2` | 矩形法近似 | | 边界条件 `x(0)=0` | 等式约束 `x_0 = 0` | 直接施加 | | 边界条件 `x(T)=H` | 等式约束 `x_N = H` | 通过动力学递推隐含 | ## 3. 代码实现：利用Scipy.optimize进行求解理论准备就绪，现在进入实战环节。我们将使用 `scipy.optimize.minimize` 函数。这里的关键在于，我们需要编写几个函数来定义目标、约束，并建立状态与控制量之间的关系。首先，进行环境准备和参数设置。 ```python import numpy as np from scipy.optimize import minimize import matplotlib.pyplot as plt # 问题参数 g = 9.81 # 重力加速度， m/s^2 H = 10.0 # 目标高度， m T = 2.0 # 总时间， s # 离散化参数 N = 50 # 时间分段数 dt = T / N # 时间步长 num_u = N # 控制变量的个数，每个时间段一个 t_grid = np.linspace(0, T, N+1) # 时间网格，共 N+1 个点 ``` 接下来，我们实现一个核心函数 `simulate_states`。它的作用是：给定一组控制序列 `u_vals`，通过前向欧拉积分，计算出对应的状态轨迹 `(x_traj, v_traj)`。这样，我们就可以把状态变量从优化变量中消除。 ```python def simulate_states(u_vals): """ 根据控制序列，通过前向欧拉积分计算状态轨迹。参数: u_vals: 形状为 (N,) 的数组，表示控制力 u_0, u_1, ..., u_{N-1} 返回: x_traj: 形状为 (N+1,) 的数组，高度轨迹 v_traj: 形状为 (N+1,) 的数组，速度轨迹 """ # 初始化状态数组 x_traj = np.zeros(N+1) v_traj = np.zeros(N+1) # 初始条件 x_traj[0] = 0.0 v_traj[0] = 0.0 # 前向欧拉积分 for k in range(N): u_k = u_vals[k] # 更新状态 x_traj[k+1] = x_traj[k] + v_traj[k] * dt v_traj[k+1] = v_traj[k] + (u_k - g) * dt return x_traj, v_traj ``` 现在，定义**目标函数**。它接收优化变量（即控制序列 `u_vals`），通过 `simulate_states` 计算状态（虽然这里用不到状态），然后计算离散化的能量积分。 ```python def objective(u_vals): """ 目标函数：总能量消耗 J = ∫ u(t)^2 dt ≈ dt * Σ u_k^2 """ # 计算能量和 energy = np.sum(u_vals**2) * dt return energy ``` 定义**约束条件**。我们需要确保终端状态满足 `x_N = H` 和 `v_N = 0`。由于状态是由控制量积分得到的，我们可以将这些终端条件定义为关于控制量 `u_vals` 的函数约束。 ```python def terminal_constraints(u_vals): """ 定义终端约束。返回一个包含两个元素的数组：[x_N - H, v_N - 0] """ x_traj, v_traj = simulate_states(u_vals) # 终端状态与目标值的差值 constraint_x = x_traj[-1] - H # x_N - H constraint_v = v_traj[-1] - 0.0 # v_N - 0 return np.array([constraint_x, constraint_v]) ``` 在调用 `minimize` 时，我们需要以字典形式指定约束。`type: 'eq'` 表示等式约束，`fun` 指向我们刚定义的约束函数。 ```python # 定义优化问题的约束 cons = ({'type': 'eq', 'fun': terminal_constraints}) ``` **初始猜测**：优化算法需要一个起点。一个合理的猜测是提供一个恒定的推力，这个推力刚好能抵消重力并使质点匀加速运动到目标高度。我们可以简单估算一下：平均速度需要达到 `H/T`，假设匀加速，则所需加速度 `a = 2H/T^2`。那么推力 `u ≈ g + a`。我们用一个略大于 `g` 的常数序列作为初值。 ```python # 初始猜测：一个略大于g的恒定推力序列 u_guess_constant = g + 1.0 # 多加 1 m/s^2 的加速度 initial_guess = np.ones(num_u) * u_guess_constant ``` 最后，调用 `minimize` 函数进行求解。我们选择 `'SLSQP'` 算法，它非常适合处理具有等式和不等式约束的平滑非线性优化问题。 ```python # 设置优化选项 options = {'maxiter': 1000, 'ftol': 1e-8, 'disp': True} # 执行优化 result = minimize(objective, initial_guess, method='SLSQP', constraints=cons, options=options) # 提取最优解 u_opt = result.x print("优化成功:", result.success) print("最优目标函数值 (总能量):", result.fun) print("终端约束违反情况:", terminal_constraints(u_opt)) ``` 运行上述代码，你应该能看到优化器成功收敛，并输出一个最优能量值。`u_opt` 就是我们寻找的最优控制序列。为了看到全貌，我们还需要计算并可视化对应的状态轨迹。 ```python # 计算最优控制对应的状态轨迹 x_opt, v_opt = simulate_states(u_opt) # 可视化结果 fig, axes = plt.subplots(3, 1, figsize=(10, 8), sharex=True) # 控制力 u(t) axes[0].step(t_grid[:-1], u_opt, where='post', label='Optimal Control u(t)') axes[0].axhline(y=g, color='r', linestyle='--', alpha=0.7, label='Gravity (g)') axes[0].set_ylabel('Control Force u') axes[0].legend() axes[0].grid(True, alpha=0.3) # 高度 x(t) axes[1].plot(t_grid, x_opt, 'b-o', markersize=3, label='Height x(t)') axes[1].axhline(y=H, color='g', linestyle='--', alpha=0.7, label='Target H') axes[1].set_ylabel('Height x') axes[1].legend() axes[1].grid(True, alpha=0.3) # 速度 v(t) axes[2].plot(t_grid, v_opt, 'r-o', markersize=3, label='Velocity v(t)') axes[2].axhline(y=0, color='k', linestyle='--', alpha=0.5) axes[2].set_xlabel('Time t') axes[2].set_ylabel('Velocity v') axes[2].legend() axes[2].grid(True, alpha=0.3) plt.suptitle('Optimal Control Solution for Minimum-Energy Ascent') plt.tight_layout() plt.show() ``` 这段代码会生成三张子图，分别展示最优控制力、高度轨迹和速度轨迹随时间的变化。你可以清晰地看到，控制力 `u(t)` 在开始时较大，以提供足够的加速度，随后逐渐减小，在终点前甚至可能小于重力（变为负值，即制动），以确保速度在终点时恰好降为零。高度曲线平滑地上升到目标值 `H`，速度曲线则先增后减，终点归零。 ## 4. 深入解析：从数值解到物理洞察与方案优化得到数值解只是第一步，更重要的是理解这个解是否合理，以及如何改进我们的求解方案。 **首先，验证解的物理合理性。** 观察得到的最优控制曲线 `u(t)`，它通常呈现以下趋势： 1. 初期 `u > g`：产生向上的净加速度，使速度从零开始增加。 2. 中后期 `u` 逐渐减小：当速度足够后，减少推力以节省能量。 3. 末期 `u < g`：提供向下的净加速度（制动），使速度在终点时平滑地降为零。这完全符合我们的物理直觉：为了用最少的能量到达指定高度并静止，你应该先加速，然后“滑行”，最后减速。我们的数值解捕捉到了这一行为。 **其次，与解析解对比（如果存在）。** 对于这个“最省力爬升”问题，它本质上是一个线性二次型调节器问题，存在解析解。利用最优控制理论中的庞特里亚金极小值原理，可以推导出最优控制律是状态的线性反馈，且协态变量是线性的。对于我们的简单模型，最优控制 `u*(t)` 实际上是一个关于时间的线性函数。我们可以将数值解与这个线性函数进行拟合对比，以验证离散化方法和优化算法的准确性。在代码中添加以下部分： ```python # 假设我们通过理论推导（或猜测）知道最优控制是线性的： u*(t) = a*t + b # 用数值解进行线性回归，看拟合度如何 A = np.vstack([t_grid[:-1], np.ones(len(t_grid[:-1]))]).T m, c = np.linalg.lstsq(A, u_opt, rcond=None)[0] u_linear_fit = m * t_grid[:-1] + c # 绘制对比 plt.figure(figsize=(8,5)) plt.step(t_grid[:-1], u_opt, where='post', label='Numerical Optimal u(t)') plt.plot(t_grid[:-1], u_linear_fit, 'r--', linewidth=2, label=f'Linear Fit: {m:.2f}t + {c:.2f}') plt.axhline(y=g, color='k', linestyle=':', alpha=0.5, label='Gravity') plt.xlabel('Time t') plt.ylabel('Control Force u') plt.title('Numerical Solution vs. Theoretical Linear Trend') plt.legend() plt.grid(True, alpha=0.3) plt.show() print(f"线性拟合参数: slope = {m:.4f}, intercept = {c:.4f}") print(f"拟合优度 R^2: {1 - np.sum((u_opt - u_linear_fit)**2)/np.sum((u_opt - np.mean(u_opt))**2):.4f}") ``` 如果拟合优度 `R^2` 非常接近1，说明我们的数值解与理论预测的线性趋势高度吻合，这强有力地证明了求解过程的正确性。 **第三，探讨离散化与算法的高级选项。** 我们之前使用的是最简单的**前向欧拉法**和**零阶保持**。为了提高精度，尤其是在 `N` 较小或系统刚度较大时，我们可以进行升级： * **状态离散化方法**：采用更高精度的数值积分方法，如**梯形法**或**龙格-库塔法**。这需要修改 `simulate_states` 函数。例如，使用二阶龙格-库塔法： ```python def simulate_states_rk2(u_vals): x = np.zeros(N+1) v = np.zeros(N+1) x[0], v[0] = 0.0, 0.0 for k in range(N): u_k = u_vals[k] # RK2 (中点法) k1_x = v[k] k1_v = u_k - g k2_x = v[k] + 0.5 * dt * k1_v k2_v = u_k - g # 注意，u在区间内恒定，所以中点处的控制力仍是u_k x[k+1] = x[k] + dt * k2_x v[k+1] = v[k] + dt * k2_v return x, v ``` * **控制参数化**：除了零阶保持，还可以采用**分段线性**或**样条插值**来表示 `u(t)`。这相当于用更少的参数（如样条的控制点）来表征控制曲线，可以降低优化问题的维度。`scipy.interpolate` 模块可以帮助实现。 * **直接转录法**：这是一种更现代、更强大的方法。它将整个状态轨迹 `x_k`, `v_k` 也作为优化变量，同时将动力学约束 `x_{k+1} = f(x_k, u_k)` 作为等式约束全部加入优化问题。这样做的优点是避免了误差累积，并且可以利用优化求解器强大的处理约束能力。`scipy.optimize.minimize` 同样可以处理，但决策变量会从 `N` 个激增到大约 `3*(N+1)` 个（状态+控制），问题规模更大。 **第四，处理不等式约束。** 真实的工程问题总是充满限制。例如，电机的推力有上限和下限：`u_min <= u(t) <= u_max`。在Scipy中，处理这种约束非常方便。我们可以使用 `bounds` 参数。 ```python # 定义控制力的上下界 u_min = 0.0 # 推力不能为负（假设不能向下喷气） u_max = 2.0 * g # 最大推力为2倍重力 # 为每个控制变量定义边界 bounds = [(u_min, u_max) for _ in range(num_u)] # 在调用 minimize 时添加 bounds 参数 result_with_bounds = minimize(objective, initial_guess, method='SLSQP', constraints=cons, bounds=bounds, options=options) ``` 加上边界约束后，最优解可能会发生显著变化。例如，如果 `u_max` 不够大，可能无法在给定时间 `T` 内到达高度 `H`，此时问题可能无可行解，优化会失败。你需要分析结果，判断是调整边界、延长时间 `T`，还是接受一个次优解（例如，放松终端速度为零的约束）。 **最后，性能与鲁棒性考量。** * **初值敏感性**：对于非凸问题，不同的初始猜测可能导致收敛到不同的局部最优解。尝试不同的 `initial_guess`（如零序列、随机序列）是一个好习惯。 * **网格密度 `N`**：增加 `N` 可以提高近似精度，但也会增加优化问题的维度，使计算变慢。通常的做法是从较小的 `N` 开始，得到一个粗略解，然后以此解作为初值，在更细的网格上进一步优化。 * **求解器选择**：`SLSQP` 适用于中小规模问题。对于大规模问题（`N` 很大），可以考虑专门针对最优控制问题的软件包，如 `GEKKO`、`CasADi` 或 `Pyomo`，它们内置了更高效的稀疏求解器和自动微分功能。通过以上步骤，你不仅得到了一个具体问题的解，更掌握了一套将连续动态优化问题转化为可计算模型的通用方法论。这套方法的核心思想——**离散化、参数化、利用通用优化器求解**——具有极强的普适性，可以扩展到多状态、多控制、非线性动力学、路径约束等复杂得多的最优控制场景中。

创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

下一篇 Python异步数据库实战：用aiomysql打造高性能订单系统（附完整代码）

目录

Python实战：用Scipy库求解最优控制问题（附完整代码）

Python内容推荐

python中线性规划中的单纯形法、scipy库与非线性规划求解问题

python scipy求解非线性方程的方法(fsolve/root)

大M法、excel规划求解包、python编程和python包分别求解线性规划问题

Python-单纯形法（大M法）求解 直接求解、借助scipy包

python安装scipy的步骤解析

python安装scipy的方法步骤

python 3.8 安装numpy和scipy

scipy for win64 python2.7

scipy.txt python第三方库SciPy库百度云下载地址，官方下载太慢了，下载好了分享给大家

python科学计算之scipy——optimize用法

python scipy 学习手册

Python3.7打包whl库，包括numpy、scikit、matplotlib、pandas、scipy等whl

python使用pip安装SciPy、SymPy、matplotlib教程

python编程–通过单纯形法和scipy库实现线性规划以及通过拉格朗日来求解非线性

深入浅析Python科学计算库Scipy及安装步骤

win64 python2.7+numpy+scipy找了好久才整理出来的

python3.7 Scipy和numpy的whl文件

Python基于scipy实现信号滤波功能

Python线性方程组求解运算示例

Python项目开发实战 源代码

学生成绩管理系统C++课程设计与实践

别再手动拖拽了！用Lumerical脚本批量创建FDTD仿真结构（附完整代码）

Java邮件解析任务中，如何安全高效地提取HTML邮件内容并避免硬编码、资源泄漏和类型转换异常？

RH公司应收账款管理优化策略研究

新手别慌！用BingPi-M2开发板带你5分钟搞懂Tina Linux SDK目录结构

Java线程池运行时状态怎么实时掌握？有哪些靠谱的监控手段？

桌面工具软件项目效益评估及市场预测分析

告别遮挡！UniApp中WebView与原生导航栏的和谐共处方案（附完整可运行代码）

OSPF是怎么在企业网里自动找最优路径并分区域管理的？

UML建模课程设计：图书馆管理系统论文

Python-单纯形法（大M法）求解直接求解、借助scipy包

Python项目开发实战源代码