【IoT】无人机辅助应急响应行动中无人机轨迹、任务卸载与资源分配的联合优化

发表于 2025-07-12 分类于建模本文字数： 2.5k 阅读时长 ≈ 9 分钟

这篇发表于《IEEE INTERNET OF THINGS JOURNAL》2025 年 6 月的文章，聚焦于自主飞行器（AAV）辅助应急响应场景中，联合优化轨迹规划、任务卸载与资源分配的问题，提出了两种高效算法以提升系统性能[1]。

研究背景与问题

在应急响应（如地震、火灾后的搜救、 damage assessment）中，旋翼自主飞行器（AAV scouts）需执行计算密集型任务（如人体检测、实时 mapping），但受限于自身资源，需将任务卸载至配备边缘服务器的固定翼AAV母船（UMECs）。然而，固定翼UMEC存在最小转弯半径限制（影响机动性、能耗和任务延迟），且UMEC的任务处理能力（如支持的任务类型、CPU/GPU资源）有限。因此，需联合优化：

UMEC的轨迹规划（满足移动约束）；
AAV scouts的任务卸载决策（选择本地处理或卸载至UMEC）；
UMEC的CPU/GPU资源分配（确保任务高效执行）。

目标是最小化系统总能耗（包括任务处理和UMEC飞行能耗）和任务执行延迟。

系统模型

网络架构

AAV scouts：旋翼飞行器，负责生成任务（如数据大小 $b_i[n]$ 、所需CPU周期 $c_i[n]$ 、GPU FLOPs $g_i[n]$ 、任务类型 $t_i[n]$ ），自身配备有限CPU/GPU资源。
UMECs：固定翼飞行器，配备边缘服务器，提供任务卸载服务，具有最小转弯半径 $r_j$ 、最大速度 $V_{max}$ 等移动约束，且仅能处理特定类型任务（集合 $\mathbb{K}_j$ ）。

核心模型

移动模型：UMEC的位置更新需满足最小转弯半径（通过角度变化阈值 $\varphi$ 约束）、最大速度、UMEC间最小距离（避免碰撞）等。

移动模型主要围绕固定翼自主飞行器母船（UMECs）和旋翼自主飞行器侦察机（AAVscouts）的运动特性展开，重点描述了UMECs的移动约束与位置更新规则，以下是详细解释：

UMECs的位置表示与更新

UMECs的运动在二维平面（忽略高度变化，假设飞行高度恒定）中建模，核心是通过速度和角度参数更新每个时隙的位置：

位置表示：UMEC $j$ 在时隙 $n$ 的3D坐标为 $w_j[n] = (x_j[n], y_j[n], H)$ ，其中 $H$ 为固定飞行高度， $x_j[n]$ 、 $y_j[n]$ 为水平坐标。
位置更新公式：若UMEC $j$ 在时隙 $n$ 的速度为 $v_j[n]$ 、水平方向角度为 $\theta_j[n]$ （范围 $[0, 2\pi]$ ），则时隙 $n+1$ 的坐标为：

x_j[n+1] = x_j[n] + v_j[n] \cdot \delta \cdot \cos(\theta_j[n])

y_j[n+1] = y_j[n] + v_j[n] \cdot \delta \cdot \sin(\theta_j[n])

其中， $\delta$ 为时隙长度（单位：秒），公式体现了速度、角度对位移的影响。

UMECs的核心移动约束

固定翼UMECs的机动性受物理特性限制，需满足多项约束，其中最小转弯半径约束是最关键的特性：

最小转弯半径约束

固定翼飞行器无法实现任意急转弯，必须保持不小于其最小转弯半径 $r_j$ 的轨迹，这一约束通过角度变化阈值 $\varphi$ 实现：

角度变化计算：UMEC从时隙 $n$ 到 $n+1$ 的角度变化（即方向改变幅度）需满足：

\arccos\left( \frac{b \cdot c}{|b| \cdot |c|} \right) \leq \varphi

其中， $a$ 为从 $w_j[n-1]$ 到 $w_j[n]$ 的向量（历史方向）， $b$ 为若保持原方向的预测位移向量， $c$ 为实际位移向量（从 $w_j[n]$ 到 $w_j[n+1]$ ），角度变化反映了转弯的剧烈程度。

阈值 $\varphi$ 的确定： $\varphi$ 由UMEC的最小转弯半径 $r_j$ 推导，通过绘制以当前位置为中心的“转弯圆”与“中心圆”的交点计算，确保转弯轨迹的半径不小于 $r_j$ ，近似为：

\varphi = \frac{\pi}{2} - \arctan\left( \frac{y_2 - y_1}{x_2 - x_1} \right)

其中 $(x_1, y_1)$ 为当前位置， $(x_2, y_2)$ 为两圆交点坐标。

其他移动约束

速度限制：UMEC的速度 $v_j[n]$ 不得超过最大速度 $V_{max}$ ，即 $v_j[n] \leq V_{max}$ 。
位置边界：UMEC的坐标需在指定区域内，即 $0 \leq x_j[n+1] \leq X_{max}$ 、 $0 \leq y_j[n+1] \leq Y_{max}$ ，其中 $X_{max}$ 、 $Y_{max}$ 为区域最大横纵坐标。
距离约束：
- 所有UMEC需在主UMEC（ $j=1$ ）的通信覆盖范围内，即 $\| w_{j=1}[n+1] - w_{j \neq 1}[n+1] \| \leq C_{j=1}^{max}$ （ $C_{j=1}^{max}$ 为主UMEC通信半径）；
- UMEC间需保持最小距离 $d_{min}$ 以避免碰撞，即 $\| w_j[n+1] - w_{j'}[n+1] \| \geq d_{min}$ （ $j \neq j'$ ）。

AAV scouts的移动特性

与UMECs不同，AAV scouts的移动轨迹由任务需求预定义（如搜救任务的网格路径、灾情热点的预设路线），其速度和位置变化是固定的，因此飞行能耗被视为常数，不纳入优化模型（仅优化任务处理相关能耗）。

总结

该移动模型通过严格的约束（尤其是最小转弯半径）刻画了固定翼UMECs的物理运动限制，同时明确了位置更新规则，为后续轨迹规划、任务卸载与资源分配的联合优化提供了基础——确保优化决策符合飞行器的实际运动能力，避免因不切实际的轨迹设计导致能耗激增或任务失败至。

通信模型：采用OFDMA技术，AAV与UMEC的传输速率基于自由空间路径损耗模型计算。
计算模型：任务执行时间包括传输延迟（卸载时）、CPU/GPU处理延迟；能耗包括传输能耗、计算能耗（与CPU周期/GPU FLOPs成正比）、UMEC飞行能耗（与速度立方成正比）。

问题 formulation

优化目标

最小化加权总和：

\min \sum_{i \in \mathbb{U}} \alpha_1 \frac{T_{total}^i[n]}{T^{max}[n]} + \alpha_2 \frac{E_{total}^i[n]}{E^{max}[n]} + \alpha_3 \sum_{j \in \mathbb{M}} \frac{E_{fly}^j[n]}{E_{fly}^{max}[n]}

其中， $T_{total}^i[n]$ 为任务总延迟， $E_{total}^i[n]$ 为任务处理能耗， $E_{fly}^j[n]$ 为UMEC飞行能耗， $\alpha_1,\alpha_2,\alpha_3$ 为权重。

约束条件

移动约束：UMEC的最小转弯半径、最大速度、位置边界等；
任务约束：卸载任务需与UMEC关联，且UMEC需支持该任务类型；
资源约束：UMEC的CPU/GPU资源分配总和不超过其容量。

问题分解

将原问题拆分为三个子问题：

轨迹规划（TP）：优化UMEC的速度和角度，生成轨迹；
关联问题：确定AAV scouts与UMEC的关联关系；
任务卸载与资源分配（TR）：决策任务卸载比例及CPU/GPU资源分配。

提出的算法

P-TTR（基于粒子群优化PSO）

轨迹规划：用PSO算法搜索UMEC的最优速度和角度。粒子编码包含UMEC的速度和角度，适应度函数基于系统能耗和延迟设计，通过迭代更新粒子位置（参考个人最优和全局最优）。
任务卸载与资源分配：采用块坐标下降法。先固定资源分配，用CVX求解卸载决策；再固定卸载决策，通过KKT条件求解CPU/GPU资源分配的闭式解。

S-TTR（基于深度强化学习SAC）

为适应动态环境（如任务量变化），将问题建模为马尔可夫决策过程（MDP）：

状态：UMEC的历史速度/角度、当前位置、与AAV的距离；
动作：UMEC的速度和角度（控制轨迹）；
奖励：基于系统能耗和延迟设计，鼓励低能耗和低延迟。

通过SAC算法训练策略网络，实现轨迹、卸载和资源分配的联合优化，支持实时决策。

性能评估

实验设置

场景：3km×3km区域，3个UMEC，4-12个AAV scouts，任务参数（数据大小、GPU FLOPs等）在指定范围内变化。
基线方法：G-TTR（贪心策略，基于初始解生成轨迹）。

关键结果

指标	表现结论
总能耗	S-TTR < P-TTR < G-TTR，S-TTR在高任务量下节能约25%（相比G-TTR）。
任务延迟	S-TTR延迟略高于P-TTR，但显著低于G-TTR，在大任务量下延迟降低约10%。
决策时间	S-TTR最快（0.0113-0.018ms/时隙），适合实时应急场景；P-TTR需1.25-1.55ms。
适应性	S-TTR在动态任务参数（如任务大小、GPU需求）下表现稳定，P-TTR需重新执行。

创新点与贡献

问题建模：首次考虑固定翼UMEC的最小转弯半径约束，及CPU/GPU联合处理任务，更贴合实际应急场景。
算法设计：提出两种互补算法——P-TTR（高精度但决策慢）和S-TTR（实时性强，适应动态环境）。
性能验证：通过多场景仿真证明了方法在能耗、延迟和实时性上的优势，为应急响应中的AAV资源优化提供了实用方案。

结论

文章针对AAV辅助应急响应中的联合优化问题，提出了PSO和SAC-based算法，有效平衡了系统能耗和任务延迟。S-TTR在动态环境中表现更优，适合实时决策；P-TTR适合对精度要求高、非实时的场景。未来可进一步扩展到更多UMEC协作或复杂任务依赖场景。

[1] S. Akter, D. Van Anh Duong and S. Yoon, “Joint Optimization of AAV Trajectory, Task Offloading, and Resource Allocation in AAV-Aided Emergency Response Operations,” in IEEE Internet of Things Journal, vol. 12, no. 12, pp. 21944-21959, 15 June15, 2025, doi: 10.1109/JIOT.2025.3549048.
keywords: {Autonomous aerial vehicles;Resource management;Trajectory;Trajectory planning;Energy consumption;Servers;Graphics processing units;Turning;Optimization;Heuristic algorithms;Autonomous aerial vehicle (AAV);deep reinforcement learning (DRL);multi-access edge computing (MEC);particle swarm optimization (PSO);resource allocation (RA);task offloading (TO);trajectory planning (TP)},