【IoT】无人机辅助应急响应行动中无人机轨迹、任务卸载与资源分配的联合优化

这篇发表于《IEEE INTERNET OF THINGS JOURNAL》2025 年 6 月的文章,聚焦于自主飞行器(AAV)辅助应急响应场景中,联合优化轨迹规划、任务卸载与资源分配的问题,提出了两种高效算法以提升系统性能[1]。

研究背景与问题

在应急响应(如地震、火灾后的搜救、 damage assessment)中,旋翼自主飞行器(AAV scouts)需执行计算密集型任务(如人体检测、实时 mapping),但受限于自身资源,需将任务卸载至配备边缘服务器的固定翼AAV母船(UMECs)。然而,固定翼UMEC存在最小转弯半径限制(影响机动性、能耗和任务延迟),且UMEC的任务处理能力(如支持的任务类型、CPU/GPU资源)有限。因此,需联合优化:

  1. UMEC的轨迹规划(满足移动约束);
  2. AAV scouts的任务卸载决策(选择本地处理或卸载至UMEC);
  3. UMEC的CPU/GPU资源分配(确保任务高效执行)。

目标是最小化系统总能耗(包括任务处理和UMEC飞行能耗)和任务执行延迟

系统模型

网络架构

  • AAV scouts:旋翼飞行器,负责生成任务(如数据大小bi[n]b_i[n]、所需CPU周期ci[n]c_i[n]、GPU FLOPsgi[n]g_i[n]、任务类型ti[n]t_i[n]),自身配备有限CPU/GPU资源。
  • UMECs:固定翼飞行器,配备边缘服务器,提供任务卸载服务,具有最小转弯半径rjr_j、最大速度VmaxV_{max}等移动约束,且仅能处理特定类型任务(集合Kj\mathbb{K}_j)。

核心模型

  • 移动模型:UMEC的位置更新需满足最小转弯半径(通过角度变化阈值φ\varphi约束)、最大速度、UMEC间最小距离(避免碰撞)等。

移动模型主要围绕固定翼自主飞行器母船(UMECs)和旋翼自主飞行器侦察机(AAVscouts)的运动特性展开,重点描述了UMECs的移动约束与位置更新规则,以下是详细解释:

UMECs的位置表示与更新

UMECs的运动在二维平面(忽略高度变化,假设飞行高度恒定)中建模,核心是通过速度和角度参数更新每个时隙的位置:

  • 位置表示:UMECjj在时隙nn的3D坐标为wj[n]=(xj[n],yj[n],H)w_j[n] = (x_j[n], y_j[n], H),其中HH为固定飞行高度,xj[n]x_j[n]yj[n]y_j[n]为水平坐标。
  • 位置更新公式:若UMECjj在时隙nn的速度为vj[n]v_j[n]、水平方向角度为θj[n]\theta_j[n](范围[0,2π][0, 2\pi]),则时隙n+1n+1的坐标为:

xj[n+1]=xj[n]+vj[n]δcos(θj[n]) x_j[n+1] = x_j[n] + v_j[n] \cdot \delta \cdot \cos(\theta_j[n])

yj[n+1]=yj[n]+vj[n]δsin(θj[n]) y_j[n+1] = y_j[n] + v_j[n] \cdot \delta \cdot \sin(\theta_j[n])

其中,δ\delta为时隙长度(单位:秒),公式体现了速度、角度对位移的影响。

UMECs的核心移动约束

固定翼UMECs的机动性受物理特性限制,需满足多项约束,其中最小转弯半径约束是最关键的特性:

最小转弯半径约束

固定翼飞行器无法实现任意急转弯,必须保持不小于其最小转弯半径rjr_j的轨迹,这一约束通过角度变化阈值φ\varphi实现:

  • 角度变化计算:UMEC从时隙nnn+1n+1的角度变化(即方向改变幅度)需满足:

arccos(bcbc)φ \arccos\left( \frac{b \cdot c}{|b| \cdot |c|} \right) \leq \varphi

其中,aa为从wj[n1]w_j[n-1]wj[n]w_j[n]的向量(历史方向),bb为若保持原方向的预测位移向量,cc为实际位移向量(从wj[n]w_j[n]wj[n+1]w_j[n+1]),角度变化反映了转弯的剧烈程度。

  • 阈值φ\varphi的确定φ\varphi由UMEC的最小转弯半径rjr_j推导,通过绘制以当前位置为中心的“转弯圆”与“中心圆”的交点计算,确保转弯轨迹的半径不小于rjr_j,近似为:

φ=π2arctan(y2y1x2x1) \varphi = \frac{\pi}{2} - \arctan\left( \frac{y_2 - y_1}{x_2 - x_1} \right)

其中(x1,y1)(x_1, y_1)为当前位置,(x2,y2)(x_2, y_2)为两圆交点坐标。

其他移动约束
  • 速度限制:UMEC的速度vj[n]v_j[n]不得超过最大速度VmaxV_{max},即vj[n]Vmaxv_j[n] \leq V_{max}
  • 位置边界:UMEC的坐标需在指定区域内,即0xj[n+1]Xmax0 \leq x_j[n+1] \leq X_{max}0yj[n+1]Ymax0 \leq y_j[n+1] \leq Y_{max},其中XmaxX_{max}YmaxY_{max}为区域最大横纵坐标。
  • 距离约束
    • 所有UMEC需在主UMEC(j=1j=1)的通信覆盖范围内,即wj=1[n+1]wj1[n+1]Cj=1max\| w_{j=1}[n+1] - w_{j \neq 1}[n+1] \| \leq C_{j=1}^{max}Cj=1maxC_{j=1}^{max}为主UMEC通信半径);
    • UMEC间需保持最小距离dmind_{min}以避免碰撞,即wj[n+1]wj[n+1]dmin\| w_j[n+1] - w_{j'}[n+1] \| \geq d_{min}jjj \neq j')。
AAV scouts的移动特性

与UMECs不同,AAV scouts的移动轨迹由任务需求预定义(如搜救任务的网格路径、灾情热点的预设路线),其速度和位置变化是固定的,因此飞行能耗被视为常数,不纳入优化模型(仅优化任务处理相关能耗)。

总结

该移动模型通过严格的约束(尤其是最小转弯半径)刻画了固定翼UMECs的物理运动限制,同时明确了位置更新规则,为后续轨迹规划、任务卸载与资源分配的联合优化提供了基础——确保优化决策符合飞行器的实际运动能力,避免因不切实际的轨迹设计导致能耗激增或任务失败至。

  • 通信模型:采用OFDMA技术,AAV与UMEC的传输速率基于自由空间路径损耗模型计算。
  • 计算模型:任务执行时间包括传输延迟(卸载时)、CPU/GPU处理延迟;能耗包括传输能耗、计算能耗(与CPU周期/GPU FLOPs成正比)、UMEC飞行能耗(与速度立方成正比)。

问题 formulation

优化目标

最小化加权总和:

miniUα1Ttotali[n]Tmax[n]+α2Etotali[n]Emax[n]+α3jMEflyj[n]Eflymax[n]\min \sum_{i \in \mathbb{U}} \alpha_1 \frac{T_{total}^i[n]}{T^{max}[n]} + \alpha_2 \frac{E_{total}^i[n]}{E^{max}[n]} + \alpha_3 \sum_{j \in \mathbb{M}} \frac{E_{fly}^j[n]}{E_{fly}^{max}[n]}

其中,Ttotali[n]T_{total}^i[n]为任务总延迟,Etotali[n]E_{total}^i[n]为任务处理能耗,Eflyj[n]E_{fly}^j[n]为UMEC飞行能耗,α1,α2,α3\alpha_1,\alpha_2,\alpha_3为权重。

约束条件

  • 移动约束:UMEC的最小转弯半径、最大速度、位置边界等;
  • 任务约束:卸载任务需与UMEC关联,且UMEC需支持该任务类型;
  • 资源约束:UMEC的CPU/GPU资源分配总和不超过其容量。

问题分解

将原问题拆分为三个子问题:

  • 轨迹规划(TP):优化UMEC的速度和角度,生成轨迹;
  • 关联问题:确定AAV scouts与UMEC的关联关系;
  • 任务卸载与资源分配(TR):决策任务卸载比例及CPU/GPU资源分配。

提出的算法

P-TTR(基于粒子群优化PSO)

  • 轨迹规划:用PSO算法搜索UMEC的最优速度和角度。粒子编码包含UMEC的速度和角度,适应度函数基于系统能耗和延迟设计,通过迭代更新粒子位置(参考个人最优和全局最优)。
  • 任务卸载与资源分配:采用块坐标下降法。先固定资源分配,用CVX求解卸载决策;再固定卸载决策,通过KKT条件求解CPU/GPU资源分配的闭式解。

S-TTR(基于深度强化学习SAC)

为适应动态环境(如任务量变化),将问题建模为马尔可夫决策过程(MDP):

  • 状态:UMEC的历史速度/角度、当前位置、与AAV的距离;
  • 动作:UMEC的速度和角度(控制轨迹);
  • 奖励:基于系统能耗和延迟设计,鼓励低能耗和低延迟。

通过SAC算法训练策略网络,实现轨迹、卸载和资源分配的联合优化,支持实时决策。

性能评估

实验设置

  • 场景:3km×3km区域,3个UMEC,4-12个AAV scouts,任务参数(数据大小、GPU FLOPs等)在指定范围内变化。
  • 基线方法:G-TTR(贪心策略,基于初始解生成轨迹)。

关键结果

指标 表现结论
总能耗 S-TTR < P-TTR < G-TTR,S-TTR在高任务量下节能约25%(相比G-TTR)。
任务延迟 S-TTR延迟略高于P-TTR,但显著低于G-TTR,在大任务量下延迟降低约10%。
决策时间 S-TTR最快(0.0113-0.018ms/时隙),适合实时应急场景;P-TTR需1.25-1.55ms。
适应性 S-TTR在动态任务参数(如任务大小、GPU需求)下表现稳定,P-TTR需重新执行。

创新点与贡献

  1. 问题建模:首次考虑固定翼UMEC的最小转弯半径约束,及CPU/GPU联合处理任务,更贴合实际应急场景。
  2. 算法设计:提出两种互补算法——P-TTR(高精度但决策慢)和S-TTR(实时性强,适应动态环境)。
  3. 性能验证:通过多场景仿真证明了方法在能耗、延迟和实时性上的优势,为应急响应中的AAV资源优化提供了实用方案。

结论

文章针对AAV辅助应急响应中的联合优化问题,提出了PSO和SAC-based算法,有效平衡了系统能耗和任务延迟。S-TTR在动态环境中表现更优,适合实时决策;P-TTR适合对精度要求高、非实时的场景。未来可进一步扩展到更多UMEC协作或复杂任务依赖场景。

[1] S. Akter, D. Van Anh Duong and S. Yoon, “Joint Optimization of AAV Trajectory, Task Offloading, and Resource Allocation in AAV-Aided Emergency Response Operations,” in IEEE Internet of Things Journal, vol. 12, no. 12, pp. 21944-21959, 15 June15, 2025, doi: 10.1109/JIOT.2025.3549048.
keywords: {Autonomous aerial vehicles;Resource management;Trajectory;Trajectory planning;Energy consumption;Servers;Graphics processing units;Turning;Optimization;Heuristic algorithms;Autonomous aerial vehicle (AAV);deep reinforcement learning (DRL);multi-access edge computing (MEC);particle swarm optimization (PSO);resource allocation (RA);task offloading (TO);trajectory planning (TP)},