【IoT】无人机辅助应急响应行动中无人机轨迹、任务卸载与资源分配的联合优化
这篇发表于《IEEE INTERNET OF THINGS JOURNAL》2025 年 6 月的文章,聚焦于自主飞行器(AAV)辅助应急响应场景中,联合优化轨迹规划、任务卸载与资源分配的问题,提出了两种高效算法以提升系统性能[1]。
研究背景与问题
在应急响应(如地震、火灾后的搜救、 damage assessment)中,旋翼自主飞行器(AAV scouts)需执行计算密集型任务(如人体检测、实时 mapping),但受限于自身资源,需将任务卸载至配备边缘服务器的固定翼AAV母船(UMECs)。然而,固定翼UMEC存在最小转弯半径限制(影响机动性、能耗和任务延迟),且UMEC的任务处理能力(如支持的任务类型、CPU/GPU资源)有限。因此,需联合优化:
- UMEC的轨迹规划(满足移动约束);
- AAV scouts的任务卸载决策(选择本地处理或卸载至UMEC);
- UMEC的CPU/GPU资源分配(确保任务高效执行)。
目标是最小化系统总能耗(包括任务处理和UMEC飞行能耗)和任务执行延迟。
系统模型
网络架构
- AAV scouts:旋翼飞行器,负责生成任务(如数据大小、所需CPU周期、GPU FLOPs、任务类型),自身配备有限CPU/GPU资源。
- UMECs:固定翼飞行器,配备边缘服务器,提供任务卸载服务,具有最小转弯半径、最大速度等移动约束,且仅能处理特定类型任务(集合)。
核心模型
- 移动模型:UMEC的位置更新需满足最小转弯半径(通过角度变化阈值约束)、最大速度、UMEC间最小距离(避免碰撞)等。
移动模型主要围绕固定翼自主飞行器母船(UMECs)和旋翼自主飞行器侦察机(AAVscouts)的运动特性展开,重点描述了UMECs的移动约束与位置更新规则,以下是详细解释:
UMECs的位置表示与更新
UMECs的运动在二维平面(忽略高度变化,假设飞行高度恒定)中建模,核心是通过速度和角度参数更新每个时隙的位置:
- 位置表示:UMEC在时隙的3D坐标为,其中为固定飞行高度,、为水平坐标。
- 位置更新公式:若UMEC在时隙的速度为、水平方向角度为(范围),则时隙的坐标为:
其中,为时隙长度(单位:秒),公式体现了速度、角度对位移的影响。
UMECs的核心移动约束
固定翼UMECs的机动性受物理特性限制,需满足多项约束,其中最小转弯半径约束是最关键的特性:
最小转弯半径约束
固定翼飞行器无法实现任意急转弯,必须保持不小于其最小转弯半径的轨迹,这一约束通过角度变化阈值实现:
- 角度变化计算:UMEC从时隙到的角度变化(即方向改变幅度)需满足:
其中,为从到的向量(历史方向),为若保持原方向的预测位移向量,为实际位移向量(从到),角度变化反映了转弯的剧烈程度。
- 阈值的确定:由UMEC的最小转弯半径推导,通过绘制以当前位置为中心的“转弯圆”与“中心圆”的交点计算,确保转弯轨迹的半径不小于,近似为:
其中为当前位置,为两圆交点坐标。
其他移动约束
- 速度限制:UMEC的速度不得超过最大速度,即。
- 位置边界:UMEC的坐标需在指定区域内,即、,其中、为区域最大横纵坐标。
- 距离约束:
- 所有UMEC需在主UMEC()的通信覆盖范围内,即(为主UMEC通信半径);
- UMEC间需保持最小距离以避免碰撞,即()。
AAV scouts的移动特性
与UMECs不同,AAV scouts的移动轨迹由任务需求预定义(如搜救任务的网格路径、灾情热点的预设路线),其速度和位置变化是固定的,因此飞行能耗被视为常数,不纳入优化模型(仅优化任务处理相关能耗)。
总结
该移动模型通过严格的约束(尤其是最小转弯半径)刻画了固定翼UMECs的物理运动限制,同时明确了位置更新规则,为后续轨迹规划、任务卸载与资源分配的联合优化提供了基础——确保优化决策符合飞行器的实际运动能力,避免因不切实际的轨迹设计导致能耗激增或任务失败至。
- 通信模型:采用OFDMA技术,AAV与UMEC的传输速率基于自由空间路径损耗模型计算。
- 计算模型:任务执行时间包括传输延迟(卸载时)、CPU/GPU处理延迟;能耗包括传输能耗、计算能耗(与CPU周期/GPU FLOPs成正比)、UMEC飞行能耗(与速度立方成正比)。
问题 formulation
优化目标
最小化加权总和:
其中,为任务总延迟,为任务处理能耗,为UMEC飞行能耗,为权重。
约束条件
- 移动约束:UMEC的最小转弯半径、最大速度、位置边界等;
- 任务约束:卸载任务需与UMEC关联,且UMEC需支持该任务类型;
- 资源约束:UMEC的CPU/GPU资源分配总和不超过其容量。
问题分解
将原问题拆分为三个子问题:
- 轨迹规划(TP):优化UMEC的速度和角度,生成轨迹;
- 关联问题:确定AAV scouts与UMEC的关联关系;
- 任务卸载与资源分配(TR):决策任务卸载比例及CPU/GPU资源分配。
提出的算法
P-TTR(基于粒子群优化PSO)
- 轨迹规划:用PSO算法搜索UMEC的最优速度和角度。粒子编码包含UMEC的速度和角度,适应度函数基于系统能耗和延迟设计,通过迭代更新粒子位置(参考个人最优和全局最优)。
- 任务卸载与资源分配:采用块坐标下降法。先固定资源分配,用CVX求解卸载决策;再固定卸载决策,通过KKT条件求解CPU/GPU资源分配的闭式解。
S-TTR(基于深度强化学习SAC)
为适应动态环境(如任务量变化),将问题建模为马尔可夫决策过程(MDP):
- 状态:UMEC的历史速度/角度、当前位置、与AAV的距离;
- 动作:UMEC的速度和角度(控制轨迹);
- 奖励:基于系统能耗和延迟设计,鼓励低能耗和低延迟。
通过SAC算法训练策略网络,实现轨迹、卸载和资源分配的联合优化,支持实时决策。
性能评估
实验设置
- 场景:3km×3km区域,3个UMEC,4-12个AAV scouts,任务参数(数据大小、GPU FLOPs等)在指定范围内变化。
- 基线方法:G-TTR(贪心策略,基于初始解生成轨迹)。
关键结果
指标 | 表现结论 |
---|---|
总能耗 | S-TTR < P-TTR < G-TTR,S-TTR在高任务量下节能约25%(相比G-TTR)。 |
任务延迟 | S-TTR延迟略高于P-TTR,但显著低于G-TTR,在大任务量下延迟降低约10%。 |
决策时间 | S-TTR最快(0.0113-0.018ms/时隙),适合实时应急场景;P-TTR需1.25-1.55ms。 |
适应性 | S-TTR在动态任务参数(如任务大小、GPU需求)下表现稳定,P-TTR需重新执行。 |
创新点与贡献
- 问题建模:首次考虑固定翼UMEC的最小转弯半径约束,及CPU/GPU联合处理任务,更贴合实际应急场景。
- 算法设计:提出两种互补算法——P-TTR(高精度但决策慢)和S-TTR(实时性强,适应动态环境)。
- 性能验证:通过多场景仿真证明了方法在能耗、延迟和实时性上的优势,为应急响应中的AAV资源优化提供了实用方案。
结论
文章针对AAV辅助应急响应中的联合优化问题,提出了PSO和SAC-based算法,有效平衡了系统能耗和任务延迟。S-TTR在动态环境中表现更优,适合实时决策;P-TTR适合对精度要求高、非实时的场景。未来可进一步扩展到更多UMEC协作或复杂任务依赖场景。
[1] S. Akter, D. Van Anh Duong and S. Yoon, “Joint Optimization of AAV Trajectory, Task Offloading, and Resource Allocation in AAV-Aided Emergency Response Operations,” in IEEE Internet of Things Journal, vol. 12, no. 12, pp. 21944-21959, 15 June15, 2025, doi: 10.1109/JIOT.2025.3549048.
keywords: {Autonomous aerial vehicles;Resource management;Trajectory;Trajectory planning;Energy consumption;Servers;Graphics processing units;Turning;Optimization;Heuristic algorithms;Autonomous aerial vehicle (AAV);deep reinforcement learning (DRL);multi-access edge computing (MEC);particle swarm optimization (PSO);resource allocation (RA);task offloading (TO);trajectory planning (TP)},