UAV Review

写在前面#

趁着最近有空，我把最开始接触无人机科研时所收集的各个方向的文献和技术笔记整个翻出来，做了一次系统性梳理，也构建了一个我的Mind Map。

平时看论文、跑开源代码，笔记往往记得很碎。这次我试着拔高一点视角，把它们按方法范式、经典任务、平台设计以及底层技术栈重新串联起来，权当是一份面向研究与工程的速查手册。

Data-driven vs Model-based#

在无人机领域，data-driven 的方法与 model-based/modular 的方法在不同任务中的优势不同，仍处于分庭抗礼的阶段。它们其实并不是非此即彼的关系，而是各自适应了不同的任务难度。

为什么传统模块化方案依然坚挺？ 主要是因为无人机的动力学模型（尤其像四旋翼）在工程上不仅相对简单，而且十分容易在真实世界中进行校准。加上无人机多数任务是“穿越环境”而非“产生强物理交互”，依靠成熟的状态机、轨迹规划和底层控制优化，就能得到非常出色的飞行性能。我们日常看到的绝大多数商业无人机，底座依然是这一套。

端到端学习赢在哪儿？ 传统依赖于非常精准的状态估计和感知建模，但在小型化平台上，受限于算力、载重和传感器噪声，整套 pipeline 经常被逼到极限。这时候，基于学习的方法（特别是用强化学习处理感知驱动的敏捷飞行）就能跳过繁琐的显式建图和状态推导，展现出超越传统路线的反应速度和鲁棒性。

支持无人机 RL 的仿真器#

做深度学习/强化学习，离不开好用的仿真器，在无人机领域，有几个高频出现的“生产力工具”：

AirSim ↗：基于虚幻引擎（UE4/UE5），视觉效果极佳，动力学仿真也很逼真。不过底层改动门槛有点高，运行帧率对大规模 RL 训练来说偏低。
Flightmare ↗：主打就是一个快，非常适合需要海量数据采样的强化学习任务。
AerialGym：这是一类高度针对强化学习定制的环境封装，尤其在做 Sim2Real（仿真到现实转移）的研究里非常受欢迎。

经典技能与代表性工作#

主要介绍data-driven方法在经典任务上的应用。值得一提的是，以下的工作中，出现了一些摆脱了对SLAM系统和里程计依赖的方法，而无人机最初的兴起正是依靠 SLAM /里程计系统的日益成熟，将成为无人机技能学习中有趣的进展方向。

未知场景避障与敏捷飞行#

无人机怎么在充满未知障碍物的森林、废墟或者狭窄走廊里穿梭，这是一个极具代表性的难题。从早期到现在，大家想出了不少奇招：

早些年受自动驾驶启发，CMU 在 ICRA 2013 就尝试用监督学习把单目图像直接映射到离散控制指令上。后来，UCB 的 CAD2RL 登场，完全依靠仿真器里的单目 RGB 图像训练，结合 Domain Randomization（域随机化），成功在真实长廊里飞了起来。

后来苏黎世大学（UZH）的工作更是把这个方向推向了高潮：

DroNet 源码 ↗：巧妙借用自动驾驶汽车的数据集来教无人机输出速度指令。
Agile Autonomy 项目 ↗：发表在 SciRob 上，核心思路是用 DAgger 算法融合传统轨迹规划的专家数据，主张端到端网络的极低延迟可以大幅提升未知环境下的飞行速度极限。

国内的高校在这个方向也产出了极为亮眼的工作。比如上海交大的团队（Back to Newton’s Laws: Learning Vision-based Agile Flight via Differentiable Physics），提出利用可微物理模型提供一阶梯度来进行策略优化，抛弃了对显式位置速度估计的依赖，文章用低分辨率深度图，训练避障比 RL 更高效，实现高速飞行。

同样的，浙江大学 FAST 实验室更是将强化学习与机载雷达结合，实现了极致的自主避障；他们最新的 Flying on Point Clouds with Reinforcement Learning ↗ 工作，使用机载雷达和 sim2real RL 实现自主避障。虽然学习类方法进展一日千里，但如果你去实际工程项目里转一圈会发现，Ego-Planner ↗ 等传统的轨迹规划方案依旧是中流砥柱。原因很简单：它们在大部分场景下足够靠谱，且排查问题直观，而端到端方案的数据闭环和验证成本依然是个不小的坎。

其他经典任务实现代表性工作#

无人机目标识别与追捕

HOLA-Drone: Hypergraphic Open-ended Learning for Zero-Shot Multi-Drone Cooperative Pursuit ↗. Arxiv 2024, University of Manchester.
Multi-UAV Pursuit-Evasion with Online Planning in Unknown Environments by Deep Reinforcement Learning ↗. Arxiv 2024, THU.

无先验地图的无人机自主探索

Deep Reinforcement Learning-based Large-scale Robot Exploration ↗. Arxiv2024, National University of Singapore (NUS). 利用注意力机制学习不同空间尺度的依赖关系，对未知区域进行隐式预测，优化已知空间探索策略，提高探索效率。
ARiADNE: A Reinforcement learning approach using Attention-based Deep Networks for Exploration ↗. Arxiv2023, National University of Singapore (NUS). 学习已知不同区域在多个空间尺度上的相互依赖关系，并隐式预测探索这些区域可能获得的潜在收益。这使得代理能够安排行动顺序，以平衡在已知区域对地图进行开发/细化与探索新区域之间的自然权衡。
DARE: Diffusion Policy for Autonomous Robot Exploration ↗. Arxiv2024, National University of Singapore (NUS). DARE方法利用self-attention学习地图空间信息，并通过diffusion生成通往未知区域的轨迹，以提高自主机器人的探索效率。

无人机竞速与大机动/特技飞行

Whole-Body Control Through Narrow Gaps From Pixels to Action ↗. ICRA 2025, ZJU. 使用强化学习实现视觉端到端窄缝穿越，不需要显式的位置和速度估计，超越传统方法性能。

新构型无人机设计#

除了让算法变聪明，很多人也在尝试让无人机与机械臂结合或者具备变形能力。有了这些硬件构型上的创新，无人机的任务边界被大大拉宽了。

空中机械臂（Aerial Manipulator）#

空中机械臂，也叫空中操作无人机，兼具无人机的快速空间移动能力和机械臂的精确操纵能力，是具身智能的一种理想载体。能飞的同时还能抓东西、操作物体。

Past, Present, and Future of Aerial Robotic Manipulators. ↗ TRO 2022. 空中机械臂领域目前最全的综述文章，入门了解必备。
Millimeter-Level Pick and Peg-in-Hole Task Achieved by Aerial Manipulator ↗ TRO 2023, BHU. 使用四旋翼加串联机械臂实现毫米精度 peg-in-pole 任务。
NDOB-Based Control of a UAV with Delta-Arm Considering Manipulator Dynamics ↗ ICRA 2025, SYU. 使用四旋翼加并联机械臂实现毫米精度抓取。
A Compact Aerial Manipulator: Design and Control for Dexterous Operations ↗ JIRS 2024, BHU. 用空中机械臂做一些有趣的应用，比如抓鸡蛋、开门等。

全驱动无人机（Fully-Actuated UAV）#

常见的四旋翼无人机具有欠驱动特性，即位置与姿态耦合。而具有位置姿态解耦控制的全驱动无人机，理论上更适合作为空中操作的飞行平台。

Fully Actuated Multirotor UAVs: A Literature Review ↗ RAM 2020. 全驱动无人机领域目前最全的综述文章，入门了解必备。
Design, modeling and control of an omni-directional aerial vehicle ↗ ICRA 2016, ETH. 第一个实现全向飞行的固定倾角全驱动无人机。
The Voliro Omniorientational Hexacopter: An Agile and Maneuverable Tiltable-Rotor Aerial Vehicle ↗ RAM 2018, ETH. 第一个实现全向飞行的可变倾角全驱动无人机。
FLOAT Drone: A Fully-actuated Coaxial Aerial Robot for Close-Proximity Operations ↗ Arxiv 2025, ZJU. 适合近端作业的小尺寸全驱动无人机。

可变形无人机（Deformable UAV）#

Design, Modeling, and Control of an Aerial Robot DRAGON: A Dual-Rotor-Embedded Multilink Robot With the Ability of Multi-Degree-of-Freedom Aerial Transformation ↗. RAL 2018，东京大学. Best paper award on UAV in ICRA 2018，多关节可变形无人机。
The Foldable Drone: A Morphing Quadrotor That Can Squeeze and Fly ↗. RAL 2019, Uzh. 四旋翼每个机臂上安装一个舵机，实现机体变形飞行。
Ring-Rotor: A Novel Retractable Ring-Shaped Quadrotor With Aerial Grasping and Transportation Capability ↗. RAL 2023, ZJU. 一种可变形的环形四旋翼，可用于抓取、运输等任务。
Design and Control of a Passively Morphing Quadcopter ↗. ICRA 2019, UCB. 一种被动变形的四旋翼无人机

关注多模态无人机的构型设计、运动控制以及自主导航。多模态无人机具备空中、地面、水下等多域运动能力。这不仅能解决无人机的续航问题，也能让无人机具有更多应用潜力。

A bipedal walking robot that can fly, slackline, and skateboard ↗. SR 2021, Caltech. 多模态空地足式机器人。
Multi-Modal Mobility Morphobot (M4) with appendage repurposing for locomotion plasticity enhancement ↗. NC 2023, Northeastern University. 具有很多种运动模式的多模态无人机。
Skater: A Novel Bi-Modal Bi-Copter Robot for Adaptive Locomotion in Air and Diverse Terrain ↗. RAL 2024, ZJU. 适应多样地形的多模态空地双旋翼无人机。
Autonomous and Adaptive Navigation for Terrestrial-Aerial Bimodal Vehicles ↗. RAL 2022, ZJU. 实现空地多模态无人机的自主导航。

重要的技术方案#

对于任何一台无人机来说，能飞多快、多稳，下限是由状态估计（定位）系统决定的。这就绕不开最为人所熟悉的里程计和同步定位与建图（Odometry & SLAM）技术。

里程计（Odometry）用于为机器人实时提供定位，里程计常常基于扩展卡尔曼滤波（EKF）实现，融合IMU、相机、激光雷达、码盘、毫米波雷达、光流传感器等等各种常用于机器人位姿感知传感器中的多种观测，以较高的频率实现对机器人位姿的估计。

视觉惯性里程计（VIO）领域，最经典的代表莫过于港科大的 VINS-Mono / VINS-Fusion 项目 ↗。

激光惯性里程计（LIO）这边，港大的系列工作堪称标杆，从经典的 LOAM ↗，到后来火遍全网的 FAST-LIO ↗，再到 FAST-LIVO2 ↗，一步步把实时建图与定位的效率推向了新高度。

另外，如果要在大型环境里长期飞行，具备回环检测的 SLAM（同时定位与建图）系统也是不可或缺的前端和后端基建。

SLAM（Simultaneous Locolization And Mapping）在定位的同时完成地图的构建，使得回环（Loop Closure）检测成为可能，回环检测的存在使得当机器人重新访问到某个位置时可以修正一部分的累计误差，提高在长时间作业时的定位精度。SLAM 的实现主要有 filter-based 和 optimization-based 两种，实现中一般又分前端和后端，基于不同传感器的 SLAM 又各有其特点。

除了建图算法，一些通用的机器人开发工具也是无人机研发的必备口粮：

经典的 ROS / ROS2 生态，特别是多传感器间的时间戳对齐（比如 message_filters 的 TimeSynchronizer）。
涉及到空中机械臂等强动力学场景时，大家也常会用到像 NVIDIA 的 cuRobo ↗（CUDA 加速碰撞检测与规划）、IKFast 或者是 ManiSkill 生态里的 mplib ↗ 等求解库。

方向#

梳理完这些，我个人的一个最核心的感受是，Sim2Real（从仿真到现实）可能是现阶段对个人开发者或小团队来说，最容易切入并且能看到实际成果的路线。也就是说，无人机也需要迈向从物理智能到具身智能的方向的转换，后续我会在这部分再继续深入分析的，也会再写一篇 blog 进行总结。