多自主式水下机器人的路径规划和控制技术研究综述

赵蕊1 ，许建1，向先波2，徐国华2 1 430064中国舰船研究设计中心，湖北武汉2 430074华中科技大学船舶与海洋工程学院，湖北武汉

2018-12-01 -

要：自主式水下机器人（AUV）是海洋资源勘探和开发的重要工具，在民用和军用领域都发挥着重要作用。摘 AUV技术的逐步成熟，通过构建多自主式水下机器人（MAUV）系统，令多个AUV随着协作完成水下作业任务已成为当前的发展趋势。MAUV系统对提高水下机器人的智能化水平及发展海洋化装备具有重要的理论研究MAUV MAUV意义和实用价值。介绍目前系统的应用现状和科研进展，并对协同路径规划和集群协同控制技MAUV术等研究热点进行系统化梳理，着重分析人工智能优化和编队协同的关键技术。最后，对系统未来的发展方向进行展望。关键词：多自主式水下机器人系统；路径规划；集群协同；编队控制中图分类号：U674.941 文献标志码：A DOI：10. 19693/j.issn.1673-3185. 01028

0引言

自主式水下机器人（AUV）作为一种无缆型水下航行器，是海洋资源勘探和开发的重要工具。AUV在军用领域的应用十分广泛，可用于反潜战、水雷战、情报侦察、巡逻监视、后勤支援、地形测绘和水下施工等［1-3］，故世界各国都在致力研AUV究先进的系统以增强国防实力。美国的伍兹霍尔海洋研究所、蒙特雷湾海洋研究所、麻省理工学院海洋研究中心等众多研究机构研制了大量应用于短期水雷侦察系统和长期水雷侦察系统的AUV。1990 AUV年，挪威国防研究机构制定了长HUGIN AUV期发展计划，其中系列已多次参加挪威皇家海军的猎雷演示试验。与此同时，法国AUV及俄罗斯等国家也在军用方面开展了大量研究工作［4］。AUV在民用领域，主要用于海洋环境考察、海底矿产和生物资源勘探、海事救援、海洋考古及海底光缆工程建设与维护等［5］。在中国大洋矿产资源开发研究协会的支持下，中国与俄罗斯联合CR-01 CR-02 6000m ）AUV，研制开发了型和型（可以在深海底平坦地形的多金属结核矿区工作环Tesla境下完成声学、光学和水文测量任务。美国Offshore Bluefin-21 AUV公司已应用型开展海洋管道检修服务及海床地理环境地图的绘制工作。2011 Juan de Fuca年，美国蒙特雷湾海洋研究所在海岭投放了“Dorado AUV”，该型AUV深海的最低50m航行高度为海底上方，其配置的多波束声呐可以精确测绘火山口周围的海底地貌［6-7］。AUV近几十年来，鉴于在民用和军用领域的AUV重要地位，各国在技术方面均取得了长足的发展［8-10］，并基于任务需求研发了多自主式水下机器人（MAUV）系统。

1 MAUV系统 1.1 应用研究进展

AUV随着技术的不断成熟，其已成为能够完成指定任务的水下自主作业系统。然而，单个AUV难以满足一些动态复杂任务的应用需求， MAUV系统由此应运而生［ 11-13 ］。在水下作业方面，MAUV系统因其空间分布性、高效性、鲁棒性AUV及灵活性等特点，具备单台所无法比拟的优势。MAUV系统的核心思想是将多个功能简单的AUV AUV组成一个系统，通过控制各协调合作来务［14-17］。目前，美国空间及海军作战完成给定任 MAUV系统中心设计了分布式水下监听系统，并建立了水下基站用以监测水下数据。哈尔滨工程大学海洋综合技术工程研究中心也基于智能MAUV系统，在海底作战环境探测、水下大型物品MAUV运输等方面开展了研究［18］。由组成的水下网络可以与水上网络相结合，形成全方位立体化的信息网络，其中水面舰艇或浮标可以作为水上和水下连接的中继节点。由于水下信息网络能够长期在复杂或高威胁环境中完成海区监视、情报MAUV务［19-22］，故搜集和环境监测等任系统具有重要的研究意义和应用价值。

1.2 科学研究进展

MAUV为保证顺利完成水下环境立体协同调查、水下协作搜索、水下协同围捕、水下信息传输MAUV等各种协调控制任务，首先需要明确协同AUV的路径规划。然而，MAUV作业系统中各协同路径规划是一个包含复杂约束条件的大规模组AUV合优化问题，需为系统内每台规划从起点到终点的最优或接近最优的路径，进而通过协调组合策略使整个系统的组合路径最优，从而实现系统总消耗时间最短、能量消耗最少、转弯半径最小及加速度最大等目标［23-25］。另一方面，MAUV集群协同完成某项任务时， AUV一般要求多台保持一定的队形执行任务，即AUV AUV在航行过程中控制与群体中其他的相AUV对空间距离，实现集群的编队形成和编队控AUV制，系统中的多台将从一个随机的初始状态过渡到一个整体有规律或符合设计要求的稳定状态。MAUV集群在行进过程中既要遵循一定的队形约束，又要适应当前的工作环境（例如，障碍物或空间的物理限制），具有相当的挑战性。

2 MAUV路径规划技术

目前，MAUV的路径规划方法主要如下。1）生物启发自组织神经网络算法。Self-Organizing生物启发自组织神经网络（ Map，SOM）算法包含3个步骤：首先，通过计算欧氏距离来选取获胜神经元；其次，在某个神经元获胜后，设计一个邻域函数，该邻域函数决定了输入神经元对获胜神经元和相邻神经元的影响力，其中获胜神经元所受的影响最大，邻近神经元所受的影响逐渐减小，邻域以外的神经元不受影响，影响力决定了在某次迭代过程中邻域神经元权重调整的大小；最后，通过更新三维权向量方法使AUV 到达目标点［26］。

2）蚁群算法。Dorigo蚁群算法由意大利学者提出，该算法通过模拟蚂蚁社会的分工与协作来进行寻优［27］。MAUV基于蚁群算法的协调路径规划包括路径优2化和路径校核部分。在路径优化之前，应对各AUV所要访问的路径点数量进行分配。为了保AUV证各的任务量相当，应尽可能均匀分配访问路径点。各路径点被访问的先后顺序由蚁群算法AUV来实现，依次连接某台的起点、被分配的路AUV径点及其终点，就形成了该的路径。对所有AUV MAUV执行同样的操作即可生成的路径。AUV若路径点数量n恰好能被数量m整除，则每AUV n/m个将分配个路径点；若n不能被m整除， AUV，直则将余数再从首至尾逐一分配给各到分配完为止。路径的长度可以通过计算路径中所有AUV相邻路径点（包括的起点和终点）之间的距AUV离求得，将各的路径长度求和即可得到MAUV的总路程［28-29］。3）内螺旋覆盖算法。Internal Spiral Coverage，ISC）算内螺旋覆盖（法是一种基于栅格地图的在线覆盖算法［30］。该算法采用简单的圆形机器人来覆盖环境，并假设机器人内部测距传感器（里程计）可以精确测量机器人的全局坐标。覆盖过程中，ISC 2算法分为个阶段：边界探索阶段和在线覆盖阶段。在边界探索阶段，机器人从环境的任一顶点开始，采取右侧沿环境边界行走的方式运动一周。将机器人右侧0，表示该栅格无法接触传感器所在栅格赋值为 1，表示该栅格覆盖；将机器人走过的栅格赋值为 2，表示下一已被覆盖；将机器人左侧栅格赋值为圈要覆盖的栅格，即在线规划的覆盖路径。在边界探索阶段结束时即可获得环境边界，此时机器人完成了边界附近的一圈覆盖，并规划了下一圈的运动路径，然后进入在线覆盖阶段。在在线覆2盖阶段，机器人沿边界探索阶段赋值为的连续l，同时将机器人左侧未栅格运动，并将其赋值为2。当第2赋值的栅格赋值为圈覆盖结束时即可3生成第圈的覆盖路径，机器人以此方式向内螺旋完成所有区域的覆盖。如果环境内部存在障碍2的物，则障碍物会阻断规划的路径，导致赋值为栅格不连续。但该障碍物在下一圈的覆盖过程中会被机器人前方的接触传感器检测到。机器人将仍然采取右侧沿物体边界行走的方式绕障碍物运2动，直到前方重新出现赋值为的栅格，机器人才会回到原规划路径上继续覆盖。对于常见的单个矩形环境，应用该算法可以从环境边界向内螺旋完成覆盖［31-33］。4）粒子群优化算法。1995年，Kennedy Eberhart和提出了粒子群优化（Particle Swarm Oplimization，PSO ）算法。在PSO算法中需要初始化一群随机粒子，然后这些随机粒子将追随当前的最优粒子在解空间中搜PSO索，即通过迭代找到最优解［34］。根据算法，李MAUV爱国等［35］提出了一种并行双层结构的协同2路径规划算法。该算法分为层：主层和子层。AUV子层规划的首要任务是对每台分别利用PSO AUV算法规划各自的路径。由于系统内每台的起点、终点及所处环境各不相同，所以最终每台AUV将产生不同的最优路径。主层规划的主要AUV任务是对不同的路径进行最佳组合，使组合AUV内的多台整体协同路径最优且彼此间无碰撞。在子层规划过程中，随着迭代次数的增加，标PSO准的算法将出现陷入局部最优和算法后期收敛速度缓慢的问题。为解决这些问题，首先，需采PSO用自适应参数动态调整算法中的惯性权重因c1 c2，并子w以及学习因子和选择适当的路径规AUV划评价函数，用以得到每台的最优路径。然Differential Evolution，后，应利用结合差分进化（ DE）算法的主层规划来计算系统整体的MAUV协DE同最优路径，即通过算法的变异、交叉和选择AUV之间无碰撞（AUV得到多台与障碍物，以及AUV之间）且系统消耗最小的组合最优路径。最后，对适应函数进行评估［36］。

3 MAUV集群协同技术

执行任务时，MAUV AUV编队中的各应保持AUV一定的队形，并与编队中的其他保持一定的空间距离。MAUV编队控制可以借鉴移动机器人及水面船舶的编队控制方法，例如基于领航者—跟随者、基于行为和基于虚拟结构等方法［37-38］，具体如下。1）基于行为法。基于行为的控制方法即通过设计机器人的基本行为及局部控制规则，从而产生期望的整体行为。编队控制器由一系列行为组成，每个机器人有基本的行为方式，每种行为方式有自己的目标或任务。一般情况下，机器人的行为包括避碰、避障、驶向目标和保持队形等。避碰即运动过程中避免机器人之间发生相互碰撞，避障即动态环境下编队机器人在运动过程中避免碰到障碍物，保为［39］，驶向持队形是编队控制中最基本的独立行目标即实现预先指定的状态。Balch Arkin和首次

2提出了基于行为的控制方法，并利用个循环策略设计了保持队形的行为控制器。Cao等［40］提出了子行为加权综合的控制实现方法，即对每个子行为分别求出控制变量，然后加权平均求得综合的控制变量。2）人工势场法。人工势场法即通过设计人工势场和势场函数来表示环境及队形中各机器人之间的约束关系，应用机器人所受到的障碍物斥力和目标点引力来构造势场，并以此为基础进行分析和控制，机器人则将从平面得到的最小势谷中选择运动方向。该方法的优点是计算简单且便于实时控制，特别是可以有效处理障碍物约束的避障避碰问题；缺点是势场函数难以设计，且存在局部极值点问题。Liang等［41］在障碍物环境下提出了非完整移动机器人基于势场函数的分布式控制器。这种分布式控制器能够保证编队机器人达到预设队形，同时避免相互碰撞以及与障碍物之间的碰撞［42］。3）跟随—领航法。MAUV跟随—领航法即在集群中指定某台机器人为领航者，其余为跟随者，跟随者将以一定的间距跟踪领航机器人的位置和方向［43-44］。该方法可以指定一个或多个领航者，但只能指定一个群2体队形的领航者。跟随—领航者法有种控制器形式：l-l l- 控制器。l-l控制器和 ψ 控制器考虑的3是台机器人之间的相对位置问题，一旦跟随者2与个领航者之间的距离达到设定值，即可认为l-整个队形实现了稳定状态。而 ψ 控制器的目标是使跟随者与领航者之间的距离和相对转角达到设定值［45］，可利用跟随—领航编队控制方法，将水下机器人编队控制问题转化为跟随者利用水听器MAUV跟踪领航者位置和航向的问题。针对编队中某台机器人的通信或机械故障，建立一种编队容错控制算法，可在机器人出现故障后自动重新调整编队，避免故障机器人的后继机器人掉队，由此实现编队的容错控制［46-47］。4）虚拟结构法。虚拟结构法主要应用于飞行器和人造卫星的编队飞行控制中。该方法的特点是机器人之间可以保持一定的几何形状，这样形成的刚性结构称为虚拟结构。虽然每个机器人相对于参考系统的位置不变，但其可以按照一定的自由度来改变各自的方向。MAUV将刚体结构上的不同参考点作为各自的跟踪目标就可以形成一定的队形：首先，需定义虚拟结构的期望动力学特性；然后，将虚拟结构的运动转化为每个机器人的期望运动；最后，得出机器人的轨迹跟踪控制方法［48-50］。5）模型预测控制方法。传统控制方法一般适用于具有明确模型和确定性环境的控制，而实际应用中的环境一般都是动态变化的，而且具有不确定性［51］。模型预测控制（Model Predictive Control，MPC ）即基于动态环境变化和过程的不确定性，反复采用有限优化结果代替全局优化结果，由此实现优化与反馈的理想结合以及对信息的充分利用。通过在线滚动优化并结合实时信息的反馈校正，即可基于实际过程进行每个时刻的优化［52］。

4 研究展望

MAUV系统对增强我国海洋资源探测能力，提高我国海洋国土的防御能力具有深远的政治意MAUV义、经济意义和战略意义［53-54］。目前，在路径规划和集群协同控制研究方面，主要存在以下研究难点，这也是后续研究的发展方向。1）MAUV动态自适应技术。获取了海洋环境不确定模型后，应研究水下航行器集群网络如何通过动态自适应的编队来获得整体的最优性能，主要研究内容包括：水中通讯受限、编队内航行器个体间的信息异步传输等问题；MAUV编队网络自适应控制研究；MAUV编队系统整体性能实现情况分析；最优控制的水下航行器路径规划方法研究［55-56］。在航行过程中，可将离线规划的全局航线作为参考航迹，分别进行水平方向和垂直方向的路径规划，建立在线规划的目标函数。以某水下航行器的线性化横侧向运动方程作为等式约束，利用最小值原理构造哈密尔顿函数进行最优航迹解算，实现航迹的最优控制。同时，利用古典变分极值条件的微分方程组并结合梯度迭代法和一维搜索初值方法对其求解，即可得到更精确可行的三维水下航迹。2）MAUV分布式控制技术。MAUV编队控制与人工智能领域中多智能体的协同控制有一定的相似之处，多智能体协同控制技术可以实现快速集群控制［57］、牵引控制［58］、目标围捕［59-61］、沿给定路径的编队运动［62］、时延约束制［63］等功能，故如何将单个航行器视下的编队控为相对独立的智能体，并借鉴现有智能体协同控MAUV制方法实现集群编队控制是需要研究的重要内容。值得注意的是，多智能体系统的协作机制与系统的群体体系结构、个体体系结构、感知、通信和学习等方面均密切相关［64-65］。

为了求解分布式控制问题，需要研究如何利用智能体独立完成各自的子任务来实现相互之间的合作，并关注多个智能体之间如何协调运用各自的知识、目标、技能和计划来共同采取行动以解MAUV决问题。在进行集群分布式控制的同时，可以通过搭载任务传感器和各种声学设备（例如，多波束测深仪、侧扫声呐、CTD、超短基线定位系统、多普勒速度计程仪及水下声通讯系统等）来快速、有效地完成既定任务［66-67］。因此，基于分布式MAUV控制技术，可以实现群体行为控制及多个航行器的协同决策和管理，进而完成协同作业任务。

5结语

目前，MAUV系统是水下机器人技术的一个重要发展方向，通过机器人之间的合作与协调， MAUV系统不仅可以完善每台机器人的基本功能，还可以在机器人交互中进一步拓展智能行为，从而完成水下环境立体协同调查、水下协作搜索、水下协同围捕、水下信息传输等协作任务，有利于提高水下机器人的智能化水平并加快海洋化装备的研制进展。MAUV本文针对系统的路径规划及协同控制问题，对其应用现状、科研进展及关键技术进行了系统的梳理和总结，并在此基础上探讨了后续研究方向。

参考文献：

［ 1］徐玉如，苏玉民，庞永杰. 海洋空间智能无人运载J］. 2006，1（3）：器技术发展展望［中国舰船研究， 1-4. XU Y R SU Y M ，PANG Y J. Expectation of the de⁃

， velopment in the technology on ocean space intelligent unmanned vehicles［J］. Chinese Journal of Ship Re⁃ search，2006，1（3）：1-4（in Chinese）. ［2］ SIMPKINS C A. Introduction to autonomous manipula⁃ tion：case study with an underwater robot，SAUVIM ［J］. IEEE Robotics and Automation Magazine，2014， 21（4）：109-110. 3］向先波. ［二阶非完整性水下机器人的路径跟踪与协调控制研究［D］. 武汉：华中科技大学，2010. XIANG X B. Research on path following and coordinat⁃ ed control for second-order nonholonomic AUVs［D］. Wuhan：Huazhong University of Science and Technolo⁃ gy，2010（in Chinese）. ［4］ DIERCKS A R，WOOLSEY M，JARNAGIN R，et al. Site reconnaissance surveys for oil spill research using deep-sea AUVs［C］//Proceedings of 2013 Oceans-San Diego. San Diego，CA：IEEE，2013：1-5. ［5］ WERNLI R L. AUV commercialization-who's leading the pack［C］//Proceedings of Oceans 2000 MTS/IEEE Conference and Exhibition. Providence， Rhode Is⁃ land：IEEE，2000：391-395. ［6］ KENNEDY J，EBERHART R. Particle swarm optimi⁃ zation［C］//Proceedings of IEEE International Confer⁃ ence on Neural Networks. Perth， Australia： IEEE， 1995：1942-1948. ［7］ EBERHART R，KENNEDY J. A new optimizer using particle swarm theory［C］//Proceedings of the 6th Inter⁃ national Symposium on Micro Machine and Human Sci⁃ ence. Nagoya，Japan：IEEE，1995：39-43. ［8］ XIANG X B，JOUVENCEL B，PARODI O. Coordinat⁃ ed formation control of multiple autonomous underwa⁃ ter vehicles for pipeline inspection［J］. International Journal of Advanced Robotic Systems，2010，7（1）： 75-84. ［9］ OSTAFICHUK P M. AUV hydrodynamics and model⁃ ling for improved contro［l D］. Canada：The University of British Columbia，2004. ［10］ ANTONELLI G. Underwater robots［M］. 3rd ed. Ber⁃ lin：Springer，2013. ［11］ HEALEY A J. Application of formation control for multi-vehicle robotic minesweeping［C］//Proceedings of the 40th IEEE Conference on Decision and Con⁃ trol. Orlando，USA：IEEE，2001：1497-1502. ［12］ ZHAO R，XIANG X B， YU C Y ，et al. Coordinated formation control of autonomous underwater vehicles based on leader-follower strategy［C］//Proceedings of Oceans 2016 MTS/IEEE Monterey. Monterey，USA： IEEE，2016：1-5. 13］姜大鹏. 多水下机器人协调控制技术研究［D］. ［哈尔滨：哈尔滨工程大学，2011. JIANG D P. Research on coordinated control technol⁃ ogy for multiple autonomous underwater vehicles［D］. Harbin： Harbin Engineering University， 2011 （in Chinese）. ［14］ KOO T J LIRQ ，QUOTTRUP M M，et al. A frame⁃ ， work for multi-robot motion planning from temporal logic specifications［J］. Science China Information Sciences，2012，55（7）：1675-1692. ［15］ WOITHE H C，KREMER U. Trilobite G：a program⁃ ming architecture for autonomous underwater vehicles ［J］. ACM SIGPLAN Notices，2015，50（5）：14. ［16］ CUI R X YAN W S ，XU D M. Synchronization of ， multiple autonomous underwater vehicles without ve⁃ locity measurements［J］. Science China Information Sciences，2012，55（7）：1693-1703. ［17］ PAULL L，SAEEDI S，SETO M，et al. AUV naviga⁃ tion and localization：a review［J］. IEEE Journal of

多自主式水下机器人的路径规划和控制技术研究综述

赵蕊1 ，许建1，向先波2，徐国华2 1 430064中国舰船研究设计中心，湖北武汉2 430074华中科技大学船舶与海洋工程学院，湖北武汉

Newspapers in Chinese (Simplified)

Newspapers from China

多自主式水下机器人的­路径规划和控制技术研­究综述

赵蕊1 ，许建1，向先波2，徐国华2 1 430064中国舰船­研究设计中心，湖北 武汉2 430074华中科技­大学 船舶与海洋工程学院，湖北 武汉

Newspapers in Chinese (Simplified)

Newspapers from China

多自主式水下机器人的路径规划和控制技术研究综述

赵蕊1 ，许建1，向先波2，徐国华2 1 430064中国舰船研究设计中心，湖北武汉2 430074华中科技大学船舶与海洋工程学院，湖北武汉