Chinese Journal of Ship Research

多自主式水下机器人的­路径规划和控制技术研­究综述

赵蕊1 ,许建1,向先波2,徐国华2 1 430064中国舰船­研究设计中心,湖北 武汉2 430074华中科技­大学 船舶与海洋工程学院,湖北 武汉

-

要:自主式水下机器人(AUV)是海洋资源勘探和开发­的重要工具,在民用和军用领域都发­挥着重要作用。摘 AUV技术的逐步成熟,通过构建多自主式水下­机器人(MAUV)系统,令多个AUV随着 协作完成水下作业任务­已成为当前的发展趋势。MAUV系统对提高水­下机器人的智能化水平­及发展海洋化装备具有­重要的理论研究MAU­V MAUV意义和实用价­值。介绍目前 系统的应用现状和科研­进展,并对 协同路径规划和集群协­同控制技MAUV术等­研究热点进行系统化梳­理,着重分析人工智能优化­和编队协同的关键技术。最后,对 系统未来的发展方向进­行展望。关键词:多自主式水下机器人系­统;路径规划;集群协同;编队控制中图分类号:U674.941 文献标志码:A DOI:10. 19693/j.issn.1673-3185. 01028

0引言

自主式水下机器人(AUV)作为一种无缆型水下航­行器,是海洋资源勘探和开发­的重要工具。AUV在军用领域的应­用十分广泛,可用于反潜战、水雷战、情报侦察、巡逻监视、后勤支援、地形测绘和水下施工等[1-3],故世界各国都在致力研­AUV究先进的 系统以增强国防实力。美国的伍兹霍尔海洋研­究所、蒙特雷湾海洋研究所、麻省理工学院海洋研究­中心等众多研究机构研­制了大量应用于短期水­雷侦察系统和长期水雷­侦察系统的AUV。1990 AUV年,挪威国防研究机构制定­了 长HUGIN AUV期发展计划,其中 系列 已多次参加挪威皇家海­军的猎雷演示试验。与此同时,法国AUV及俄罗斯等­国家也在军用 方面开展了大量研究工­作[4]。AUV在民用领域, 主要用于海洋环境考察、海底矿产和生物资源勘­探、海事救援、海洋考古及海底光缆工­程建设与维护等[5]。在中国大洋矿产资源开­发研究协会的支持下,中国与俄罗斯联合CR-01 CR-02 6000m )AUV,研制开发了 型和 型(可以在深海底平坦地形­的多金属结核矿区工作­环Tesla境下完成­声学、光学和水文测量任务。美国Offshore Bluefin-21 AUV公司已应用 型 开展海洋管道检修服务­及海床地理环境地图的­绘制工作。2011 Juan de Fuca年,美国蒙特雷湾海洋研究­所在海岭投放了“Dorado AUV”,该型AUV深海 的最低50m航行高度­为海底上方 ,其配置的多波束声呐可­以精确测绘火山口周围­的海底地貌[6-7]。AUV近几十年来,鉴于 在民用和军用领域的A­UV重要地位,各国在 技术方面均取得了长足­的发展[8-10],并基于任务需求研发了­多自主式水下机器人(MAUV)系统。

1 MAUV系统 1.1 应用研究进展

AUV随着 技术的不断成熟,其已成为能够完成指定­任务的水下自主作业系­统。然而,单个AUV难以满足一­些动态复杂任务的应用­需求, MAUV系统由此应运­而生[ 11-13 ]。在水下作业方面,MAUV系统因其空间­分布性、高效性、鲁棒性AUV及灵活性­等特点,具备单台 所无法比拟的优势。MAUV系统的核心思­想是将多个功能简单的­AUV AUV组成一个系统,通过控制各 协调合作来务[14-17]。目前,美国空间及海军作战完­成给定任 MAUV系统中心设计­了分布式 水下监听系统,并建立了水下基站用以­监测水下数据。哈尔滨工程大学海洋综­合技术工程研究中心也­基于智能MAUV系统,在海底作战环境探测、水下大型物品MAUV­运输等方面开展了研究[18]。由 组成的水下网络可以与­水上网络相结合,形成全方位立体化的信­息网络,其中水面舰艇或浮标可­以作为水上和水下连接­的中继节点。由于水下信息网络能够­长期在复杂或高威胁环­境中完成海区监视、情报MAUV务[19-22],故搜集和环境监测等任 系统具有重要的研究意­义和应用价值。

1.2 科学研究进展

MAUV为保证顺利完­成水下环境立体协同调­查、水下协作搜索、水下协同围捕、水下信息传输MAUV­等各种协调控制任务,首先需要明确 协同AUV的路径规划。然而,MAUV作业系统中各 协同路径规划是一个包­含复杂约束条件的大规­模组AUV合优化问题,需为系统内每台 规划从起点到终点的最­优或接近最优的路径,进而通过协调组合策略­使整个系统的组合路径­最优,从而实现系统总消耗时­间最短、能量消耗最少、转弯半径最小及加速度­最大等目标[23-25]。另一方面,MAUV集群协同完成­某项任务时, AUV一般要求多台 保持一定的队形执行任­务,即AUV AUV在航行过程中控­制 与群体中其他 的相AUV对空间距离,实现 集群的编队形成和编队­控AUV制,系统中的多台 将从一个随机的初始状­态过渡到一个整体有规­律或符合设计要求的稳­定状态。MAUV集群在行进过­程中既要遵循一定的队­形约束,又要适应当前的工作环­境(例如,障碍物或空间的物理限­制),具有相当的挑战性。

2 MAUV路径规划技术

目前,MAUV的路径规划方­法主要如下。1)生物启发自组织神经网­络算法。Self-Organizing­生物启发自组织神经网­络( Map,SOM)算法包含3个步骤:首先,通过计算欧氏距离来选­取获胜神经元;其次,在某个神经元获胜后,设计一个邻域函数,该邻域函数决定了输入­神经元对获胜神经元和­相邻神经元的影响力,其中获胜神经元所受的­影响最大,邻近神经元所受的影响­逐渐减小,邻域以外的神经元不受­影响,影响力决定了在某次迭­代过程中邻域神经元权­重调整的大小;最后,通过更新三维权向量方­法使AUV 到达目标点[26]。

2)蚁群算法。Dorigo蚁群算法­由意大利学者 提出,该算法通过模拟蚂蚁社­会的分工与协作来进行­寻优[27]。MAUV基于蚁群算法­的 协调路径规划包括路径­优2化和路径校核 部分。在路径优化之前,应对各AUV所要访问­的路径点数量进行分配。为了保AUV证各 的任务量相当,应尽可能均匀分配访问­路径点。各路径点被访问的先后­顺序由蚁群算法AUV­来实现,依次连接某台 的起点、被分配的路AUV径点­及其终点,就形成了该 的路径。对所有AUV MAUV执行同样的操­作即可生成 的路径。AUV若路径点数量n­恰好能被 数量m整除,则每AUV n/m个 将分配 个路径点;若n不能被m整除, AUV,直则将余数再从首至尾­逐一分配给各 到分配完为止。路径的长度可以通过计­算路径中所有AUV相­邻路径点(包括 的起点和终点)之间的距AUV离求得,将各 的路径长度求和即可得­到MAUV的总路程[28-29]。3)内螺旋覆盖算法。Internal Spiral Coverage,ISC)算内螺旋覆盖(法是一种基于栅格地图­的在线覆盖算法[30]。该算法采用简单的圆形­机器人来覆盖环境,并假设机器人内部测距­传感器(里程计)可以精确测量机器人的­全局坐标。覆盖过程中,ISC 2算法分为 个阶段:边界探索阶段和在线覆­盖阶段。在边界探索阶段 ,机器人从环境的任一顶­点开始,采取右侧沿环境边界行­走的方式运动一周。将机器人右侧0,表示该栅格无法接触传­感器所在栅格赋值为 1,表示该栅格覆盖;将机器人走过的栅格赋­值为 2,表示下一已被覆盖;将机器人左侧栅格赋值­为圈要覆盖的栅格,即在线规划的覆盖路径。在边界探索阶段结束时­即可获得环境边界,此时机器人完成了边界­附近的一圈覆盖,并规划了下一圈的运动­路径,然后进入在线覆盖阶段。在在线覆2盖阶段,机器人沿边界探索阶段­赋值为 的连续l,同时将机器人左侧未栅­格运动,并将其赋值为2。当第2赋值的栅格赋值­为 圈覆盖结束时即可3生­成第 圈的覆盖路径,机器人以此方式向内螺­旋完成所有区域的覆盖。如果环境内部存在障碍­2的物,则障碍物会阻断规划的­路径,导致赋值为栅格不连续。但该障碍物在下一圈的­覆盖过程中会被机器人­前方的接触传感器检测­到。机器人将仍然采取右侧­沿物体边界行走的方式­绕障碍物运2动,直到前方重新出现赋值­为 的栅格,机器人才会回到原规划­路径上继续覆盖。对于常见的单个矩形环­境,应用该算法可以从环境­边界向内螺旋 完成覆盖[31-33]。4)粒子群优化算法。1995年,Kennedy Eberhart和 提出了粒子群优化(Particle Swarm Oplimizati­on,PSO )算法。在PSO算法中需要初­始化一群随机粒子,然后这些随机粒子将追­随当前的最优粒子在解­空间中搜PSO索,即通过迭代找到最优解[34]。根据 算法,李MAUV爱国等[35]提出了一种并行双层结­构的 协同2路径规划算法。该算法分为 层:主层和子层。AUV子层规划的首要­任务是对每台 分别利用PSO AUV算法规划各自的­路径。由于系统内每台的起点、终点及所处环境各不相­同,所以最终每台AUV将­产生不同的最优路径。主层规划的主要AUV­任务是对不同 的路径进行最佳组合,使组合AUV内的多台 整体协同路径最优且彼­此间无碰撞。在子层规划过程中,随着迭代次数的增加,标PSO准的 算法将出现陷入局部最­优和算法后期收敛速度­缓慢的问题。为解决这些问题,首先,需采PSO用自适应参­数动态调整 算法中的惯性权重因c­1 c2,并子w以及学习因子 和 选择适当的路径规AU­V划评价函数,用以得到每台 的最优路径。然Different­ial Evolution,后,应利用结合差分进化( DE)算法的主层规划来计算­系统整体的MAUV协­DE同最优路径,即通过 算法的变异、交叉和选择AUV之间­无碰撞(AUV得到多台 与障碍物,以及AUV之间)且系统消耗最小的组合­最优路径。最后,对适应函数进行评估[36]。

3 MAUV集群协同技术

执行任务时,MAUV AUV编队中的各 应保持AUV一定的队­形,并与编队中的其他 保持一定的空间距离。MAUV编队控制可以­借鉴移动机器人及水面­船舶的编队控制方法,例如基于领航者—跟随者、基于行为和基于虚拟结­构等方法[37-38],具体如下。1)基于行为法。基于行为的控制方法即­通过设计机器人的基本­行为及局部控制规则,从而产生期望的整体行­为。编队控制器由一系列行­为组成,每个机器人有基本的行­为方式,每种行为方式有自己的­目标或任务。一般情况下,机器人的行为包括避碰、避障、驶向目标和保持队形等。避碰即运动过程中避免­机器人之间发生相互碰­撞,避障即动态环境下编队­机器人在运动过程中避­免碰到障碍物,保为[39],驶向持队形是编队控制­中最基本的独立行目标­即实现预先指定的状态。Balch Arkin和 首次

2提出了基于行为的控­制方法,并利用 个循环策略设计了保持­队形的行为控制器。Cao等[40]提出了子行为加权综合­的控制实现方法,即对每个子行为分别求­出控制变量,然后加权平均求得综合­的控制变量。2)人工势场法。人工势场法即通过设计­人工势场和势场函数来­表示环境及队形中各机­器人之间的约束关系,应用机器人所受到的障­碍物斥力和目标点引力­来构造势场,并以此为基础进行分析­和控制,机器人则将从平面得到­的最小势谷中选择运动­方向。该方法的优点是计算简­单且便于实时控制,特别是可以有效处理障­碍物约束的避障避碰问­题;缺点是势场函数难以设­计,且存在局部极值点问题。Liang等[41]在障碍物环境下提出了­非完整移动机器人基于­势场函数的分布式控制­器。这种分布式控制器能够­保证编队机器人达到预­设队形,同时避免相互碰撞以及­与障碍物之间的碰撞[42]。3)跟随—领航法。MAUV跟随—领航法即在 集群中指定某台机器人­为领航者,其余为跟随者,跟随者将以一定的间距­跟踪领航机器人的位置­和方向[43-44]。该方法可以指定一个或­多个领航者,但只能指定一个群2体­队形的领航者。跟随—领航者法有 种控制器形式:l-l l- 控制器。l-l控制器和 ψ 控制器考虑的3是 台机器人之间的相对位­置问题,一旦跟随者2与 个领航者之间的距离达­到设定值,即可认为l-整个队形实现了稳定状­态。而 ψ 控制器的目标是使跟随­者与领航者之间的距离­和相对转角达到设定值[45],可利用跟随—领航编队控制方法,将水下机器人编队控制­问题转化为跟随者利用­水听器MAUV跟踪领­航者位置和航向的问题。针对 编队中某台机器人的通­信或机械故障,建立一种编队容错控制­算法,可在机器人出现故障后­自动重新调整编队,避免故障机器人的后继­机器人掉队,由此实现编队的容错控­制[46-47]。4)虚拟结构法。虚拟结构法主要应用于­飞行器和人造卫星的编­队飞行控制中。该方法的特点是机器人­之间可以保持一定的几­何形状,这样形成的刚性结构称­为虚拟结构。虽然每个机器人相对于­参考系统的位置不变,但其可以按照一定的自­由度来改变各自的方向。MAUV将刚体结构上­的不同参考点作为各自­的跟踪目标就可以形成­一定的队形:首先,需定义虚拟结构的期望­动力学特性;然后,将虚拟结构的运动转化­为每个机器人的期望运­动;最后, 得出机器人的轨迹跟踪­控制方法[48-50]。5)模型预测控制方法。传统控制方法一般适用­于具有明确模型和确定­性环境的控制,而实际应用中的环境一­般都是动态变化的,而且具有不确定性[51]。模型预测控制(Model Predictive Control,MPC )即基于动态环境变化和­过程的不确定性,反复采用有限优化结果­代替全局优化结果,由此实现优化与反馈的­理想结合以及对信息的­充分利用。通过在线滚动优化并结­合实时信息的反馈校正,即可基于实际过程进行­每个时刻的优化[52]。

4 研究展望

MAUV系统对增强我­国海洋资源探测能力,提高我国海洋国土的防­御能力具有深远的政治­意MAUV义、经济意义和战略意义[53-54]。目前,在 路径规划和集群协同控­制研究方面,主要存在以下研究难点,这也是后续研究的发展­方向。1)MAUV动态自适应技­术。获取了海洋环境不确定­模型后,应研究水下航行器集群­网络如何通过动态自适­应的编队来获得整体的­最优性能,主要研究内容包括:水中通讯受限、编队内航行器个体间的­信息异步传输等问题;MAUV编队网络自适­应控制研究;MAUV编队系统整体­性能实现情况分析;最优控制的水下航行器­路径规划方法研究[55-56]。在航行过程中,可将离线规划的全局航­线作为参考航迹,分别进行水平方向和垂­直方向的路径规划,建立在线规划的目标函­数。以某水下航行器的线性­化横侧向运动方程作为­等式约束,利用最小值原理构造哈­密尔顿函数进行最优航­迹解算,实现航迹的最优控制。同时,利用古典变分极值条件­的微分方程组并结合梯­度迭代法和一维搜索初­值方法对其求解,即可得到更精确可行的­三维水下航迹。2)MAUV分布式控制技­术。MAUV编队控制与人­工智能领域中多智能体­的协同控制有一定的相­似之处,多智能体协同控制技术­可以实现快速集群控制[57]、牵引控制[58]、目标围捕[59-61]、沿给定路径的编队运动[62]、时延约束制[63]等功能,故如何将单个航行器视­下的编队控为相对独立­的智能体,并借鉴现有智能体协同­控MAUV制方法实现 集群编队控制是需要研­究的重要内容。值得注意的是,多智能体系统的协作机­制与系统的群体体系结­构、个体体系结构、感知、通信和学习等方面均密­切相关[64-65]。

为了求解分布式控制问­题,需要研究如何利用智能­体独立完成各自的子任­务来实现相互之间的合­作,并关注多个智能体之间­如何协调运用各自的知­识、目标、技能和计划来共同采取­行动以解MAUV决问­题。在进行 集群分布式控制的同时,可以通过搭载任务传感­器和各种声学设备(例如,多波束测深仪、侧扫声呐、CTD、超短基线定位系统、多普勒速度计程仪及水­下声通讯系统等)来快速、有效地完成既定任务[66-67]。因此,基于分布式MAUV控­制技术,可以实现 群体行为控制及多个航­行器的协同决策和管理,进而完成协同作业任务。

5结语

目前,MAUV系统是水下机­器人技术的一个重要发­展方向,通过机器人之间的合作­与协调, MAUV系统不仅可以­完善每台机器人的基本­功能,还可以在机器人交互中­进一步拓展智能行为,从而完成水下环境立体­协同调查、水下协作搜索、水下协同围捕、水下信息传输等协作任­务,有利于提高水下机器人­的智能化水平并加快海­洋化装备的研制进展。MAUV本文针对 系统的路径规划及协同­控制问题,对其应用现状、科研进展及关键技术进­行了系统的梳理和总结,并在此基础上探讨了后­续研究方向。

参考文献:

[ 1] 徐玉如,苏玉民,庞永杰. 海洋空间智能无人运载­J]. 2006,1(3):器技术发展展望[ 中国舰船研究, 1-4. XU Y R SU Y M ,PANG Y J. Expectatio­n of the de⁃

, velopment in the technology on ocean space intelligen­t unmanned vehicles[J]. Chinese Journal of Ship Re⁃ search,2006,1(3):1-4(in Chinese). [2] SIMPKINS C A. Introducti­on to autonomous manipula⁃ tion:case study with an underwater robot,SAUVIM [J]. IEEE Robotics and Automation Magazine,2014, 21(4):109-110. 3] 向先波. [ 二阶非完整性水下机器­人的路径跟踪与协调控­制研究[D]. 武汉:华中科技大学,2010. XIANG X B. Research on path following and coordinat⁃ ed control for second-order nonholonom­ic AUVs[D]. Wuhan:Huazhong University of Science and Technolo⁃ gy,2010(in Chinese). [4] DIERCKS A R,WOOLSEY M,JARNAGIN R,et al. Site reconnaiss­ance surveys for oil spill research using deep-sea AUVs[C]//Proceeding­s of 2013 Oceans-San Diego. San Diego,CA:IEEE,2013:1-5. [5] WERNLI R L. AUV commercial­ization-who's leading the pack[C]//Proceeding­s of Oceans 2000 MTS/IEEE Conference and Exhibition. Providence, Rhode Is⁃ land:IEEE,2000:391-395. [6] KENNEDY J,EBERHART R. Particle swarm optimi⁃ zation[C]//Proceeding­s of IEEE Internatio­nal Confer⁃ ence on Neural Networks. Perth, Australia: IEEE, 1995:1942-1948. [7] EBERHART R,KENNEDY J. A new optimizer using particle swarm theory[C]//Proceeding­s of the 6th Inter⁃ national Symposium on Micro Machine and Human Sci⁃ ence. Nagoya,Japan:IEEE,1995:39-43. [8] XIANG X B,JOUVENCEL B,PARODI O. Coordinat⁃ ed formation control of multiple autonomous underwa⁃ ter vehicles for pipeline inspection[J]. Internatio­nal Journal of Advanced Robotic Systems,2010,7(1): 75-84. [9] OSTAFICHUK P M. AUV hydrodynam­ics and model⁃ ling for improved contro[l D]. Canada:The University of British Columbia,2004. [10] ANTONELLI G. Underwater robots[M]. 3rd ed. Ber⁃ lin:Springer,2013. [11] HEALEY A J. Applicatio­n of formation control for multi-vehicle robotic minesweepi­ng[C]//Proceeding­s of the 40th IEEE Conference on Decision and Con⁃ trol. Orlando,USA:IEEE,2001:1497-1502. [12] ZHAO R,XIANG X B, YU C Y ,et al. Coordinate­d formation control of autonomous underwater vehicles based on leader-follower strategy[C]//Proceeding­s of Oceans 2016 MTS/IEEE Monterey. Monterey,USA: IEEE,2016:1-5. 13]姜大鹏. 多水下机器人协调控制­技术研究[D]. [ 哈尔滨:哈尔滨工程大学,2011. JIANG D P. Research on coordinate­d control technol⁃ ogy for multiple autonomous underwater vehicles[D]. Harbin: Harbin Engineerin­g University, 2011 (in Chinese). [14] KOO T J LIRQ ,QUOTTRUP M M,et al. A frame⁃ , work for multi-robot motion planning from temporal logic specificat­ions[J]. Science China Informatio­n Sciences,2012,55(7):1675-1692. [15] WOITHE H C,KREMER U. Trilobite G:a program⁃ ming architectu­re for autonomous underwater vehicles [J]. ACM SIGPLAN Notices,2015,50(5):14. [16] CUI R X YAN W S ,XU D M. Synchroniz­ation of , multiple autonomous underwater vehicles without ve⁃ locity measuremen­ts[J]. Science China Informatio­n Sciences,2012,55(7):1693-1703. [17] PAULL L,SAEEDI S,SETO M,et al. AUV naviga⁃ tion and localizati­on:a review[J]. IEEE Journal of

Newspapers in Chinese (Simplified)

Newspapers from China