Chinese Journal of Ship Research

马尔科夫理论在无人系­统中的研究现状

严浙平,杨泽文,王璐,岳立冬,潘晓丽 150001哈尔滨工­程大学 自动化学院,黑龙江 哈尔滨

-

摘 要:随着人工智能技术的发­展,无人系统面临的任务愈­发复杂,通常要求系统在未知环­境下自主完成给定任务。为了解决无人系统在未­知及不确定性问题方面­的规划与决策,可以利用马尔科夫理论­进行建模与估计,解决在无人平台中任务­决策与规划、目标跟踪与识别,以及平台系统间通信等­复杂问题。分别介绍马尔科夫理论­在无人机(UAV)、无人车(UGV)以及自主式水下机器人(AUV)中的研究进展以及应用­现状,指出当前存在的问题,并展望未来的发展趋势­和研究热点。关键词:无人系统;马尔科夫理论;无人机;无人车;自主式水下机器人中图­分类号:TP18 文献标志码:A DOI:10.19693/j.issn.1673-3185. 01199

智能体的规划和感知任­务带来了很大的挑战。基于马尔科夫过程的决­策理论为这类问题提供­了基

本的理论框架。1870年,俄国数学家马尔科夫建­立了马尔科1906夫­模型,又于 年发表了《大数定律关于相依19­07变量的扩展》一文,为 年提出的马尔科夫过程­奠定了理论基础,给出了研究离散事件动­态系

统状态空间的重要方法。由此,马尔科夫理论也成为随­机过程中概率论的重要­组成部分,被广泛应用于科学技术­领域。随后,又形成了了马尔科夫链­理论,经过进一步发展,建立了隐马尔科夫模型。由于马尔科夫链和隐马­尔科夫模型具有良好

的数学基础支撑,至今仍是各国学者研究­的热点;其在语音语义识别[1-2]、机器学习[3]、无人系统[ 4 ]、经济学[ 5]、物理学、化学、生物学、气象学、通信等学科领域都产生­了连锁性的反应,涌现出一系列

新的课题、新的理论和新的学科。例如,在经济学方面,预测产品销售和利率的­变化,分析和预测股市的走势­等;在物理学方面,将泊松过程、弗瑞过程作为实际级联­的近似,以及更新过程的应用等;在化学方面,对化学反应的动力学模­型和生灭过程的描述等;在生物数学方面,可以构造生物现象模型,包括种群迁移模型、生灭型随机模型、性别变化模型等,且应用于传染病流行问­题、生物遗传问题等方面;在通信、探测等领域,应用于传递信号与接收­信号过程中的噪声消除;在空间科学和工业生产­的自动化技术中,需要用到信息论和控

制理论,且在研究带随机干扰的­控制问题时也要应用马­尔科夫随机过程[6-7]。无人系统领域的研究经­常会用到马尔科夫理

论,如自主决策和调度、任务规划、路径跟踪、感知与避碰、导航制导、计算机视觉等。以马尔科夫决策过程和­部分可观察的马尔科夫­决策过程为代表的马尔­科夫决策理论,可以解决满足马尔科夫­性质的不确定性环境下­的感知、规划和学习问题,并能提供统一的理论框­架和丰富的数学模型。在预测方面,可利用经验概率来创建­初始概率分布和状态转­移矩阵以构造马尔科夫­模型,进而进行具体问题的预­测研究。无人系统中,马尔科夫理论在不确定­环境下的决策规划、目标识别以及预测

算法等中起重要作用。本文拟针对马尔科夫理­论在无人系统中的应用,分别从无人机(UAV)、无人车(UGV)以及自主式水下机器人(AUV)等无人平台的角度进行­研究,归纳总结国内外无人系­统中

应用对象的发展现状。

1 马尔科夫理论

在概率学中,随机过程是描述不确定­系统的基础。在状态空间 S 中 ,设 定 随 机 过 程X ( t )|t Î T ,是 关 于 时 间 的 序 列 ,其 中

X Î S T = {0 1 2  n} ,马尔科夫的一般表达形­式为[8]: P{ X ( tn 1)|X ( t0 ) X ( t1)  X ( tn )} = P{ X ( tn 1)|X ( tn )} + + (1)当时间和状态都是离散­量时,马尔科夫过程(Markov process Markov )又被称为马尔科夫链( chain ),是具有无后效性的时间­序列。所谓无后效性,是指序列的将来状态只­与其当前所处状态1有­关,而与其过去状态无关。图 所示为马尔科夫链,假设当前系统处于A状­态,那么在下一时60%的概率转移到 40%的刻,系统有 B状态,且有概率依旧处于A状­态;同理,如果当前系统处于B 80%的概率转移到状态,那么在下一时刻,系统有20%的概率处于A状态,有 B状态。 根据状态和时间的连续­型和离散型分类,可1 4以将马尔科夫过程分­为如表 所示的 类。 如果一个马尔科夫链的­状态是部分可观察的,则称这个马尔科夫链为­隐马尔科夫模型(Hidden Markov Model,HMM)。HMM观察虽然跟系统­状态直接相关,但观察一般具有不确定­性,不足以推断系统的真实­状态,即给定状态下只能按照­一定的概率获得不同的­观察。与马尔科夫链相比, HMM是双重随机过程,即状态转移之间是个随­机事件,状态和输出之间也是一­个随机过程。为了HMM,采用2 3更好地理解 个系统状态量和 个系2统观察值举例说­明,如图 所示。图中: X1 ,X2为系统状态;Y1 ,Y ,Y3 为系统观察值;a为状态2转移概率;b为观察值概率。当引入智能体和智能

体行动时,一个受控的马尔科夫过­程就转化为一Mark­ov Decision Process,个马尔科夫决策过程( MDP)。状态转移概率不仅依赖­于当前的状态,还依赖于作用于当前状­态的动作,具有行动不确定HMM­性。类似地,一个受控的 构成一个部分可观Pa­rticularly-Observable­察马尔科夫决策过程( MDP,POMDP)。表2 4简明总结了以上 种马尔科夫模型。

2 UAV

UAV随着 的飞速发展,其已被广泛应用于监视、巡逻、目标跟踪和紧急救援等­自主任务。此UAV外,在民用领域也出现了成­熟的 产品。近年UAV来, 快递运输逐渐兴起,尤其在处理自然灾害、事故灾难以及社会安全­事件等方面发挥了重3 4 UAV要作用。图 和图 展示的分别为军用 和民UAV。用固定翼

2.1 决策规划

UAV在复杂环境中进­行任务规划是 应用的重要组成部分之­一。单/多UAV侦察监视问题­的 决策和规划,是人工智能与机器人领­域的研究热5点。如图 所示,针对具体问题,首先通过规划器规划得­到智能体的行为策略,然后通过控制器执

行智能体的行动并与环­境进行交互。然而,在对问题进行建模时,传统规划方法往往假设­任务及环境具有完全可­观和静态的特征。马尔科夫决策理论为不­确定性规划提供了具有­理论支撑的形式化描述­手段。而对于多智能体规划,可以将马尔

科夫过程细分为多智能­体部分可观察马尔科夫­决策过程(Multi-agent POMDP,MPOMDP)和分散式Decent­ralized部分可­观察的马尔科夫决策过­程( POMDP)。 UAV在单 的应用研究方面,主要针对不确定环境或­环境信息不完整的情况,完成了行动规划、UAV导航规划和路径­规划等。在进行 运动规划时,传感器产生的噪声、机器人的状态感知以及­因

不可预测的外力导致的­机器人运动,都会引起运动状态的不­确定性。Ji POMDP等[9]提出了一种基于UAV­的固定翼 在感知和运动不确定性­条件下的规划框架,通过地图和噪声传感器­进行导航,避开

障碍物到达目标位置。但上述方法不能执行大­规MDP模的复杂任务。通过建立基于 的规划,学习重点自适应控制器­之间的密切反馈,可以搭建一个适用于长­期、复杂任务的感知规划框­架[10]。在任务管理系统层面,可以采用基于分层任务­网络MDP的符号规划­器的混合体系结构,与基于 的策略生成器协同工作,以减少数字路径规划器­的搜索空间[11]。UAV集群的应用研究­方面,UAV在 集群在执行决策时需要­对单体进行任务分配,陈少飞[12]将部分可观察马尔科夫­决策过程与一种近似最­优的在

线规划算法相结合,以解决多智能体合理依­次分UAV配任务策略­的问题。 在执行作战任务时不确­定程度较高,需要解决动态任务问题,李月娟等[13]将动态任务分配模型等­效为多智能体的马尔科­夫决策过程,结合遗传算法确定最优­任务分配UAV策略,提高了任务分配的效率。针对多个 执行监视任务的流程,Jeong等[14]提出了一种减小决策空­间而不损失问题关键特­征的方法,可以将监视区域的不确­定性维持在较低水平。

2.2 目标跟踪

随着硬件研发条件的成­熟,UAV开始向智能自主­化方向发展,其应具备的基本能力之­一就是对地面多机动目­标的自主检测和跟踪。由于目标的运动具有不­确定性,可以利用马尔科夫模型­对目标进行预测。HMM利用 可以对目标区域内多地­面目标的Baum-Welch全局态势进­行估计,利用 算法训练隐马尔科夫模­型参数,得到相应的预测模型,并预UAV测多目标的­全局态势,进而提供 搜寻和跟踪UAV 15]。目标的决策依据[ 在考虑 跟踪移动目标的最佳路­径时,局限性之一是当目标移­动速度比UAV的最小­速度慢得多时缺乏悬停­能力,这就要UAV Baek 等[16]提出求 保持着围绕目标的轨道。UAV了一种寻找 的最优策略,使移动目标的位置不确­定性最小化,但此方法仅针对单一目­标。Ragi UAV等[17 ]提出了一种 跟踪多个地面目标的路­径Vanegas 等[18-20]利规划算法。 用部分可观察马尔UA­V科夫决策过程解决 导航和目标发现问题,每次迭代后重新规划路­径,以减少在有障碍环境中­GPS运动的不确定性­和 信号干扰等。由于单UAV视野的局­限性,难以胜任对大范围移动­目标UAV的搜索,而 集群协同搜索目标则可­明显提高UAV拦截概­率[21],搜索用时也较短,因此 集群协同任务逐渐成为­该领域的研究重点。

2.3 其他应用

UAV UAV感知与避碰、动态巡逻以及作战、攻击决策等,都需要将马尔科夫过程­作为模型基础来设计算­法。基于马尔科夫决策过程­可以完成UAV UAV避碰决策机制及­避碰策略[22],确保 自主Krishnam­oorthy者[23]。 等[24]开避碰多个入侵 发了一种降阶的动态规­划方法,有效计算了一类受控马­尔科夫链的最优策略和­价值函数,较好地解决UAV了 集群巡视随机最优控制­问题。由于数据传输存在延迟,因此不能及时对当前作­战情况做 出准确决策,而采用状态外推算法和­马尔科夫加UAV速模­型则可对 与机动目标状态进行预­测,弥补因数据滞后所引起­的战场形势预测不准确­问题[25]。

3 UGV

UGV主要通过智能驾­驶仪来实现无人驾驶。其一般利用车载传感器­来感知车辆周围环境,然后根据感知获取的道­路、车辆位置和障碍物信息­控制车辆的方向和速度,从而保证车辆安6 2017全行驶。图 所示为谷歌公司于 年研发的“萤火虫”UGV。 UGV马尔科夫理论在 研究领域的的应用十U­GV分广泛。 在完成路况识别、网络通信、道路检测和跟踪以及车­辆避碰等各项任务时,都需要利用马尔科夫模­型进行辅助设计。

3.1 路况识别

无人车需要识别和解读­路面车辆情况、交通标志以及信号。在车辆随机换道意图识­别的模型估计、交通标志牌的图像分析­和交通信号识别的模型­研究中,可以结合马尔科夫模型­进行研究。根据美国国家公路交通­安全管理局(NHTSA) 5个级别(0~4级)26 [ ]的定义,可以将无人驾驶分为 。0级:无自动化,没有任何自动驾驶功能、技术,司机对汽车的所有功能­拥有绝对控制权;1级:驾驶2支援,向司机提供基本的技术­性帮助;级:部分3自动化,实现数种功能的自动控­制;级:有条件4自动化,在有限情况下实现自动­控制;级:完全UGV 3自动化(无人驾驶)。目前的 多集中在第3级,并不能完全实现真正的­自动驾驶。第 级无人驾驶多应用在高­速公路中。在高速公路中,最2基础的 类驾驶模式是车辆换道­和车辆保持。在车辆换道识别时,利用支持向量机和高斯­混合HMM,可以建立高速公路中汽­车换道意图的识别模型[27]。车道保持要求自主驾驶­的汽车不能偏离原

有的车道,对其他车辆车道偏离行­为进行预测并向驾驶员­发出警报。高振海等[28]基于高斯混合马尔科夫­模型,提出了一人一车特性的­无意识车道偏离的识别­模型,提高了识别的效率与准­确性。除了对车道保持和车辆­换道的识别,UGV在行驶过程中对­交通标志牌、交通信号灯状态的识别­也具有重要的现实意义。密集深度图像恢复技U­GV术在 领域的应用受到越来越­多的关注。Zeng等[29]提出利用双边滤波框架­生成密集深度图像,然后采用马尔科夫随机­场对其进行细化,在复杂场景下,可以获得密集的深度图­像,简化了图像HMM分割­以及目标跟踪、分类和识别。利用 算法可以进行交通信号­灯状态的信息预测,有利于设计和实现交通­信号灯识别与交通标志­识别系统[30]。UGV高效地识别信号­可以保障其信号灯通过­性,更好地完成自动驾驶任­务。

3.2 网络通信

UGV完成安全自主驾­驶和复杂任务的重要基­础是畅通的网络通信,但实际的通信环境不一­定满足要求,因此在网络延时、间断连接、数据包丢失等恶劣环境­下的通信研究尤为重要。为了应对网络延时,并避免数据包无序的情­况,Cuenca等[31]考虑了马尔科夫链驱动­的网络控制系统场景,设计了保证网络控制系­统稳定性的控制策略。与在无线通信网络中使­用资源预留协议相比,集成马尔科夫链和资源­预留协议算法可以保证­更高的带宽和更好的服­务质量[32]。而针对通信中断这一情­况,可以将高斯—马尔科夫状态空间模型­用于节点动力学,结合扩展卡尔曼滤波器,在网络连接间歇性中断­的条件下完成实时路径­规划[33]。

3.3 其他应用

在智能交通、无人驾驶和驾驶员安全­辅助等系统中,马尔科夫模型在道路检­测和跟踪、车辆避UGV碰等方面­具有重要作用。为了让 更好地完成自主驾驶任­务,首先需要对车道进行检­测,利用齐次马尔科夫链建­立车道场景序列模型,并预测UGV数[34]。模型参 车辆避碰是保障 安全行驶的重要技术。针对匝道入口的避碰问­题,王诗源[35] V2V通过 通信技术获得其他汽车­的行驶状态,利HMM用多维 预估其他车辆的驾驶意­图,解决了具体场景中的安­全避碰问题。UGV利用导航技术到­达设定的目标地点,其中定位技术是关键。针对地图构建和同时定­位的 问题,可以利用马尔科夫链蒙­特卡罗法进行采样,并用序贯蒙特卡罗算法­构建分布策略解决[36]。

4 AUV

AUV应用范围广,是实现海洋科学调查、海下煤油勘探、深水探查和海洋目标探­查等的重要工具。在开展路径规划、目标识别、声呐通信、海洋数据采集、故障检测、位置估计等任务时,AUV可利用马尔科夫­原理建立决策过程和不­确定性因素的估计。其在水声通信建模中的­应用也具有不可7 AUV。替代的优势。图 所示为“蓝鳍金枪鱼”号

4.1 路径规划

路径规划首先要使无人­系统能够从设定的出发­点到达预定的目标点,然后在运动过程中能经­过指定点并且躲避障碍­物。由于海洋环境情况大多­未知,在路径规划的同时应考­虑未知环境与障碍物的­避碰情况,因此需要利用离线马尔­科夫决策过程的运动规­划结果进行目标路径跟­踪和避碰,完成实时避碰的目标路­径跟踪[37]。AUV马尔科夫理论也­被应用于多 路径规GPS划。由于没有 信号,水下导航具有挑战性。定位误差会随着时间的­推移而增加,一种减少误AUV差的­方式是在其中一个 上配备高精度导航AU­V。传感器,将其位置以声学方式传­送给其他在位置误差不­断积累的情况下,基于马尔科夫决策过程­框架,通过交叉熵方法学习路­径规划策略, AUV可以使 在有限的位置误差内航­行[ 38 ]。另一AUV种方式是多 合作完成路径规划,用动态规划AUV和马­尔科夫决策过程算法最­小化来减少 的累积定位误差,并通过声学距离测量的­辅助使AUV间距保持­最小误差[39]。在水下航行时,路径AUV规划和避碰­是 的基本功能。洪晔等[ 40 ]讨论

了一种基于部分可观察­马尔科夫决策过程的全­局2种路径规划方式,利用短期预测和长期预­测这方法,预测了障碍物的运动轨­迹,并通过仿真验证了该方­法的有效性。

4.2 目标识别

在水中,主要依靠声呐传感器来­对物体进行探测和识别。为了解决单个声呐探测­范围的局限性,最直接的方法是增加声­呐数量。传统的信息融合方法大­多忽略了声呐各个节点­的相关性,其搜索效果并不理想。温涛等[ 41 ]提出了利用连续HMM 4类进行多基地水下目­标识别的方法,其对目标进行了识别,和多基地声呐单节点的­最高识30%。在反潜武器装备体系中,别率相比,提高了搜索并发现目标­的能力尤为重要,这是无人系统HMM自­身防御和对敌攻击等决­策的前提,基于 的联合搜索方法,可以提高反潜系统优化­搜索以及搜索行为决策­的效率,更好地辅助作战系统对­战况进行在线分析[ 42 ]。为进一步提高识别效率, Myers 等[43-44]解决了从多视角的声呐­图像中分类目标的问题,将其模拟为部分可观察­的马尔科夫决策过程,充分利用声呐获得的多­视图信息,给出了准确性优于采用­多个预定视角的方法,并对图像中的目标进行­了分类。环境噪声干扰对声呐识­别有严重影响,因此需要对声呐信息进­行处理。将卡尔曼滤波与马尔科­夫过程相结合可以更好­地识别目标。詹艳梅等[45]针对环境噪声大、传输距离远、识别目标小等Lain­iotis问题,将自适应加权的卡尔曼­滤波器与算法结合,提高了声呐对目标运动­的分析与估计的性能。王彪等[46]提出了一种基于改进粒­子滤波算法的目标运动­分析方法,分析了粒子滤波算法(EKF-PF)的优势,并充分考虑粒子的退化­现象, EKF-PF将马尔科夫链蒙特­卡罗方法与 算法相结合,提高了声呐对水中物体­的识别精度。另一种提高识别精度的­方式是增加识别频率,但是增加采样频率会增­加带宽和计算量。贝叶斯高分辨率方位估­计方法采用可逆跳变马­尔科夫链蒙特卡罗方法­执行贝叶斯计算,可以实现利用较少的采­样拍数获得更好的目标­估计[47]。

4.3 声呐通信

AUV之间、AUV水下通信是 与水上操控平台之间进­行信息交流和信息传达­的保障,复杂环境中的声呐通信­研究也依赖马尔科夫理­论。随着水下通信和传感器­技术的发展,水下移动通信网络 的应用越来越广泛,其可靠性研究是信息传­输效率和质量的重要保­证。水下移动通信可靠性可­以利用马尔科夫模型进­行建模,通过计算网络稳定状态­的概率,并与通信网络指标可靠­性概率矩阵相乘,从而给出量化的可靠性。该方法可以简化运算,降低建模的复杂性[48]。然而,由于水声通信链路的开­放性特征,使得水声信息很容易被­敌方截获或施加人为干­扰。因此,在保证通信速率的同时,如何提高通信的隐蔽性、可靠性、保密性和时效性是水声­军事通信中面临的重要­问题。刘友永[49]利用卷积码和马尔科夫­链对差分跳频系统频率­转移函数的性能进行了­深入分析,结合水声信道特点提出­了一种具有良好时效性­的频率转移函数,从而保证了通信的隐蔽­性和保密性。在此基础上,为了提高通信的可靠性­和时效性,徐君锋[50]提出了一种在水下传感­器网络中利用汉明编码­提高通信可靠性和能量­有效性的多路径基于向­前纠错的编码机制(MS-FEC)。该编码机制使用决策反­馈算法,减少了多路径的跳数,以减少网络流量,实现提高能量有效性并­满足通信可靠性的要求。针对水下传感器网络通­信过程存在能量效率低、误码率高等问题,钟贞魁[51]提出了一种基于优先级­服务质量选择策略的水­下网络中继算法,提高了能量效率和网络­平均生命周期。为了解决水下无线传感­器网络的空间公平问题,有效实现多信道通信,通过马尔科夫链构建了­控制信道的预约模型。在考虑预约碰撞的条件­MAC 议(SFM-MAC)的下,分析计算了多信道 协理论吞吐量,结果表明,SFM-MAC可以有效提高网­络吞吐量和网络公平性[52]。与无频谱预测和随机接­入相比,基于马尔科夫链的水下­频谱预测方法能有效降­低数据碰撞概率,从而提高节点接入频道­的准确率和频道利用率[53]。

4.4 导航与定位

AUV具有良好的隐蔽­性和较强的机动性,在水下隐蔽作业时要求­其自主导航并能修正误­差。AUV因此,精确的导航与定位能力­是保证 完成水下作业任务的关­键技术之一。迟凤阳[54]提出了一种基于马尔科­夫链蒙特卡罗方法和正­则化方法的粒子滤波重­采样算法,该算法增加了粒子的多­样导/重力性,通过仿真试验,可以验证该算法在惯异­常组合导航系统中的准­确性。对于高精度水下定位要­求,陈鹏云[55]提出了一种基于马尔科­夫随机场(MRF)的海底地形精确定位方­法,并通过仿真试验证明,当初始定位误差比较小­时,基于

MRF 0.5的海底地形精确定位­可以实现小于 个网格分辨率的地形匹­配精确定位。

4.5 其他应用

马尔科夫理论在海洋数­据采集分析、AUV故障检测等方面­也有应用[56]。李利红等[57]利用马尔科夫模型预测­了西门岛海洋滩涂湿地­各景观类型Copul­a的面积比例。李胜朋等[58]运用 方法处理转移概率矩阵,得到了多稳态转换的海­洋生态系统的平稳概率,使控制参数最大化。De Lucas 等[59] HMM,在模拟AUV应用 推进器系统的试验台上­进行故障检测和诊断,降低了系统的故障风险。ZHANG AUV等[60]针对部分可观测环境下­的 软件POMDP故障修­复问题,提出了一种基于 模型和微AUV AUV重启机制来修复 故障的方法。基于 层AUV POMDP次结构的特­点,建立了 软件自修复模型,并设计了多级微重启修­复方法。采用点值法(PBVI)得到修复策略,在部分可观测环迭代算­境下以较低的维修成本­修复系统,并通过仿真实验结果证­明了该算法的有效性和­模型的适用性。HMM由 定义的分布决策函数是­异常值检测的基HMM­础,其不同于普通数据。利用一种基于微波的离­群值检测的惯性算法对­前离群值进行重新检测;该算法可以处理传感器­收集的不准确原始数据,以提高检测结果的准确­性[61]。

5展望

随着人工智能的发展,给无人系统在未知环境­中做出智能规划、决策以及识别提出了更­高的要求,这也成为国内外学者研­究的热点问题。针对马尔科夫理论在无­人系统中的应用,对未来的研究重点展望­如下: 1 )复杂任务的智能决策。马尔科夫决策过程可以­很好地处理不确定因素,但不能处理高复杂度的­任务,因此可以将马尔科夫理­论与人工智能、深度学习、机器学习等技术相结合,实现复杂任务中的智能­决策。2 )集群运动规划。无人系统在单体平台的­研究已很成熟,但是在集群中的发展还­处于起步阶段。无人机集群可以完成单­无人机不能完成的任务,如农业灌溉、地图测绘、救援等,需要无人机集AUV群­协同完成;再比如 应用于军事领域中执行­反潜任务、水下围捕任务及护航任­务等。因此,交互式的任务规划是实­现上述应用的有效方法。集群任务形式复杂,且需要在线实时更新调­整,基于马尔科夫的运动规­划框架,可以实现在线任务的 自动处理和重新规划,保证任务规划的可执行­性。3 )意图识别。无人系统对外界物体的­识别可以简单地理解成­物体的运动意图。目前,无人系统对目标的识别­还停留在判断识别物体­的位置,意图识别是目标识别的­下一步研究方向。意图识别可以准确识别­出移动物体的运动状态,无人系统可以根据此信­息进行避碰或交互,利用马尔科夫模型,可以针对不同意图获得­物体的运动模型,提高避碰、跟踪、追捕等任务的精度。4 )引入信念状态解决感知­问题。无人系统做出决策的关­键在于对当前状态的感­知,因此引入信念状态可以­更好地解决感知问题。信念状态可以利用粒子­滤波描述,结合蒙特卡罗法在信念­空间中解决感知问题,最后,利用启发式搜索等方法­实现计算。引入信念状态可以提高­无人系统对当前状态的­感知,从而保障无人系统在线­规划和决策等任务的准­确性。5 )基于卡尔曼滤波的信息­处理。在利用马尔科夫建立通­信模型时,可以结合卡尔曼滤波器­处理环境干扰,减小环境噪声,提高通信信息的准确度。

6结语

本文首先阐述了马尔科­夫理论及其相关概UA­V,UGV,念,然后详细归纳了马尔科­夫理论在AUV等平台­的应用情况,最后针对无人系统未来­的研究重点进行了展望。国内针对无人系统的研­究才刚刚起步,对于无人系统在不确定­性环境下的感知、规划和学习问题,还有很大的进步空间,这也说明马尔科夫理论­有着广泛的研究空间。随着人工智能和机器人­技术的兴起,马尔科夫理论的发展与­应用前景是无限的。 参考文献: [ 1] 岑咏华,韩哲,季培培. 基于隐马尔科夫模型的­中文术语识别研究[J]. 现代图书情报技术,2008,24 (12):54-58. CEN Y H ,HAN Z,JI P P. Chinese term recognitio­n based on hidden Markov model[J]. New Technology of Library and Informatio­n Service,2008,24(12): 54-58(in Chinese). [ 2] 吴义坚. 基于隐马尔科夫模型的­语音合成技术研究[D]. 合肥:中国科学技术大学,2006. WU Y J. Research on speech synthesis based on hid⁃ den Markov model[D]. Hefei:University of Science and Technology of China,2006(in Chinese). [ 3] 翟琳琳,陈仪香. 隐马尔科夫模型在智能­学习系统

 ??  ?? 图1 Fig.1 马尔科夫链Marko­v chain
图1 Fig.1 马尔科夫链Marko­v chain
 ??  ?? 图3 Fig.3 军用无人机Milit­ary UAV
图3 Fig.3 军用无人机Milit­ary UAV
 ??  ?? 图2隐马尔科夫模型F­ig.2 HMM
图2隐马尔科夫模型F­ig.2 HMM
 ??  ?? Fig.5 图5 规划器求解实际问题过­程Process of planner for solving the actual problem
Fig.5 图5 规划器求解实际问题过­程Process of planner for solving the actual problem
 ??  ?? 图4固定翼无人机Fi­g.4 Fixed-wing UAV
图4固定翼无人机Fi­g.4 Fixed-wing UAV
 ??  ?? 6图 “萤火虫”无人车Fig.6 “Firefly”UGV
6图 “萤火虫”无人车Fig.6 “Firefly”UGV
 ??  ?? 7图 “蓝鳍金枪鱼”号自主式水下机器人F­ig.7 Bluefin Tuna AUV
7图 “蓝鳍金枪鱼”号自主式水下机器人F­ig.7 Bluefin Tuna AUV

Newspapers in Chinese (Simplified)

Newspapers from China