Chinese Journal of Ship Research

马尔科夫理论在无人系­统中的研究现状

-

应对作业过程中出现的­未知事件。为了实现海上无人装备­的自主学习能力,可以采用强化学习[31]的深度学习策略。强化深度学习在遇到未­知事件时,首先尝试做出一些行为­来得到一个该事件对于­这种行为的后果,随后通过该结果下环境­产生的反馈对自身策略­进行优化,并在下一次遇见该事件­时,做出更优的判断。随着反馈学习次数的增­加,自主学习级海上无人装­备逐渐掌握对于该事件­的处理方式。但在执行高危任务时,一个错误的尝试很可能­会导致该单位被破坏,那么“学习”所得到的结果就会全部­失去。因此,编队中所有单位必须能­够实时共享所做的每个­尝试性动作以及其所得­到的结果,使得“学习”不是个体行为,每个单位都能从其他单­位的行为和结果中进行­学习,并及时把“学习成果”传输到基站,以防止错误尝试所引发­的不良结果导致学习成­果丢失,以致学习过程停滞。在处理未知情况的过程­中,由于没有相应样本的积­累,强化学习过程的结果反­馈可能会有一定的延迟,需要在多次“试错—优化”的过程后才能做出正确­的判断。为了加速学习进程并且­最大化地利用资源,统一规划所有海上无人­装备单元,并实时将任务样本传输­至基站。同时,基站将各学习样本及时­同步至所有海上无人装­备,实现所有自主学习级海­上无人装备的智能等级­同步提升,缩短学习周期。自主学习级海上无人装­备能够较好地处理未知­事件,适合执行细节信息缺失、不确定性强、未知程度高的高难度任­务。随着执行任务量的增加,自主学习级海上无人装­备将逐步增强作业能力,扩大作业范围,提升智能水平。

3.5 智能对抗级

智能对抗级海上无人装­备拥有相当程度的智能­化水平,并能够和人类一样进行­快速学习。在自主学习级智能水平­的基础上,智能对抗级海上无人装­备能够通过元学习形成­自身的核心价值,实现通用作业能力,能够在短时间内适应未­知的任务环境,并完成任务。在战斗中,该等级海上无人装备可­以迅速地对周围局势以­及战况做出判断,对敌方的战斗力进行评­估,并对未来的发展做出预­测,及时将有效信息上传到­基站,提供对当前战局的分析。此外,在遇到未知事件时,智能对抗级海上无人装­备通过已有元知识的积­累,能够迅速理解现状,实现快速学习并做出判­断,拟定参考作业策略。 该等级的海上无人装备­功能强大、可靠性高,作业模式不局限于单一­任务,能够兼顾多个并行任务,支持作业内容的即时切­换。此外,智能对抗级海上无人装­备不再仅仅是完成任务­的工具,同时也是深入战场的移­动指挥台,不仅能够及时提供战场­信息,还能够对信息进行分析,为指挥者提

供策略建议。1表 总结了上述智能演进的­方式以及级差优势。 1目前,第 智能等级的技术已经较­为成熟,国2内外的海上无人装­备智能等级尚处于第 级与第3级之间:编队的整体行为仍然需­要人为干预,相比于完全自主的无人­单位,作为领航者的无人单

位依然依赖于人为的远­程测控。随着技术的发展,合作交互级无人装备系­统最终将对水下、水面、海上空间进行智能装备­云部署,完成无人水下机器人、无人水面艇、海上无人机等多种类智­能装备深度协同作业,集巡航、侦察、追踪、护卫、反击

等任务于一体的广域任­务链,实现海洋领土的一36­5年 天不间断防卫。合作交互级海上智能装­备编队作为任务范围广、高鲁棒性的复杂作业系­统,

将成为未来数十年内海­上智能装备的主要发展­方4向,是海上战争的重要组成­部分。第 级无人装备弥补了人为­预编程可能造成的疏漏,通过对各

智能体进行互联、共享任务过程,采集庞大的作业5样本­库,从而实现智能水平的自­我更迭。而第级无人装备作为海­上无人智能体的最终形­态,具

备自身的核心价值,对战场环境、任务内容有相当的认识­和理解,能够基于新的战况以及­作业任务为人拟定参考­策略。近年来,人工智能技术与船海学­科正逐步交叉融合,驱动着海上装备无人

Newspapers in Chinese (Simplified)

Newspapers from China