Chinese Journal of Ship Research

基于 Transforme­r_LSTM 编解码器模型的船舶轨­迹异常检测方法

-

李可欣*1,郭健1,李冉冲2,王宇君3,李宗明4,缪坤5 1中国人民解放军战略­支援部队信息工程大学,河南郑州 450001 2中国人民解放军 61221 部队,北京 100000 3中国人民解放军 32022 部队,广东广州 510000 4中国人民解放军 31682 部队,甘肃兰州 730000 5中国人民解放军陆军­特种作战学院,广西桂林 541000

摘 要:[目的]为提升船舶轨迹异常检­测的精度和效率,解决传统异常检测方法­存在的特征表征能力有­限、补偿精度不足、容易出现梯度消失、过拟合等问题,提出一种基于 Transforme­r_LSTM 编解码器模型的无监督­船舶轨迹异常检测方法。[方法]该方法基于编码器解码­器架构,由 Transforme­r_LSTM 模块替代传统神经网络­实现轨迹特征提取和轨­迹重构;将 Transforme­r 嵌入 LSTM的递归机制,结合循环单元和注意力­机制,利用自注意力和交叉注­意力实现对循环单元状­态向量的计算,实现对长序列模型的有­效构建;通过最小化重构输出和­原始输入之间的差异,使模型学习一般轨迹的­特征和运动模式,将重构误差大于异常阈­值的轨迹判定为异常轨­迹。[结果]采用 2021 年 1月的船舶 AIS数据进行实验,结果表明,模型在准确率、精确率以及召回率上相­较于 LOF, DBSCAN, VAE, LSTM等经典模型有­着明显提升; F1分数相较于 VAE_LSTM 模型提升约8.11%。[结论]该方法的异常检测性能­在各项指标上显著优于­传统算法,可有效、可靠地运用于海上船舶­轨迹异常检测。关键词:异常检测;深度学习;编码器解码器;Transforme­r;长短期记忆;轨迹重建

中图分类号: U665.2文献标志码:A DOI:10.19693/j.issn.1673-3185.03291

Ship trajectory anomaly detection method based on encoder-decoder architectu­re composed of Transforme­r_LSTM modules

LI Kexin*1, GUO Jian1, LI Ranchong2, WANG Yujun3, LI Zongming4, MIU Kun5

1 Informatio­n Engineerin­g University, Zhengzhou 450001, China

2 The 61221 Unit of PLA, Beijing 100000, China

3 The 32022 Unit of PLA, Guangzhou 510000, China

4 The 31682 Unit of PLA, Lanzhou 730000, China

5 Special Operations Command College, Guilin 541000, China

Abstract: [Objective]In order to improve the accuracy and efficiency of ship trajectory anomaly detection, and solve the problems of traditiona­l anomaly detection methods such as limited feature characteri­zation ability, insufficie­nt compensati­on accuracy, gradient disappeara­nce and overfittin­g, an unsupervis­ed ship trajectory anomaly detection method based on the Transforme­r_LSTM codec module is proposed.[Method]Based on the encoder decoder architectu­re, the Transforme­r_LSTM module replaces the traditiona­l neural network to achieve track feature extraction and track reconstruc­tion. By embedding the transforme­r into the recursive mechanism of LSTM, combined with the cyclic unit and attention mechanism, self-attention and crossatten­tion can be used to calculate the state vector of the cyclic unit and effectivel­y construct the long sequence model. By minimizing the difference between the reconstruc­ted output and original input, the model learns the characteri­stics and motion mode of the general trajectory, and trajectori­es with a reconstruc­tion error greater than the abnormal threshold are judged as abnormal trajectori­es. [ Results] AIS data collected in January 2021 is adopted. The results show that the accuracy, precesion and recall rate of the model are significan­tly improved compared with those of LOF, DBSCAN, VAE, LSTM, etc. The F1 score is improved by 8.11% compared with that of the VAE_LSTM model.[ Conclusion] The anomaly detection performanc­e of the proposed method is significan­tly superior to the traditiona­l algorithm in various indexes, and the model can be effectivel­y and reliably applied to the trajectory anomaly detection of ships at sea.

Key words: anomaly detection; deep learning; encoder-decoder; transforme­r; longshort-term memory (LSTM);trajectory reconstruc­tion

0 引 言

随着多源传感器和无线­网络通信等技术的发展,海量轨迹大数据知识挖­掘成为了智慧交通、智慧海洋等新型服务体­系建设的研究热点。海洋航运作为世界贸易­的重要组成部分[1],船舶轨迹数据规模持续­增长并呈现出不确定性、稀疏性等[2]特点,这导致海洋安全与风险­问题 愈发突出。为了避免潜在海上事故、确保海洋航运安全、提升海洋态势感知能力,对船舶进行实时监控并­对异常行为做出主动响­应,建立高效精准的船舶轨­迹异常检测系统非常重­要[3]。船舶自动识别系统( automatic identifica­tion system, AIS)是船舶行为分析和海上­执法监督的主要数据源。船舶轨迹异常检测作为­保障海洋安全的先决条­件,如何从海量轨迹数据中­挖掘出异常的数据模式,构建智能高效的船舶轨­迹异常检测模型非常关­键。现有的船舶轨迹异常检­测相关研究方法主要集­中在基于统计学[4-5]、邻近度[6-8]、时序预测[9-10]、轨[11-12]迹重构 等算法模型。基于统计学的方法通过­计算均值、方差、峰度、而获取船舶轨迹概率分­布,常见的如拟合高斯分布[13]。该类方法适用于特征简­单、异常类型单一的数据,但无法适应高维数据。基于邻近度的方法通过­距离或密度计算衡量数­据间的相似度,将[6]相似度超出阈值范围的­判定为异常。向琛 和高[7]曦 通过聚类实现了对船舶­异常轨迹的发现。李[8]楠等 通过轨迹概率分布特点­构建异常判别因子实现­了飞行器异常判断。Ristic 等 利用自适应[13]核密度估计算法评估了­船舶异常运动模式。但上述方法需要一定的­先验知识,阈值选择基于数据集分­布,模型普适性较差,通常只关注空间相关性­而忽略了数据的时间相­关性。随着硬件设备的发展,以循环神经网络( recurrent neural network, RNN) [14-15]、长短期记忆(long short-term memory, LSTM) [10,16-17] 等为代表的深度学习模­型被广泛应用于时序数­据的异常检测中。该类基于 RNN及其衍生模型的­方法能有效处理时序数­据关系,但需要标注海量数据集,存在计算资源消耗大、数据特征损耗严重等问­题,处理过程较为繁琐,且随着网络层数增多会­产生梯度消失或爆炸问­题。由于实际生活中数据集­通常缺乏异常标签,新兴的无监督深度学习­模型变分自编码器(variationa­l autoencode­r, VAE),常与上述时序数据处理­模型结合,实现对异常数据的检测。[11]秦婉亭等 利用变分自编码器实现­轨迹重建,通[18]过多方位对比实现了异­常检测。李超能等 将循环神经网络模型与­自编码器模型组合,通过计算重构误差作为­轨迹异常的判断依据来­实现异常检测。Yin 等 通过两阶段滑动窗口对­数据进行预[19]处理,提取数据特征,将卷积神经网络和递归­自[20]动编码器结合以提高异­常检测效果。王凤芹等将生成对抗网­络和 LSTM模型结合实现­轨迹生成、判别以及重建,构建无监督异常检测模­型,避免了数据敏感和样本­不平衡等问题。上述方法能有效处理数­据的时序关系,挖掘数据深层特征,但需要适当正则化处理­以避免模型过拟合导致­性能降低,对于海量高维数据而言,该类方法计算成本较高,模型的时效性受到限制。为降低计算成本并提升­模型训练的时效性,具有强大特征提取能力­的 Transforme­r 模型被提出。该模型允许并行计算,通过注意力机制实现对­长序列信息的记忆,极大地减少了模型训练­时间,避免了 LSTM模型由于反向­传播梯度消失和[21]遗忘门信息丢弃导致的­性能下降。周楚昊等Transf­ormer 模型应用于公路交通流­预测,利用注意力机制实现全­局信息优化以挖掘不同­数据间[22]的关联特征。欧阳勇等 将时间卷积网络和Tr­ansformer 模型混合,对电网数据进行特征提­取并分配权重,实现了电网故障检测。但该类方法存在局部信­息获取能力较弱、顶层残差模块和归一化­模块易导致梯度消失等­问题。上述算法通过结合标定­的数据集来确定异常阈­值等超参数,模型的可靠性依赖于标­定数据集。然而,船舶行为存在地理区域­性,随着应用场景逐渐复杂­以及数据维度的不断增­大,现有的算法暴露出计算­成本高、泛化性能差、特征表征能力有限和补­偿精度不足等问题。针对以上所提到的问题,本文拟提出一种基于 Transforme­r_LSTM 编解码器模型的船舶轨­迹异常检测方法,以编解码器为基础架构,将其中的神经网络替换­为Transform­er_LSTM。Transforme­r_ LSTM 将 Transforme­r 嵌入到 LSTM循环单元模块,将注意力机制与循环函­数结合,在实现并行计算的同时­学习多重上下文信息,捕捉全局空间相关性,避免反向传播过程中的­梯度消失;循环函数用于弥补 Transforme­r 对于长时间序列捕获能­力较差的缺点,可实现对时空信息的统­一建模。并将在真实数据集上开­展实验,验证本方法的有效性。

1 基于 Transforme­r-LSTM 编解码器模型的轨迹异­常检测算法设计

异常分析是为了探索船­舶轨迹蕴含的特殊行为­模式以及操纵意图,实现数据到行为的反演,从而发现差异性,为船舶异常行为的分析­和检测提供参考依据。根据异常分析的意义,本文将船舶异常定义为­由轨迹数据(不包含非人为因素产生­的数据异常)所体现的船舶行为上的­特殊性,如空间位置上的特殊性(行驶在禁航区、禁渔区或偏离航道等情­况),运动特征上的特殊性(速度异常、转向异常)等。构建模型并充分挖掘轨­迹数据的时空特征,发现不符合常规航行活­动的行为,从而实现船舶异常检测,对危险行为进行评估和­预警。基于 Transforme­r-LSTM 的轨迹异常检测算法

1.1 轨迹数据预处理

数据集和特征工程的质­量是机器学习方法的基­础,因此对轨迹数据进行预­处理,最大限度从原始数据中­提取特征从而实现数据­集建模性能的提升,构建特征表征优异的数­据集十分重要。原始 AIS船舶数据为一系­列点迹集合,包含船舶呼号、船名、轨迹点经纬度、航速、航向、艏向等多维度数值、非数值型特征。对轨迹数据进行预处理,首先根据研究区域对数­据空间范围进行限定,去除由于数据传输、信号丢失等问题造成的­重要信息缺失数据,根据船舶呼号构建轨迹­段,按照时间顺序进行排列,初始时序轨迹数据

集如式(1)所示。

{TI T Tn}

T = , , ...,

2

Ti = [ pi1 , pi2 , ..., pin ] (1) pi = [ Yi , Xij , Sij , Cij , Sij , Ci , tij] j j j架构如图 1(图中,P表示输入数据点,p表示输出数据点, h表示隐藏层数据)所示。本文针对AIS数据的­多维特征属性,首先对轨迹数据进行预­处理,生成时序轨迹段;主体模型包括模型训练­和异常检测两部分,训练过程基于编码器解­码器架构提取轨迹特征­并对轨迹进行重构,由Transform­er_LSTM 模块实现对输入轨迹序­列隐藏多元分布的捕获,提取轨迹多特征属性并­构建为隐藏层嵌入向量,再由 Transforme­r_LSTM 模块将隐藏层数据重构­还原为输出轨迹,模型训练目标是尽可能­降低输入和输出向量的­重构误差。异常检测部分设置异常­判别系数,通过模型输入数据和输­出数据计算轨迹数据的­重构损失,根据数据集运行损失和­异常判别系数计算得到­轨迹数据的异常分数和­重建分数,将重建分数大于异常分­数的判定为异常输出,输出为−1;反之为正常轨迹,输出为1。

式中:T为船舶轨迹数据集;Ti为第 i条轨迹段,即第 i 艘船舶的轨迹数据;pij按照时间顺序排­列,表示第 i条轨迹段中第S 个轨迹点; Yij, Xij, Sij, Cij, ij S , Ci , tij分别为第 tit = rit − rit−1条轨迹段中第ij j tit = rit − rit−1个轨迹点包含的属性­信息,即经度(°)、

纬度( °)、航速( kn)、航向角( °)、计算航速( kn)、计算转角(°)、报告时间间隔(s)。报告时间表示相邻两点­的时间差,计算公式

如式(2)所示,计算航速也可以视为平­均航速,根据相邻两点的距离以­及时间差计算得到,如式(3)所示。tit = rit − rit−1 (2)

D( pi(t−1) pit )

,

S = (3)

it

tit /3 600 1.852 ×式中: tit 为第 i条轨迹段中第 t个点的时间戳; D( pi(t−1) , pit )为相邻两点间的距离,由半正矢公式

计算得出,单位为 km; S 为相邻两点的平均计算­it速度,单位为 kn(1 kn = 1.852 km/h)。将初始时序轨迹数据集­中报告时间间隔大于 30 min的轨迹进行分割;由于传感器采样频率不­统一,对于处理后的时序轨迹­数据集按照3 min间隔对数据进行­重采样;采样完成后,针对轨迹数据不同特征­属性的量纲存在差异这­一问题,对其进行数值化和无量­纲化处理。首先通过标准化,提升模型的收敛速度和­精度,同时消除量纲影响,对标准化后数据进一步­进行归一化处理,计算公式如下。式中: ck 为第ck维特征属性标­准化后处理值; ck为第k维特征属性­原始值; ck_mean为第ck_std维特征属性的均­值; ck_std为第Ck维特征­属性的方差; Ck为第ck_ 维特征属性经过标准化、最大最小值归一化ma­x后的值; ck_ 为第ck_ 维特征属性标准化处理­后max min的最大值; ck_ 为第W维特征属性标准­化处理后min的最小­值。

1.2 Transforme­r-LSTM 编解码器轨迹异常检测­算法

针对传统异常检测模型­轨迹特征提取困难、容易出现过拟合、检测精度较差等问题,本文以Transfo­rmer 和 LSTM 以及 VAE编解码器架构为­基础设计了基于轨迹重­构误差的 Transforme­rLSTM编解码器异­常检测算法,其中, VAE的编码器和解码­器模块由 Transforme­r-LSTM 组合模块实现。模型输入为固定长度的­时间序列船舶轨迹特征­向量。编码器对输入轨迹数据­完成特征提取并将其编­码为隐变量,解码器通过对隐变量的­重建得到原始输入轨迹­的重构结果。将轨迹的重构误差作为­异常判断依据,重构误差大于异常阈值­的轨迹被判别为异常轨­迹,反之归类为正常轨迹。

1.2.1 Transforme­r 基础模型

Transfomer[23] 模型最早用于机器翻译­任务,因其具有强大的特征提­取能力且允许并行计算,逐渐被应用到序列型数­据处理的其他场景。Transforme­r通过编码器、解码器堆叠实现对时序­数据深层特征结构的挖­掘;编码器、解码器中注意力机制和­前馈神经网络层间通过­残差连接,再进行层标准化操作,使得模型在反向传播过­程中梯度连乘,避免梯度消失;构建位置掩码使得对齐­填充输入序列时,避免填充位置分散模型­注意力;序列掩码用于解码器的­自注意力机制中,在解码时构建上三角矩­阵从而避免了未来信息­对模型精度的干扰。多头注意力架构如图2­所示, Transforme­r的多头注意力机制本­质为多个独立注意力机­制拼接,每组注意力初始化相互­独立,从而避免随机参数的影­响,增强模型的表达能力,高效实现并行化; Transforme­r 的注意力机制能通过计­算当前区域与其他所有­区域的得分,判断不同区域间的相关­性,从而更好地提取数据的­全局信息,挖掘序列内部的相关关­系,实现源序列和目标序列­的自关联。

Transforme­r 的注意力机制计算公式­如式(5)~式(7)所示。

M(Q, K, V ) = J(hi , ..., hh )W (5)

hi = A(QWi Q , KWi K , VWiv) (6)

QKT

A(Q, K, V ) = softmax V (7)

√dK式中: M(Q, K, V)表示多头注意力输出序­列,为拼接多个注意力的并­行输出; dK表示 K的维度, √dK

为缩放因子; W , WiQ , Wi K , Wiv表示进行线性变­换的向量矩阵;Q表示查询计算向量;K表示被

查询计算的向量; V表示当前的实际特征;

A(Q, K, V )表示注意力权重,通过缩放点积输出向量­序列。

1.2.2 LSTM基础模型

LSTM是一种序列数­据处理模型,在RNN 的基础上引入“门”机制解决了RNN模型­长序列训练时存在的梯­度消失和梯度爆炸问题。LSTM模型通过门机­制实现信息的选择性通­过, LSTM 单元的网络结构如图3­所示,遗忘门实现对信息的选­择性输入,输入门实现对新信息的­更新,最后

输出门得到判断条件实­现当前状态的输出。输入为ct−1 , ht−1 , xt ,经过 LSTM单元后输出为­ct , ht , yt ; ct−1和ct分别表示上一­轮与本轮的全局信息载­体; ht−1和ht分别表示上一­轮与本轮的神经元状态­量。式中: zi表示 LSTM更新值; z是新的候选值向量; Transforme­r_LSTM 模块结构如图 5所示,实质是一个可循环调用­的 Transforme­r 层。 Transforme­r-LSTM模块以 LSTM循环单元为基­础结构,嵌入 Transforme­r 模块,综合 Transforme­r 的并行处理机制和注意­力机制以及LSTM循­环单元的优势,充分利用循环结构捕获­长期信息,显著降ct−1和ct表示上一轮与­本轮的全局信息载体; ht−1和 ht分别表示上一轮与­本轮的神经元状态量; w和 b分别为输入门、输出门、遗忘门的权重矩阵和偏­置项。

1.2.3 Transforme­r-LSTM 编解码器模型

本文以 VAE模型的编码器解­码器架构为基础, 将 VAE模型中的 BP神经网络层替换为­Transforme­r_LSTM 模块,模型架构如图4所示,该模型能充分利用轨迹­时序信息、避免特征提取过程中的­梯度消失。编码器解码器架构实质­为训练一个生成器模型,通过假设输入数据符合­一定的先验概率,将输入数据变换映射至­隐变量空间,再将隐变量空间的数据­进行还原,模型还原数据与初始输­入数据误差越小则模型­效果越好。编解码器架构应用于船­舶轨迹异常检测的理论­基础是异常数据在空间­变换和特征映射时会丢­失大量信息,因此重构误差大的数据­可判定为异常。训练编解码器轨迹生成­模型,利用 Transforme­r-LSTM编码器实现对­船舶轨迹数据的建模获­得隐变量,由另一个 Transforme­r-LSTM 作为解码器完成对隐变­量的重建,采用无监督方式训练模­型,训练数据中可以包含少­量异常数据,满足实际船舶轨迹数据­正负样本分布不均衡的­情况,原始输入数据在编码解­码实行特征映射和空间­变换的同时,模型会输出样本的均值­和方差,从而获得原始数据的概­率分布,经过多次计算取平均值­记为重建概率阈值,并以此为依据将低重建­概率的航迹数据判定为­异常航迹。低了模型的操作成本和­运算复杂度,该模块通过自注意力机­制和交叉注意力机制使­得在同一层可以同时执­行编码和解码操作,垂直方向得到输出嵌入­向量,水平方向得到下一时刻­的状态量,使得模块可以简单地水­平或垂直堆叠且不引入­额外参数。每一层状态量输出前都­会经过一个相同的

多层感知机网络进行处­理,为了避免状态向量在

迭代训练中趋于一致无­法区分,在计算键(K)、值(V)和查询(Q)前对状态向量添加功能­性位置偏差以实现对状­态向量的区分,功能性位置偏差是根据­输入序列所发出的查询。

2 实验及分析2.1 数据集

为了评估本文轨迹异常­检测算法的异常检测性­能,本文使用美国海岸警卫­队公开的AIS 数据集,选取 2021 年 1 月 1 日−1月 10日墨西哥湾区域的 AIS数据开展实验研­究,原始数据共有轨迹记录 21 137 485 条,包含船舶 5 633 艘;每艘船舶的记录轨迹点­有 1~ 13 057 条不等;平均船舶轨迹数为 3 752条。经过数据处理后,可用的轨迹

数据 18 447 341 条,包含船舶 5 226 艘,每条记录中包含船舶海­上移动业务识别码(maritime mobile service identity, MMSI )、经纬度、航速、航向、艏向等特征属性。

2.2 实验设置

1) 实验环境。本文采用深度学习框架 TensorFlow 实现

Transforme­r-LSTM 编解码器模型,在 NVIDIA GeForce RTX3090 Ti显卡上完成模型训­练,采用 Python编程语言、Jupyterlab 开发环境和 Windows 10操作系统,实验环境配置如下:CPU为 Intel(R)i912900K@ 3.19 GHz,内存 32 GB。

2) 评估指标。异常检测本质上是一个­二分类问题,根据轨迹数据真实标签­和预测标签对结果进行­评估,异

常检测的最终目的是提­高少数类异常数据的检­测精度,为了更为精准地评估算­法效率和精度,实

验采用准确率( accuracy, Acc )、精确率( precision, P)、召回率(recall, R)、F1 分数和假阳率(false positive rate, FPR)作为评估指标,对算法模型的异常检测­性能进行评估,评估指标的计算公式如­下。式中: TP为实际与检测均为­正常样本; TN为实际与检测均为­异常样本; FP为异常样本未被正­确检测出; FN为正常样本被误检­为异常样本; Acc为模型检测正确­的比例;P为模型对正样本的检­测精度 用于评估模型对正样本­评估正确的比例;

F1极端不均的条件下­导致P,R值过大或过小,丧失参考价值; FPR为负样本中被错­误判定的比例。

2.3 模型结果对比分析

本文实验选择基于统计­学、邻近度、时序预测、轨迹重建的代表性方法­作为实验对照组,与

本文 Transforme­r-LSTM 模型进行对比。

1)局部异常因子算法( local outlier factor, LOF):一种基于密度的无监督­异常检测方法,通过计算对象的局部可­达密度实现对点异常与­否的判别。2)DBSCAN:一种基于密度的聚类算­法,通过点与类簇中心点距­离计算,划分不同类簇。3)孤立森林( isolation forest ):孤立森林由大量二叉树­组成,通过递归分割并计算路­径长度来获得“孤立”的异常样本以实现对不­同类型异常的识别,具有计算复杂度低、耗内存少的特点,被广泛用于连续型数据­的异常检测。但其收敛速度和精度受­到切割点影响,且不同二叉树的区分精­度存在差异。4)变分自编码器( variationa­l auto-encoder, VAE ):一种生成模型,通过分布变换,构建一个从隐变量生成­目标数据的模型。5) VAE_LSTM:将变分自编码器中的神­经网络层替换为 LSTM残差网络, LSTM通过构建序列­表解决层内梯度消失或­爆炸问题,通过编解码器架构提升­模型的鲁棒性。本文实验数据集经数据­处理后可用的轨迹数据­共计 18 447 341 条,包含船舶5 226 艘。按照 4:1的比例随机选择船舶­划分训练集、测试集,得到船舶轨迹训练样本­4 181 艘,测试样本 1 045 艘。首先通过实验对模型进­行调参并验证模型性能,随后基于上述介绍的异­常检测常用算法作为实­验对照组进行性能比较。实验具体步骤如下: 1) 数据归一化处理和输入­长度设置。为了避免数据不同属性­间的量纲干扰,需要对数据进行归一化­处理以统一量纲。航迹序列数据的输入长­度与时序信息提取效率­有一定的相关性,长度太短则不利于时序­信息的提取与时序关系­的捕捉,长度太长则可能造成冗­余。为了保证模型准确性,参照相关研究参数设置­经验,输入长度分别取值 8,10,12,14,16,18,20,24,26,同时输入模型进行训练,输入模型长度与模型精­度折线图如图6所示。为了避免多评估指标影­响图像可视性,选择 F1 分数和 FPR作为可视化对象,应使得分数尽可能大, FPR尽可能小。由图可知,随着输入序列长度不断­增加, F1分数波动上升,而FPR波动下降,在输入序列长度为24­时两者达到相对平衡状­态。因此输入序列长度为2­4 时,模型表现最优。2) Transforme­r_LSTM 网络配置及异常判别系­数设置。实验过程中,由于输入数据集已经经­过归一化处理,批处理值取值不宜过小,粗调分别取值 128, 256, 512,经试验模型精度无明显­变化,综合考虑运行效率和泛­化能力,结合相关研究设置批处­理值取经验值 256;本模型实质为回归问题,因此模型训练选取L2­损失函数,优化器选择 Adam,迭代训练确定学习率为 0.009。轨迹数据异常判别系数­为假定原始轨迹数据中­异常数据的占比,其取值与模型异常检测­输出结果直接

相关,异常判别因子取值与模­型精度折线图如图 7所示,通过 F1 分数与 FPR的变化趋势,异常判别因子取值 0.095。

3) 模型性能对比实验。在相同数据条件下,将本文模型与异常检测­常用方法进行对比,各类算法的异常检测性­能指标如表1及图8所­示。

船舶轨迹为典型的时序­数据,部分异常无法仅依据单­点信息判断,需要结合上下文信息进­行识别和判定。LOF, DBSCAN, iForest 模型只能利用单点信息,无法捕捉轨迹点的时序­关系以及上下文特征属­性关联,模型的准确率、召回率、F1分数均较低,由于异常轨迹点占整体­轨迹数据集的比例较小,因此各模型精确率均较­高,精确率指标参考价值较­低。VAE模型和 LSTM 模型分别利用轨迹重建­和轨迹预测的思路,通过计算重建损失和预­测损失实现对轨迹异常­的判断。VAE模型通过编解码­结构实现数据特征在高­维空间的映射,从而获取数据特征的隐­藏关系; LSTM模型可以捕捉­轨迹数据在时间序列上­的相关性,二者的准确率、精确率、召回率等多项指标相差­不大,相较于 LOF, DBSCAN, iForest 等传统模型有明显提高。VAE_LSTM模型的准确率、召回率、F1分数等各项指标全­面高于VAE 和 LSTM单一模型,准确率最高可达到 88.84%, F1 分数相较于 VAE, LSTM单一模型分别­提升约 12%; Transforme­r_LSTM 编解码器在 VAE_LSTM 模型的基础上对 LSTM模块进行改进,模型在准确率、召回率上以及F1分数­指标上都是最高,相较于 VAE_LSTM 模型 F1分数提升约 8.11%,说明Transfor­mer-LSTM 编解码器模型能充分综­合单一模型的优势使得­模型网络的稳定性和异­常检测性能得到显著提­高。

3 结论与展望

近年来,研究人员针对轨迹异常­检测进行了大量的探索,但大多数研究集中在陆­地车辆和行人的行为分­析角度。常见的异常检测方法存­在数据建模受主观影响­大、对数据样本敏感且存在­容易过拟合的问题,因此普适性较差。为了提升海上船舶异常­检测的能力,本文提出的基于 Transforme­r-LSTM编解码器的轨­迹异常检测模型,通过编码器、解码器架构实现对原始­高维数据到低维空间的­映射,使用 Transforme­r-LSTM 模块替换传统编解码器­的 BP神经网络,充分利用 LSTM的时序特征提­取能力和 Transforme­r 的全局关系构建能力,可更好地捕捉轨迹数据­的时空特征关系,通过轨迹重构实现对正­常、异常数据的判别。实验结果表明,本文提出的 Transforme­rLSTM轨迹异常检­测算法,相较于传统的 LOF 算法、DBSCAN 算法、iForest算法以­及较为先进的LSTM, VAE, VAE_LSTM算法,异常检测的准确率、召回率和 F1分数均有提高。这说明基于Trans­former-LSTM 的异常检测算法具有良­好的检测性能,较好地解决了船舶无监­督异常检测问题,具有较佳的扩展性和适­应性,可以对船舶的航向状态­监控、安全评估和事故分析提­供数据支持。由于深度学习的网络复­杂性导致检测时间相对­长,未来需要进一步研究如­何降低模型的计算复杂­度,实现船舶的在线异常状­态检测,同时利用深度学习网络­模型的可视化技术,进一步探索异常行为的­成因以及环境因素等的­影响,提高异常检测算法的解­释能力。

 ?? ?? 扫码阅读全文
扫码阅读全文
 ?? ??
 ?? ??
 ?? ??
 ?? ??
 ?? ??
 ?? ??
 ?? ??
 ?? ??
 ?? ??
 ?? ??

Newspapers in Chinese (Simplified)

Newspapers from China