Chinese Journal of Ship Research
基于 Transformer_LSTM 编解码器模型的船舶轨迹异常检测方法
李可欣*1,郭健1,李冉冲2,王宇君3,李宗明4,缪坤5 1中国人民解放军战略支援部队信息工程大学,河南郑州 450001 2中国人民解放军 61221 部队,北京 100000 3中国人民解放军 32022 部队,广东广州 510000 4中国人民解放军 31682 部队,甘肃兰州 730000 5中国人民解放军陆军特种作战学院,广西桂林 541000
摘 要:[目的]为提升船舶轨迹异常检测的精度和效率,解决传统异常检测方法存在的特征表征能力有限、补偿精度不足、容易出现梯度消失、过拟合等问题,提出一种基于 Transformer_LSTM 编解码器模型的无监督船舶轨迹异常检测方法。[方法]该方法基于编码器解码器架构,由 Transformer_LSTM 模块替代传统神经网络实现轨迹特征提取和轨迹重构;将 Transformer 嵌入 LSTM的递归机制,结合循环单元和注意力机制,利用自注意力和交叉注意力实现对循环单元状态向量的计算,实现对长序列模型的有效构建;通过最小化重构输出和原始输入之间的差异,使模型学习一般轨迹的特征和运动模式,将重构误差大于异常阈值的轨迹判定为异常轨迹。[结果]采用 2021 年 1月的船舶 AIS数据进行实验,结果表明,模型在准确率、精确率以及召回率上相较于 LOF, DBSCAN, VAE, LSTM等经典模型有着明显提升; F1分数相较于 VAE_LSTM 模型提升约8.11%。[结论]该方法的异常检测性能在各项指标上显著优于传统算法,可有效、可靠地运用于海上船舶轨迹异常检测。关键词:异常检测;深度学习;编码器解码器;Transformer;长短期记忆;轨迹重建
中图分类号: U665.2文献标志码:A DOI:10.19693/j.issn.1673-3185.03291
Ship trajectory anomaly detection method based on encoder-decoder architecture composed of Transformer_LSTM modules
LI Kexin*1, GUO Jian1, LI Ranchong2, WANG Yujun3, LI Zongming4, MIU Kun5
1 Information Engineering University, Zhengzhou 450001, China
2 The 61221 Unit of PLA, Beijing 100000, China
3 The 32022 Unit of PLA, Guangzhou 510000, China
4 The 31682 Unit of PLA, Lanzhou 730000, China
5 Special Operations Command College, Guilin 541000, China
Abstract: [Objective]In order to improve the accuracy and efficiency of ship trajectory anomaly detection, and solve the problems of traditional anomaly detection methods such as limited feature characterization ability, insufficient compensation accuracy, gradient disappearance and overfitting, an unsupervised ship trajectory anomaly detection method based on the Transformer_LSTM codec module is proposed.[Method]Based on the encoder decoder architecture, the Transformer_LSTM module replaces the traditional neural network to achieve track feature extraction and track reconstruction. By embedding the transformer into the recursive mechanism of LSTM, combined with the cyclic unit and attention mechanism, self-attention and crossattention can be used to calculate the state vector of the cyclic unit and effectively construct the long sequence model. By minimizing the difference between the reconstructed output and original input, the model learns the characteristics and motion mode of the general trajectory, and trajectories with a reconstruction error greater than the abnormal threshold are judged as abnormal trajectories. [ Results] AIS data collected in January 2021 is adopted. The results show that the accuracy, precesion and recall rate of the model are significantly improved compared with those of LOF, DBSCAN, VAE, LSTM, etc. The F1 score is improved by 8.11% compared with that of the VAE_LSTM model.[ Conclusion] The anomaly detection performance of the proposed method is significantly superior to the traditional algorithm in various indexes, and the model can be effectively and reliably applied to the trajectory anomaly detection of ships at sea.
Key words: anomaly detection; deep learning; encoder-decoder; transformer; longshort-term memory (LSTM);trajectory reconstruction
0 引 言
随着多源传感器和无线网络通信等技术的发展,海量轨迹大数据知识挖掘成为了智慧交通、智慧海洋等新型服务体系建设的研究热点。海洋航运作为世界贸易的重要组成部分[1],船舶轨迹数据规模持续增长并呈现出不确定性、稀疏性等[2]特点,这导致海洋安全与风险问题 愈发突出。为了避免潜在海上事故、确保海洋航运安全、提升海洋态势感知能力,对船舶进行实时监控并对异常行为做出主动响应,建立高效精准的船舶轨迹异常检测系统非常重要[3]。船舶自动识别系统( automatic identification system, AIS)是船舶行为分析和海上执法监督的主要数据源。船舶轨迹异常检测作为保障海洋安全的先决条件,如何从海量轨迹数据中挖掘出异常的数据模式,构建智能高效的船舶轨迹异常检测模型非常关键。现有的船舶轨迹异常检测相关研究方法主要集中在基于统计学[4-5]、邻近度[6-8]、时序预测[9-10]、轨[11-12]迹重构 等算法模型。基于统计学的方法通过计算均值、方差、峰度、而获取船舶轨迹概率分布,常见的如拟合高斯分布[13]。该类方法适用于特征简单、异常类型单一的数据,但无法适应高维数据。基于邻近度的方法通过距离或密度计算衡量数据间的相似度,将[6]相似度超出阈值范围的判定为异常。向琛 和高[7]曦 通过聚类实现了对船舶异常轨迹的发现。李[8]楠等 通过轨迹概率分布特点构建异常判别因子实现了飞行器异常判断。Ristic 等 利用自适应[13]核密度估计算法评估了船舶异常运动模式。但上述方法需要一定的先验知识,阈值选择基于数据集分布,模型普适性较差,通常只关注空间相关性而忽略了数据的时间相关性。随着硬件设备的发展,以循环神经网络( recurrent neural network, RNN) [14-15]、长短期记忆(long short-term memory, LSTM) [10,16-17] 等为代表的深度学习模型被广泛应用于时序数据的异常检测中。该类基于 RNN及其衍生模型的方法能有效处理时序数据关系,但需要标注海量数据集,存在计算资源消耗大、数据特征损耗严重等问题,处理过程较为繁琐,且随着网络层数增多会产生梯度消失或爆炸问题。由于实际生活中数据集通常缺乏异常标签,新兴的无监督深度学习模型变分自编码器(variational autoencoder, VAE),常与上述时序数据处理模型结合,实现对异常数据的检测。[11]秦婉亭等 利用变分自编码器实现轨迹重建,通[18]过多方位对比实现了异常检测。李超能等 将循环神经网络模型与自编码器模型组合,通过计算重构误差作为轨迹异常的判断依据来实现异常检测。Yin 等 通过两阶段滑动窗口对数据进行预[19]处理,提取数据特征,将卷积神经网络和递归自[20]动编码器结合以提高异常检测效果。王凤芹等将生成对抗网络和 LSTM模型结合实现轨迹生成、判别以及重建,构建无监督异常检测模型,避免了数据敏感和样本不平衡等问题。上述方法能有效处理数据的时序关系,挖掘数据深层特征,但需要适当正则化处理以避免模型过拟合导致性能降低,对于海量高维数据而言,该类方法计算成本较高,模型的时效性受到限制。为降低计算成本并提升模型训练的时效性,具有强大特征提取能力的 Transformer 模型被提出。该模型允许并行计算,通过注意力机制实现对长序列信息的记忆,极大地减少了模型训练时间,避免了 LSTM模型由于反向传播梯度消失和[21]遗忘门信息丢弃导致的性能下降。周楚昊等Transformer 模型应用于公路交通流预测,利用注意力机制实现全局信息优化以挖掘不同数据间[22]的关联特征。欧阳勇等 将时间卷积网络和Transformer 模型混合,对电网数据进行特征提取并分配权重,实现了电网故障检测。但该类方法存在局部信息获取能力较弱、顶层残差模块和归一化模块易导致梯度消失等问题。上述算法通过结合标定的数据集来确定异常阈值等超参数,模型的可靠性依赖于标定数据集。然而,船舶行为存在地理区域性,随着应用场景逐渐复杂以及数据维度的不断增大,现有的算法暴露出计算成本高、泛化性能差、特征表征能力有限和补偿精度不足等问题。针对以上所提到的问题,本文拟提出一种基于 Transformer_LSTM 编解码器模型的船舶轨迹异常检测方法,以编解码器为基础架构,将其中的神经网络替换为Transformer_LSTM。Transformer_ LSTM 将 Transformer 嵌入到 LSTM循环单元模块,将注意力机制与循环函数结合,在实现并行计算的同时学习多重上下文信息,捕捉全局空间相关性,避免反向传播过程中的梯度消失;循环函数用于弥补 Transformer 对于长时间序列捕获能力较差的缺点,可实现对时空信息的统一建模。并将在真实数据集上开展实验,验证本方法的有效性。
1 基于 Transformer-LSTM 编解码器模型的轨迹异常检测算法设计
异常分析是为了探索船舶轨迹蕴含的特殊行为模式以及操纵意图,实现数据到行为的反演,从而发现差异性,为船舶异常行为的分析和检测提供参考依据。根据异常分析的意义,本文将船舶异常定义为由轨迹数据(不包含非人为因素产生的数据异常)所体现的船舶行为上的特殊性,如空间位置上的特殊性(行驶在禁航区、禁渔区或偏离航道等情况),运动特征上的特殊性(速度异常、转向异常)等。构建模型并充分挖掘轨迹数据的时空特征,发现不符合常规航行活动的行为,从而实现船舶异常检测,对危险行为进行评估和预警。基于 Transformer-LSTM 的轨迹异常检测算法
1.1 轨迹数据预处理
数据集和特征工程的质量是机器学习方法的基础,因此对轨迹数据进行预处理,最大限度从原始数据中提取特征从而实现数据集建模性能的提升,构建特征表征优异的数据集十分重要。原始 AIS船舶数据为一系列点迹集合,包含船舶呼号、船名、轨迹点经纬度、航速、航向、艏向等多维度数值、非数值型特征。对轨迹数据进行预处理,首先根据研究区域对数据空间范围进行限定,去除由于数据传输、信号丢失等问题造成的重要信息缺失数据,根据船舶呼号构建轨迹段,按照时间顺序进行排列,初始时序轨迹数据
集如式(1)所示。
{TI T Tn}
T = , , ...,
2
Ti = [ pi1 , pi2 , ..., pin ] (1) pi = [ Yi , Xij , Sij , Cij , Sij , Ci , tij] j j j架构如图 1(图中,P表示输入数据点,p表示输出数据点, h表示隐藏层数据)所示。本文针对AIS数据的多维特征属性,首先对轨迹数据进行预处理,生成时序轨迹段;主体模型包括模型训练和异常检测两部分,训练过程基于编码器解码器架构提取轨迹特征并对轨迹进行重构,由Transformer_LSTM 模块实现对输入轨迹序列隐藏多元分布的捕获,提取轨迹多特征属性并构建为隐藏层嵌入向量,再由 Transformer_LSTM 模块将隐藏层数据重构还原为输出轨迹,模型训练目标是尽可能降低输入和输出向量的重构误差。异常检测部分设置异常判别系数,通过模型输入数据和输出数据计算轨迹数据的重构损失,根据数据集运行损失和异常判别系数计算得到轨迹数据的异常分数和重建分数,将重建分数大于异常分数的判定为异常输出,输出为−1;反之为正常轨迹,输出为1。
式中:T为船舶轨迹数据集;Ti为第 i条轨迹段,即第 i 艘船舶的轨迹数据;pij按照时间顺序排列,表示第 i条轨迹段中第S 个轨迹点; Yij, Xij, Sij, Cij, ij S , Ci , tij分别为第 tit = rit − rit−1条轨迹段中第ij j tit = rit − rit−1个轨迹点包含的属性信息,即经度(°)、
纬度( °)、航速( kn)、航向角( °)、计算航速( kn)、计算转角(°)、报告时间间隔(s)。报告时间表示相邻两点的时间差,计算公式
如式(2)所示,计算航速也可以视为平均航速,根据相邻两点的距离以及时间差计算得到,如式(3)所示。tit = rit − rit−1 (2)
D( pi(t−1) pit )
,
S = (3)
it
tit /3 600 1.852 ×式中: tit 为第 i条轨迹段中第 t个点的时间戳; D( pi(t−1) , pit )为相邻两点间的距离,由半正矢公式
计算得出,单位为 km; S 为相邻两点的平均计算it速度,单位为 kn(1 kn = 1.852 km/h)。将初始时序轨迹数据集中报告时间间隔大于 30 min的轨迹进行分割;由于传感器采样频率不统一,对于处理后的时序轨迹数据集按照3 min间隔对数据进行重采样;采样完成后,针对轨迹数据不同特征属性的量纲存在差异这一问题,对其进行数值化和无量纲化处理。首先通过标准化,提升模型的收敛速度和精度,同时消除量纲影响,对标准化后数据进一步进行归一化处理,计算公式如下。式中: ck 为第ck维特征属性标准化后处理值; ck为第k维特征属性原始值; ck_mean为第ck_std维特征属性的均值; ck_std为第Ck维特征属性的方差; Ck为第ck_ 维特征属性经过标准化、最大最小值归一化max后的值; ck_ 为第ck_ 维特征属性标准化处理后max min的最大值; ck_ 为第W维特征属性标准化处理后min的最小值。
1.2 Transformer-LSTM 编解码器轨迹异常检测算法
针对传统异常检测模型轨迹特征提取困难、容易出现过拟合、检测精度较差等问题,本文以Transformer 和 LSTM 以及 VAE编解码器架构为基础设计了基于轨迹重构误差的 TransformerLSTM编解码器异常检测算法,其中, VAE的编码器和解码器模块由 Transformer-LSTM 组合模块实现。模型输入为固定长度的时间序列船舶轨迹特征向量。编码器对输入轨迹数据完成特征提取并将其编码为隐变量,解码器通过对隐变量的重建得到原始输入轨迹的重构结果。将轨迹的重构误差作为异常判断依据,重构误差大于异常阈值的轨迹被判别为异常轨迹,反之归类为正常轨迹。
1.2.1 Transformer 基础模型
Transfomer[23] 模型最早用于机器翻译任务,因其具有强大的特征提取能力且允许并行计算,逐渐被应用到序列型数据处理的其他场景。Transformer通过编码器、解码器堆叠实现对时序数据深层特征结构的挖掘;编码器、解码器中注意力机制和前馈神经网络层间通过残差连接,再进行层标准化操作,使得模型在反向传播过程中梯度连乘,避免梯度消失;构建位置掩码使得对齐填充输入序列时,避免填充位置分散模型注意力;序列掩码用于解码器的自注意力机制中,在解码时构建上三角矩阵从而避免了未来信息对模型精度的干扰。多头注意力架构如图2所示, Transformer的多头注意力机制本质为多个独立注意力机制拼接,每组注意力初始化相互独立,从而避免随机参数的影响,增强模型的表达能力,高效实现并行化; Transformer 的注意力机制能通过计算当前区域与其他所有区域的得分,判断不同区域间的相关性,从而更好地提取数据的全局信息,挖掘序列内部的相关关系,实现源序列和目标序列的自关联。
Transformer 的注意力机制计算公式如式(5)~式(7)所示。
M(Q, K, V ) = J(hi , ..., hh )W (5)
hi = A(QWi Q , KWi K , VWiv) (6)
QKT
A(Q, K, V ) = softmax V (7)
√dK式中: M(Q, K, V)表示多头注意力输出序列,为拼接多个注意力的并行输出; dK表示 K的维度, √dK
为缩放因子; W , WiQ , Wi K , Wiv表示进行线性变换的向量矩阵;Q表示查询计算向量;K表示被
查询计算的向量; V表示当前的实际特征;
A(Q, K, V )表示注意力权重,通过缩放点积输出向量序列。
1.2.2 LSTM基础模型
LSTM是一种序列数据处理模型,在RNN 的基础上引入“门”机制解决了RNN模型长序列训练时存在的梯度消失和梯度爆炸问题。LSTM模型通过门机制实现信息的选择性通过, LSTM 单元的网络结构如图3所示,遗忘门实现对信息的选择性输入,输入门实现对新信息的更新,最后
输出门得到判断条件实现当前状态的输出。输入为ct−1 , ht−1 , xt ,经过 LSTM单元后输出为ct , ht , yt ; ct−1和ct分别表示上一轮与本轮的全局信息载体; ht−1和ht分别表示上一轮与本轮的神经元状态量。式中: zi表示 LSTM更新值; z是新的候选值向量; Transformer_LSTM 模块结构如图 5所示,实质是一个可循环调用的 Transformer 层。 Transformer-LSTM模块以 LSTM循环单元为基础结构,嵌入 Transformer 模块,综合 Transformer 的并行处理机制和注意力机制以及LSTM循环单元的优势,充分利用循环结构捕获长期信息,显著降ct−1和ct表示上一轮与本轮的全局信息载体; ht−1和 ht分别表示上一轮与本轮的神经元状态量; w和 b分别为输入门、输出门、遗忘门的权重矩阵和偏置项。
1.2.3 Transformer-LSTM 编解码器模型
本文以 VAE模型的编码器解码器架构为基础, 将 VAE模型中的 BP神经网络层替换为Transformer_LSTM 模块,模型架构如图4所示,该模型能充分利用轨迹时序信息、避免特征提取过程中的梯度消失。编码器解码器架构实质为训练一个生成器模型,通过假设输入数据符合一定的先验概率,将输入数据变换映射至隐变量空间,再将隐变量空间的数据进行还原,模型还原数据与初始输入数据误差越小则模型效果越好。编解码器架构应用于船舶轨迹异常检测的理论基础是异常数据在空间变换和特征映射时会丢失大量信息,因此重构误差大的数据可判定为异常。训练编解码器轨迹生成模型,利用 Transformer-LSTM编码器实现对船舶轨迹数据的建模获得隐变量,由另一个 Transformer-LSTM 作为解码器完成对隐变量的重建,采用无监督方式训练模型,训练数据中可以包含少量异常数据,满足实际船舶轨迹数据正负样本分布不均衡的情况,原始输入数据在编码解码实行特征映射和空间变换的同时,模型会输出样本的均值和方差,从而获得原始数据的概率分布,经过多次计算取平均值记为重建概率阈值,并以此为依据将低重建概率的航迹数据判定为异常航迹。低了模型的操作成本和运算复杂度,该模块通过自注意力机制和交叉注意力机制使得在同一层可以同时执行编码和解码操作,垂直方向得到输出嵌入向量,水平方向得到下一时刻的状态量,使得模块可以简单地水平或垂直堆叠且不引入额外参数。每一层状态量输出前都会经过一个相同的
多层感知机网络进行处理,为了避免状态向量在
迭代训练中趋于一致无法区分,在计算键(K)、值(V)和查询(Q)前对状态向量添加功能性位置偏差以实现对状态向量的区分,功能性位置偏差是根据输入序列所发出的查询。
2 实验及分析2.1 数据集
为了评估本文轨迹异常检测算法的异常检测性能,本文使用美国海岸警卫队公开的AIS 数据集,选取 2021 年 1 月 1 日−1月 10日墨西哥湾区域的 AIS数据开展实验研究,原始数据共有轨迹记录 21 137 485 条,包含船舶 5 633 艘;每艘船舶的记录轨迹点有 1~ 13 057 条不等;平均船舶轨迹数为 3 752条。经过数据处理后,可用的轨迹
数据 18 447 341 条,包含船舶 5 226 艘,每条记录中包含船舶海上移动业务识别码(maritime mobile service identity, MMSI )、经纬度、航速、航向、艏向等特征属性。
2.2 实验设置
1) 实验环境。本文采用深度学习框架 TensorFlow 实现
Transformer-LSTM 编解码器模型,在 NVIDIA GeForce RTX3090 Ti显卡上完成模型训练,采用 Python编程语言、Jupyterlab 开发环境和 Windows 10操作系统,实验环境配置如下:CPU为 Intel(R)i912900K@ 3.19 GHz,内存 32 GB。
2) 评估指标。异常检测本质上是一个二分类问题,根据轨迹数据真实标签和预测标签对结果进行评估,异
常检测的最终目的是提高少数类异常数据的检测精度,为了更为精准地评估算法效率和精度,实
验采用准确率( accuracy, Acc )、精确率( precision, P)、召回率(recall, R)、F1 分数和假阳率(false positive rate, FPR)作为评估指标,对算法模型的异常检测性能进行评估,评估指标的计算公式如下。式中: TP为实际与检测均为正常样本; TN为实际与检测均为异常样本; FP为异常样本未被正确检测出; FN为正常样本被误检为异常样本; Acc为模型检测正确的比例;P为模型对正样本的检测精度 用于评估模型对正样本评估正确的比例;
F1极端不均的条件下导致P,R值过大或过小,丧失参考价值; FPR为负样本中被错误判定的比例。
2.3 模型结果对比分析
本文实验选择基于统计学、邻近度、时序预测、轨迹重建的代表性方法作为实验对照组,与
本文 Transformer-LSTM 模型进行对比。
1)局部异常因子算法( local outlier factor, LOF):一种基于密度的无监督异常检测方法,通过计算对象的局部可达密度实现对点异常与否的判别。2)DBSCAN:一种基于密度的聚类算法,通过点与类簇中心点距离计算,划分不同类簇。3)孤立森林( isolation forest ):孤立森林由大量二叉树组成,通过递归分割并计算路径长度来获得“孤立”的异常样本以实现对不同类型异常的识别,具有计算复杂度低、耗内存少的特点,被广泛用于连续型数据的异常检测。但其收敛速度和精度受到切割点影响,且不同二叉树的区分精度存在差异。4)变分自编码器( variational auto-encoder, VAE ):一种生成模型,通过分布变换,构建一个从隐变量生成目标数据的模型。5) VAE_LSTM:将变分自编码器中的神经网络层替换为 LSTM残差网络, LSTM通过构建序列表解决层内梯度消失或爆炸问题,通过编解码器架构提升模型的鲁棒性。本文实验数据集经数据处理后可用的轨迹数据共计 18 447 341 条,包含船舶5 226 艘。按照 4:1的比例随机选择船舶划分训练集、测试集,得到船舶轨迹训练样本4 181 艘,测试样本 1 045 艘。首先通过实验对模型进行调参并验证模型性能,随后基于上述介绍的异常检测常用算法作为实验对照组进行性能比较。实验具体步骤如下: 1) 数据归一化处理和输入长度设置。为了避免数据不同属性间的量纲干扰,需要对数据进行归一化处理以统一量纲。航迹序列数据的输入长度与时序信息提取效率有一定的相关性,长度太短则不利于时序信息的提取与时序关系的捕捉,长度太长则可能造成冗余。为了保证模型准确性,参照相关研究参数设置经验,输入长度分别取值 8,10,12,14,16,18,20,24,26,同时输入模型进行训练,输入模型长度与模型精度折线图如图6所示。为了避免多评估指标影响图像可视性,选择 F1 分数和 FPR作为可视化对象,应使得分数尽可能大, FPR尽可能小。由图可知,随着输入序列长度不断增加, F1分数波动上升,而FPR波动下降,在输入序列长度为24时两者达到相对平衡状态。因此输入序列长度为24 时,模型表现最优。2) Transformer_LSTM 网络配置及异常判别系数设置。实验过程中,由于输入数据集已经经过归一化处理,批处理值取值不宜过小,粗调分别取值 128, 256, 512,经试验模型精度无明显变化,综合考虑运行效率和泛化能力,结合相关研究设置批处理值取经验值 256;本模型实质为回归问题,因此模型训练选取L2损失函数,优化器选择 Adam,迭代训练确定学习率为 0.009。轨迹数据异常判别系数为假定原始轨迹数据中异常数据的占比,其取值与模型异常检测输出结果直接
相关,异常判别因子取值与模型精度折线图如图 7所示,通过 F1 分数与 FPR的变化趋势,异常判别因子取值 0.095。
3) 模型性能对比实验。在相同数据条件下,将本文模型与异常检测常用方法进行对比,各类算法的异常检测性能指标如表1及图8所示。
船舶轨迹为典型的时序数据,部分异常无法仅依据单点信息判断,需要结合上下文信息进行识别和判定。LOF, DBSCAN, iForest 模型只能利用单点信息,无法捕捉轨迹点的时序关系以及上下文特征属性关联,模型的准确率、召回率、F1分数均较低,由于异常轨迹点占整体轨迹数据集的比例较小,因此各模型精确率均较高,精确率指标参考价值较低。VAE模型和 LSTM 模型分别利用轨迹重建和轨迹预测的思路,通过计算重建损失和预测损失实现对轨迹异常的判断。VAE模型通过编解码结构实现数据特征在高维空间的映射,从而获取数据特征的隐藏关系; LSTM模型可以捕捉轨迹数据在时间序列上的相关性,二者的准确率、精确率、召回率等多项指标相差不大,相较于 LOF, DBSCAN, iForest 等传统模型有明显提高。VAE_LSTM模型的准确率、召回率、F1分数等各项指标全面高于VAE 和 LSTM单一模型,准确率最高可达到 88.84%, F1 分数相较于 VAE, LSTM单一模型分别提升约 12%; Transformer_LSTM 编解码器在 VAE_LSTM 模型的基础上对 LSTM模块进行改进,模型在准确率、召回率上以及F1分数指标上都是最高,相较于 VAE_LSTM 模型 F1分数提升约 8.11%,说明Transformer-LSTM 编解码器模型能充分综合单一模型的优势使得模型网络的稳定性和异常检测性能得到显著提高。
3 结论与展望
近年来,研究人员针对轨迹异常检测进行了大量的探索,但大多数研究集中在陆地车辆和行人的行为分析角度。常见的异常检测方法存在数据建模受主观影响大、对数据样本敏感且存在容易过拟合的问题,因此普适性较差。为了提升海上船舶异常检测的能力,本文提出的基于 Transformer-LSTM编解码器的轨迹异常检测模型,通过编码器、解码器架构实现对原始高维数据到低维空间的映射,使用 Transformer-LSTM 模块替换传统编解码器的 BP神经网络,充分利用 LSTM的时序特征提取能力和 Transformer 的全局关系构建能力,可更好地捕捉轨迹数据的时空特征关系,通过轨迹重构实现对正常、异常数据的判别。实验结果表明,本文提出的 TransformerLSTM轨迹异常检测算法,相较于传统的 LOF 算法、DBSCAN 算法、iForest算法以及较为先进的LSTM, VAE, VAE_LSTM算法,异常检测的准确率、召回率和 F1分数均有提高。这说明基于Transformer-LSTM 的异常检测算法具有良好的检测性能,较好地解决了船舶无监督异常检测问题,具有较佳的扩展性和适应性,可以对船舶的航向状态监控、安全评估和事故分析提供数据支持。由于深度学习的网络复杂性导致检测时间相对长,未来需要进一步研究如何降低模型的计算复杂度,实现船舶的在线异常状态检测,同时利用深度学习网络模型的可视化技术,进一步探索异常行为的成因以及环境因素等的影响,提高异常检测算法的解释能力。