基于动态图注意力的车辆轨迹预测研究*
210096) (东南大学,南京
GAT)
【摘要】针对目前轨迹预测研究中交互建模方法使用的图注意力网络( 为静态注意力,无法有效捕捉复杂道路场- ED-DGAT)
景中车辆间交互的问题,提出了一种基于编码器解码器架构的动态图注意力网络( 预测高速公路环境中运动车辆的未来轨迹。编码模块使用动态图注意力机制学习场景中车辆间的空间交互,采用状态简化动态图注意力网络建模
NGSIM LSTM)
解码阶段车辆运动的相互依赖,最后使用 数据集评估所提出的模型,并与长短时记忆( 、联合社交池化与长短S-LSTM) CS-LSTM)
时记忆( 、联合卷积社交池化与长短时记忆( 算法模型进行对比分析,结果表明,预测轨迹的均方根误差RMSE) 25%, CS-LSTM 2.61
( 降低了 且模型的推理速度为 模型的 倍。
主题词:轨迹预测 注意力机制 图神经网络 多目标交互
U461.91 A 10.19620/j.cnki.1000-3703.20230582中图分类号: 文献标志码: DOI:
Research on Vehicle Trajectory Prediction Based on Dynamic Graph Attention
Chen Xiaowei, Li Xuanpeng, Zhang Weigong
Southeast University, Nanjing 210096)
(
Abstract In current research on vehicle trajectory prediction, the existing Graph Attention Network (GAT), which is【 】based on a static attention mechanism, fails to effectively capture interactions between vehicles in complex road conditions. To address this issue, this paper proposed an Encoder- Decoder Dynamic Graph Attention Network (ED- DGAT) to predict future trajectories of highway vehicles. In this model, the encoding module incorporates a dynamic graph attention mechanism to learn spatial interactions among vehicles. Simultaneously, a simplified dynamic graph attention network is adopted to model the interdependencies of vehicle movements during the decoding phase. This paper evaluated the proposed algorithm using the NGSIM dataset and conducted comparative analysis with other models such as LSTM, SocialLSTM (S- LSTM), and CS- LSTM. The results show that the Root Mean Squared Error (RMSE) of predicted trajectory has been reduced by 25%, and the inference speed is 2.61 times of the CS-LSTM model.
Key words: Trajectory prediction, Attention mechanism, Graph neural networks, Multiobjective interaction
, , . [J]. , 2024(3): 24-30.【引用格式】陈晓伟 李煊鹏 张为公 基于动态图注意力的车辆轨迹预测研究 汽车技术
CHEN X W, LI X P , ZHANG W G. Research on Vehicle Trajectory Prediction Based on Dynamic Graph Attention[j]. Automobile Technology, 2024(3): 24-30.
1 前言
为实现安全高效行驶,自动驾驶汽车需自主且合理
地估计周围目标的运动轨迹。然而,车辆的行为决策不仅与驾驶员的驾驶风格、道路环境相关,还受到周围车
辆间交互行为的影响,故预测复杂道路场景中车辆的运
动轨迹极具挑战性。
传统方法基于运动物理学[1]或结合概率论[2- 4]估计车
辆的运动轨迹。随着人工智能技术的发展,许多研究人员Recurrent Neural Network,开始采用基于循环神经网络(
RNN) -
及其变体的编码器 解码器架构进行时序数据的RNN
预测研究[5- 6]。然而, 无法捕捉运动车辆间的空间相关性。
[7]~ [9]
文献 文献 引入了一种名为“社交池化”的机
制,该方法将道路中相邻车辆的运动特征聚合到统一的
空间网格,并利用池化和卷积等方法融合车辆的运动特[10]~ [13] Graph Neural征。文献 文献 基于图神经网络( Network,gnn)建模车辆间的交互关系,其中图的节点表示运动车辆,图的边表示车辆间的空间交互,并利用Graph Convolutional Network,gcn)图卷积网络( 聚合相[14]~ [16]邻车辆的特征。文献 文献 基于注意力机制加权聚合邻近车辆的相互影响,重点关注对目标车辆具有
更高影响力的邻近车辆。与“社交池化”方法和基于图的方法相比,基于注意力机制的方法可以更好地解释运
动车辆间的空间交互。此外,上述所有方法只考虑历史轨迹编码阶段车辆
间的交互,而在预测阶段建模邻近车辆的影响至关重要。[17] [18] GNN文献 、文献 利用基于注意力机制的 变Graph Attention Network,gat)体——图注意力网络( 建Brody GAT模道路目标间的交互。 等[19]从概念上证明了计算的是静态注意力,并提出了基于动态注意力机制的GATV2( GAT本文称为动态图注意力网络)。与 相比,动Dynamic Graph Attention Network,态图注意力网络(
DGAT)
具备更强的图表示能力。受此启发,本文提出-
一种基于编码器解码器架构的动态图注意力网络Encoder- Decoder Dynamic Graph Attention Network, (
ED-DGAT) RNN -预测车辆轨迹,模型基于 的变体 循环Gate Recurrent UNIT,GRU)
门控单元( 编码单一车辆运动DGAT的时间相关性,设计基于 的交互建模模块,利用DGAT GRU
聚合 的隐藏状态并以此编码相邻车辆的历GRU
史运动状态,在 解码阶段的每一时间帧使用状态DGAT
简化 捕获车辆间的空间交互。
和人与人之间的社交网络相似,研究人员常使用图神经
网络建模人与人之间的社交网络,受此启发,本文选择
DGAT使用图神经网络的最新方法 建模车辆间的交
DGAT
互。 为不同的邻近车辆分配不同的权重,在此基础上加权聚合邻近车辆的特征,从而更加合理地考虑周
围车辆对目标车辆的影响。3.2.1 图的构建DGAT的计算过程基于图结构,因此图的结构将显著影响模型的计算效率和预测性能。考虑到车辆间的G={ E}影响互不相同,本文使用有向图 V, 表示道路场景中的车辆关系,其中V、E分别为图的节点集和边集。1( G={V,E},
定义 有向图):对于图 设图中节点数量V={ 1,…, m}, E={ e0,0,e0,1,…, j,…, m}为m,则节点集 边集 ei, em, ⊂ V ×V V 2表示 中任意 个节点之间的边,其中ei, 表示从j j
节点i到节点j的边。若从节点i到节点 的边与从节点j
到节点i的边不相等,则图G为一个有向图。如果图只包含自连接,模型的性能理论上应与无交互建模的模型相似。而如果采用全连接的方式,将会导
致冗余连接,随着图中节点的数量增加,冗余连接将呈
指数增长,严重影响模型的计算效率。因此,本文所构
建的图神经网络为邻居节点指向中心节点的星形结构。
节点集合V中的节点表示道路场景中的运动车辆,
节点特征vi为车辆i的历史轨迹编码。此外,本文使用
1 {1,2,…, m}图的第 个节点表示被预测车辆,其余节点 表示邻近车辆,因此边集合表示为:
E={ 0}( j= 0,…, m) 4) ej, (
0
式中: ej, 表示图中的节点j和节点 之间存在有向边连
0
0
接,节点j是节点 的邻居。道路场景中,车辆的距离靠近就会产生交互,因此本文采取距离阈值Dclose判断2
个节点间是否存在边连接,如果节点所表示的车辆在Tobs时刻的距离小于阈值, Dclose= 50 m 1则认定节点间存在边连接,设 。图 中,圆圈内中心处的车辆认定为与圈内其他车辆存在空间交互。3.2.2 DGAT
计算方法
DGAT
基于自注意力机制加权聚合邻居节点的特DGAT征,并用于更新节点自身。 的输入为历史轨迹的H′=( h′ 0, 1,…, h′ n)编码H,模型输出为 h 。图神经网络中′
节点对(节点i与节点j)间的注意力系数为: exp( e( hi, hj)) = softmax(e( hi, hj))= αi, Σ 5) j exp( e( hi, hk)) ( k ∈ Ni
式中: αij为节点i对节点j的注意力系数; Ni为图神经网络中节点i的邻居节点集合; e为评分函数,用于计算每
g͂ = δ3( γ͂ ) 13) t -1 t -1 ( i i式中: η1为与历史轨迹编码模块中相同的单层MLP,
使RELU 32;
用 激活函数,输出维度为 γj t- 1为邻近车辆j在
( t- 1)
时刻位置的编码; Wd为线性变换函数的权重矩阵; γ͂ ( - 1)
t -1 为车辆i在 t 时刻的空间交互特征; δ3 为 3
层i MLP, RELU 256 128;使用 激活函数,隐含层维度为 和g͂
t -1为 。δ3的输出,维度为64 i
GRU
解码 的隐藏状态初始化为零,输入包括编码GRU
的隐藏状态、交互编码模块的输出、上一时间帧目标车辆的位置坐标、上一时间帧邻近车辆的交互编码。
当前时刻解码模块的计算方法为: = Φ( di, ŷ -1 , g͂ -1 ) 14) m t t t ( i i i ŷ = η2( i) 15) t m t ( i式中: Ф为解码GRU,隐藏维度为128; mi t为车辆i在时刻t的GRU隐藏状态; η2为单层MLP。1具体而言,第 个解码步骤中使用Tobs时刻的车辆坐标作为输入,当前时间步的输出用作下一时间步解码GRU
的输入。对应的解码步骤循环tf次,得到所有车辆的未来轨迹。3.4 模型训练策略
Adam
本文使用 作为优化器训练网络,学习率为0.001, 1
模型每次训练 个驾驶场景,即批大小Batchsize) 1, 5 Epoch)
( 设置为 共训练 代( 。3.5 损失函数本文提出的模型使用预测得到的轨迹输出和轨迹[7]
真值计算损失。与文献 相似,本文使用均方误差作
为损失函数:
nσ L = 1 Ŷ - 2 Y 16) ( i i i ∈ n式中: Y为车辆i的真实未来轨迹, Ŷ 为模型预测结果。i
4 试验分析4.1 环境配置本文所有试验均在同一服务器上完成,具体硬件配1 Python
置如表 所示。所有试验均基于 语言和深度学Pytorch
习框架 实现,其中图神经网络相关试验基于深Deep Graph Library,dgl)[
度图谱库( 20]开源框架实现。4.2 数据集
NGSIM
本文选择在 数据集上评估所提出的算法NGSIM
模型。 数据集广泛用于车辆轨迹预测,分为us-101[ i-80[ 2 640 m 503 m 21]和 22] 个部分,分别在长度为 和
10 Hz 45 min的高速公路中以 的频率采集的总时长为的真实车辆轨迹。将数据集分为训练集、验证集和测试