Automobile Technology

基于动态图注意力的车­辆轨迹预测研究*

- 陈晓伟 李煊鹏 张为公

210096) (东南大学,南京

GAT)

【摘要】针对目前轨迹预测研究­中交互建模方法使用的­图注意力网络( 为静态注意力,无法有效捕捉复杂道路­场- ED-DGAT)

景中车辆间交互的问题,提出了一种基于编码器­解码器架构的动态图注­意力网络( 预测高速公路环境中运­动车辆的未来轨迹。编码模块使用动态图注­意力机制学习场景中车­辆间的空间交互,采用状态简化动态图注­意力网络建模

NGSIM LSTM)

解码阶段车辆运动的相­互依赖,最后使用 数据集评估所提出的模­型,并与长短时记忆( 、联合社交池化与长短S-LSTM) CS-LSTM)

时记忆( 、联合卷积社交池化与长­短时记忆( 算法模型进行对比分析,结果表明,预测轨迹的均方根误差­RMSE) 25%, CS-LSTM 2.61

( 降低了 且模型的推理速度为 模型的 倍。

主题词:轨迹预测 注意力机制 图神经网络 多目标交互

U461.91 A 10.19620/j.cnki.1000-3703.20230582中图­分类号: 文献标志码: DOI:

Research on Vehicle Trajectory Prediction Based on Dynamic Graph Attention

Chen Xiaowei, Li Xuanpeng, Zhang Weigong

Southeast University, Nanjing 210096)

Abstract In current research on vehicle trajectory prediction, the existing Graph Attention Network (GAT), which is【 】based on a static attention mechanism, fails to effectivel­y capture interactio­ns between vehicles in complex road conditions. To address this issue, this paper proposed an Encoder- Decoder Dynamic Graph Attention Network (ED- DGAT) to predict future trajectori­es of highway vehicles. In this model, the encoding module incorporat­es a dynamic graph attention mechanism to learn spatial interactio­ns among vehicles. Simultaneo­usly, a simplified dynamic graph attention network is adopted to model the interdepen­dencies of vehicle movements during the decoding phase. This paper evaluated the proposed algorithm using the NGSIM dataset and conducted comparativ­e analysis with other models such as LSTM, SocialLSTM (S- LSTM), and CS- LSTM. The results show that the Root Mean Squared Error (RMSE) of predicted trajectory has been reduced by 25%, and the inference speed is 2.61 times of the CS-LSTM model.

Key words: Trajectory prediction, Attention mechanism, Graph neural networks, Multiobjec­tive interactio­n

, , . [J]. , 2024(3): 24-30.【引用格式】陈晓伟 李煊鹏 张为公 基于动态图注意力的车­辆轨迹预测研究 汽车技术

CHEN X W, LI X P , ZHANG W G. Research on Vehicle Trajectory Prediction Based on Dynamic Graph Attention[j]. Automobile Technology, 2024(3): 24-30.

1 前言

为实现安全高效行驶,自动驾驶汽车需自主且­合理

地估计周围目标的运动­轨迹。然而,车辆的行为决策不仅与­驾驶员的驾驶风格、道路环境相关,还受到周围车

辆间交互行为的影响,故预测复杂道路场景中­车辆的运

动轨迹极具挑战性。

传统方法基于运动物理­学[1]或结合概率论[2- 4]估计车

辆的运动轨迹。随着人工智能技术的发­展,许多研究人员Recu­rrent Neural Network,开始采用基于循环神经­网络(

RNN) -

及其变体的编码器 解码器架构进行时序数­据的RNN

预测研究[5- 6]。然而, 无法捕捉运动车辆间的­空间相关性。

[7]~ [9]

文献 文献 引入了一种名为“社交池化”的机

制,该方法将道路中相邻车­辆的运动特征聚合到统­一的

空间网格,并利用池化和卷积等方­法融合车辆的运动特[10]~ [13] Graph Neural征。文献 文献 基于图神经网络( Network,gnn)建模车辆间的交互关系,其中图的节点表示运动­车辆,图的边表示车辆间的空­间交互,并利用Graph Convolutio­nal Network,gcn)图卷积网络( 聚合相[14]~ [16]邻车辆的特征。文献 文献 基于注意力机制加权聚­合邻近车辆的相互影响,重点关注对目标车辆具­有

更高影响力的邻近车辆。与“社交池化”方法和基于图的方法相­比,基于注意力机制的方法­可以更好地解释运

动车辆间的空间交互。此外,上述所有方法只考虑历­史轨迹编码阶段车辆

间的交互,而在预测阶段建模邻近­车辆的影响至关重要。[17] [18] GNN文献 、文献 利用基于注意力机制的 变Graph Attention Network,gat)体——图注意力网络( 建Brody GAT模道路目标间的­交互。 等[19]从概念上证明了计算的­是静态注意力,并提出了基于动态注意­力机制的GATV2( GAT本文称为动态图­注意力网络)。与 相比,动Dynamic Graph Attention Network,态图注意力网络(

DGAT)

具备更强的图表示能力。受此启发,本文提出-

一种基于编码器解码器­架构的动态图注意力网­络Encoder- Decoder Dynamic Graph Attention Network, (

ED-DGAT) RNN -预测车辆轨迹,模型基于 的变体 循环Gate Recurrent UNIT,GRU)

门控单元( 编码单一车辆运动DG­AT的时间相关性,设计基于 的交互建模模块,利用DGAT GRU

聚合 的隐藏状态并以此编码­相邻车辆的历GRU

史运动状态,在 解码阶段的每一时间帧­使用状态DGAT

简化 捕获车辆间的空间交互。

和人与人之间的社交网­络相似,研究人员常使用图神经

网络建模人与人之间的­社交网络,受此启发,本文选择

DGAT使用图神经网­络的最新方法 建模车辆间的交

DGAT

互。 为不同的邻近车辆分配­不同的权重,在此基础上加权聚合邻­近车辆的特征,从而更加合理地考虑周

围车辆对目标车辆的影­响。3.2.1 图的构建DGAT的计­算过程基于图结构,因此图的结构将显著影­响模型的计算效率和预­测性能。考虑到车辆间的G={ E}影响互不相同,本文使用有向图 V, 表示道路场景中的车辆­关系,其中V、E分别为图的节点集和­边集。1( G={V,E},

定义 有向图):对于图 设图中节点数量V={ 1,…, m}, E={ e0,0,e0,1,…, j,…, m}为m,则节点集 边集 ei, em, ⊂ V ×V V 2表示 中任意 个节点之间的边,其中ei, 表示从j j

节点i到节点j的边。若从节点i到节点 的边与从节点j

到节点i的边不相等,则图G为一个有向图。如果图只包含自连接,模型的性能理论上应与­无交互建模的模型相似。而如果采用全连接的方­式,将会导

致冗余连接,随着图中节点的数量增­加,冗余连接将呈

指数增长,严重影响模型的计算效­率。因此,本文所构

建的图神经网络为邻居­节点指向中心节点的星­形结构。

节点集合V中的节点表­示道路场景中的运动车­辆,

节点特征vi为车辆i­的历史轨迹编码。此外,本文使用

1 {1,2,…, m}图的第 个节点表示被预测车辆,其余节点 表示邻近车辆,因此边集合表示为:

E={ 0}( j= 0,…, m) 4) ej, (

0

式中: ej, 表示图中的节点j和节­点 之间存在有向边连

0

0

接,节点j是节点 的邻居。道路场景中,车辆的距离靠近就会产­生交互,因此本文采取距离阈值­Dclose判断2

个节点间是否存在边连­接,如果节点所表示的车辆­在Tobs时刻的距离­小于阈值, Dclose= 50 m 1则认定节点间存在边­连接,设 。图 中,圆圈内中心处的车辆认­定为与圈内其他车辆存­在空间交互。3.2.2 DGAT

计算方法

DGAT

基于自注意力机制加权­聚合邻居节点的特DG­AT征,并用于更新节点自身。 的输入为历史轨迹的H′=( h′ 0, 1,…, h′ n)编码H,模型输出为 h 。图神经网络中′

节点对(节点i与节点j)间的注意力系数为: exp( e( hi, hj)) = softmax(e( hi, hj))= αi, Σ 5) j exp( e( hi, hk)) ( k ∈ Ni

式中: αij为节点i对节点­j的注意力系数; Ni为图神经网络中节­点i的邻居节点集合; e为评分函数,用于计算每

g͂ = δ3( γ͂ ) 13) t -1 t -1 ( i i式中: η1为与历史轨迹编码­模块中相同的单层ML­P,

使RELU 32;

用 激活函数,输出维度为 γj t- 1为邻近车辆j在

( t- 1)

时刻位置的编码; Wd为线性变换函数的­权重矩阵; γ͂ ( - 1)

t -1 为车辆i在 t 时刻的空间交互特征; δ3 为 3

层i MLP, RELU 256 128;使用 激活函数,隐含层维度为 和g͂

t -1为 。δ3的输出,维度为64 i

GRU

解码 的隐藏状态初始化为零,输入包括编码GRU

的隐藏状态、交互编码模块的输出、上一时间帧目标车辆的­位置坐标、上一时间帧邻近车辆的­交互编码。

当前时刻解码模块的计­算方法为: = Φ( di, ŷ -1 , g͂ -1 ) 14) m t t t ( i i i ŷ = η2( i) 15) t m t ( i式中: Ф为解码GRU,隐藏维度为128; mi t为车辆i在时刻t的­GRU隐藏状态; η2为单层MLP。1具体而言,第 个解码步骤中使用To­bs时刻的车辆坐标作­为输入,当前时间步的输出用作­下一时间步解码GRU

的输入。对应的解码步骤循环t­f次,得到所有车辆的未来轨­迹。3.4 模型训练策略

Adam

本文使用 作为优化器训练网络,学习率为0.001, 1

模型每次训练 个驾驶场景,即批大小Batchs­ize) 1, 5 Epoch)

( 设置为 共训练 代( 。3.5 损失函数本文提出的模­型使用预测得到的轨迹­输出和轨迹[7]

真值计算损失。与文献 相似,本文使用均方误差作

为损失函数:

nσ L = 1  Ŷ -  2 Y 16) ( i i i ∈ n式中: Y为车辆i的真实未来­轨迹, Ŷ 为模型预测结果。i

4 试验分析4.1 环境配置本文所有试验­均在同一服务器上完成,具体硬件配1 Python

置如表 所示。所有试验均基于 语言和深度学Pyto­rch

习框架 实现,其中图神经网络相关试­验基于深Deep Graph Library,dgl)[

度图谱库( 20]开源框架实现。4.2 数据集

NGSIM

本文选择在 数据集上评估所提出的­算法NGSIM

模型。 数据集广泛用于车辆轨­迹预测,分为us-101[ i-80[ 2 640 m 503 m 21]和 22] 个部分,分别在长度为 和

10 Hz 45 min的高速公路中以 的频率采集的总时长为­的真实车辆轨迹。将数据集分为训练集、验证集和测试

 ?? ??
 ?? ??
 ?? ??
 ?? ??

Newspapers in Chinese (Simplified)

Newspapers from China