驾驶风格K-means聚类与识别方法研究*

李经纬 赵治国 沈沛鸿 郭秋伊, 201804) (同济大学新能源汽车工程中心上海

Automobile Technology - - 汽车技术 -

【摘要】驾驶风格用来表征驾驶员在实车运行环境中对车辆操作的行为特征,对于混合动力汽车能量经济性有较大影响,为提高驾驶风格识别方法在不同车型上的通用性与适应性,提出了基于 K-means聚类的驾驶风格识别方法。针对采集的不同驾驶员所驾驶的商用车和乘用车的行驶数据,利用该识别方法分别进行了驾驶风格的识别,结果表明,将驾驶风格聚为3类具有较好的分类效果,并且该方法对商用车和乘用车均具有较好的识别效果。主题词:驾驶员 驾驶风格 K-means聚类 识别 HEV U461;TP391.6 A 10.19620/j.cnki.1000-3703.20180272中图分类号: 文献标识码: DOI:

Research on Methods of K-means Clustering and Recognition for Driving Style

Li Jingwei, Zhao Zhiguo, Shen Peihong, Guo Qiuyi Clean Energy Automotive Engineering Center, Tongji University, Shanghai 201804) ( Abstract The driving style reflects the behavior characteristic of the driver operating the vehicle in real driving【 】environment, which has huge impact on the energy economy of hybrid electric vehicles. To improve the versatility and applicability of driving style recognition method on different vehicle models, a driving style recognition method based on Kmeans clustering was proposed. With driving data of commercial vehicles and passenger cars operated by different drivers, this method was used to recognize driving style. The results show that the driving styles classified into three categories have good classification effect, and this method has good recognition effect on both commercial vehicles and passenger cars. Key words: Driver, Driving style, K-means clustering, recognition, HEV

1 前言

Driving Style)

驾驶风格( 用来表征驾驶员在实车运行环境中对车辆操作的行为特征,通过对驾驶员操作习惯和汽车行驶数据的分析,动态识别出驾驶员的驾驶风格,并对控制参数进行自适应调节,对于改善车辆的燃油经济性有重要意义[1]。国内外学者对于驾驶风格的识别进行了相关研究,

Constantinescu

如, 等[2]应用主成分分析和分层聚类分析

Aljaafreh方法对驾驶风格进行分类和识别; 等[3]设计了模糊推理系统,将在一定长度时间窗中的车辆纵向加速度和横向加速度的欧式范数以及平均车速作为输入,实

Nadezda K现了驾驶风格识别; 等[4]利用 最近邻算法、神经网络、决策树、随机森林等方法对驾驶员风格进行了

Meiring

识别,并对各种识别方法准确度进行了比较; 等[5]

对在驾驶风格识别中用到的人工智能算法进行了总结,指出模糊逻辑推理系统、隐马尔可夫模型和支持向量机在驾驶风格识别方面有更好的应用前景。

上述研究大多只针对单一车型,并没有对驾驶风格识别方法在不同车型上的通用性与适应性进行研究。

K-means

为此,本文设计了基于 的驾驶风格识别方法,并采集了商用车与乘用车行驶数据,验证了所提出的方法对于不同车型识别的有效性。

2 不同车型驾驶风格识别的数据采集

K- means

为研究基于 聚类的驾驶风格识别方法对于不同车型的有效性,采集了不同驾驶员所驾驶的商用车和乘用车的行驶数据。

993

商用车选择了上海市浦东 路混合动力公交车,

58

该车从东昌路渡口站出发,经过 站到达德翔路新德

38 km,

西路终点站,全程 包含城市公路及内、外环城市快速路等多种复杂路况。乘用车选择了重庆市某混合

HEV)

动力( 车型,在市区、郊区、高速、拥堵、通畅等不同

3

路况下,分别由不同驾驶风格的 位专业驾驶员操控汽

1

车完成试验。采集的部分原始数据如图 所示。

1

由图 可看出,原始车速、加速踏板开度和制动踏板开度波动频率较大,数据包含高频噪声,同时个别点加速度值超过了汽车的合理加速度范围,这些点是异常点。为此,通过离群点检测[6]进行数据清洗,使用滑动均值滤波法[7]滤除原始数据中的噪声,数据预处理前、后的

2 2

车速和加速踏板数据如图 所示。由图 可看出,预处理后的曲线没有异常点,可用于进一步的分析。

3 驾驶风格特征参数构建与主成分分析在进行驾驶风格识别前,需要构建驾驶风格特征参

数,用以对各识别片段的驾驶风格进行描述。构建的驾

驶风格特征参数通常是一些与行驶信息有关的统计量,

数目较多且彼此间存在相关性,需要使用主成分分析方法对其进行降维处理。 T 3.1 特征参数构建采集得到的数据均为连续数据,为获得更好的聚类效果,需要对原始数据进行特征参数构建。构建的特征T

c) HEV d)993 (某 加速踏板开度 ( 路车加速踏板开度2图 车速与加速踏板开度滤波前、后对比参数不能太少或太多,为此,综合相关文献[1,2,8]选取了10 1

个具有代表性的特征参数,见表 。 在计算特征参数时,需要确定驾驶风格识别周期的8 s,长度[9]。根据经验[8,9],设定驾驶风格识别周期为 并对原始数据进行识别片段的划分,其中每个识别片段长度等于驾驶风格识别周期长度。

3.2 主成分分析

主成分分析是统计学中常用的降维方法,它通过构造原变量的线性组合,将原来众多具有相关性的变量化为少数几个相互独立的综合变量,同时尽可能多地保留原数据的信息[10]。在主成分求解之前,为消除量纲的差异,必须对其进行标准化处理,将每个特征参数对应的

0 1

数据都变成均值为 、方差为 的高斯分布。

定义识别片段矩阵为:

李经纬,等:驾驶风格Yi=(yi, n), i =1,2,…, p 4) 1, yi, 2, yi, 3…, yi, (则

-

x u y = i, j i ,( i ≤ P, j ≤ n) 5) i, j ( σ i ui=E(Xi) 6)

( σi= 7)

D(Xi) (式中,为标准矩阵(特征参数矩阵)的行下标;为标准i j

10;矩阵的列下标; p为行数,代表特征参数的数目,为 n

;为列数,代表按驾驶风格识别周期划分的片段数E为期

;

望运算符D为方差运算符。对特征参数进行主成分分析,首先建立标准矩阵Y

的系数矩阵: =[ l1, l2,…, i,…, ] 8)

L l l ( p

l =[ i1, i2,…, ] ,( = 1,2,…, 9)

T

l l l i p) ( i ip

=[ Y, 2Y,…, lY ]使主成分得分矩阵 Pc lT lT的列向量

1两两协方差为零,这样就将p个线性相关的特征参数转化为p个线性无关的主成分。因为每个主成分都是经过标准化处理的特征参数的线性组合,所以主成分也是

1 993 HEV

无量纲或量纲为 的。 路公交车和某 乘用车

2

经主成分分析得到的结果如表 所列。 4 基于K-means聚类的驾驶风格识别方法4.1 K-means方法介绍K- means

聚类算法采用距离作为相似性的评价指

( 1) ), m ( ( 1)开始交替进行分标,从初始聚类中心m 1) ),…, m

1 2 k

配步和更新步直至聚类完成。在分配步中,将每一个观测量分配到对应的类簇,使得所有的观测点到其对应聚类中心的欧氏距离之和最短;在更新步中,用分配步得到的结果计算新的聚类中心,当聚类中心收敛时聚类结束[11]。

K-means 3

聚类方法对驾驶风格识别流程如图 所示。4.2 驾驶风格分类在进行驾驶风格识别前需要对驾驶风格进行分类。因驾驶风格是驾驶员在实车运行环境中对车辆操

K作的行为特征[1],其分类数目与车型无关,因此利用

means HEV

聚类方法对重庆市某 乘用车试验数据进行 聚类分析,并确定合理的分类数目。为确定驾驶风格类

2 3 4

型,将样本数据分别聚成 类、类和 类,不同聚类数

4

目的驾驶风格识别结果如图 所示。 c)4 (类4图 不同聚类数目的驾驶风格识别结果 4

由图 可看出,随着聚类数目的增加,不断有新的类簇从旧的类簇中产生,同时原有类簇之间的界限也发生了变化。对各类簇所对应样本的变化进行了统计,结

2 2

当聚类数目为 时,两类簇样本数目差别巨大,第

65.47%,

类簇内的样本数目达到总样本数目的 比例超过

50%

了 。这是因为所选的聚类数目偏少,分类不充分导

3

致的欠分类问题;聚类数目为 时,各类簇样本数目的差

4

距开始变小;聚类数目为 时,各类簇样本数目的差距继

2

续变小,但第 类簇内样本数目占总样本数目的比例已

15%,

不足 这是由于聚类数目过多带来的过分类问题。为了研究驾驶风格分类中的欠分类与过分类问题,对随着聚类数目的变化各类簇间样本数目的转移进行

4 5

了统计,如表 和表 所示。 4 2 3 1

由表 可知,当聚类数目从 变为 时,第 类簇的

1

样本数目略微下降,有少量属于第 类簇的样本被分到

3 1 2

了第 类簇,同时第 类簇与第 类簇间的界限几乎没

2 60%

有变化,第 类簇内超过 的样本被分到了新出现的

3 3 96%

第 类簇中,占第 类簇总样本数的 。因此聚类数

2

目为 时无法充分分类,存在欠分类。 5 3 4 1

由表 可知,当聚类数目从 变到 时,原第 类簇、

2 3

第 类簇和第 类簇包含的样本数均有大幅下降。其中

1 4 2

第 类簇损失的样本全部流向了第 类簇;第 类簇的

4 3

损失样本主要流向第 类簇;第 类簇损失的样本也主

4 4 3

要流向了第 类簇。因此第 类簇的产生与第 类簇的产生有本质的不同,是明显的过分类,其样本来源于前

2 3

面所有的类簇,且较大地改变了第 类簇与第 类簇间的界限。

3

综上所述,驾驶风格分为类具有较好的分类效果,且各类簇具有合理的样本数与清晰的界限。

4.3 驾驶风格识别

K- means 3

利用 聚类算法将驾驶风格分为 类,则

993 5

路公交车的驾驶风格识别结果如图 所示,重庆市

HEV 6

某 的驾驶风格识别结果如图 所示。 3

由图可看出,两种车型的行驶数据被清晰地分为K- means

类,这表明对于不同车型的行驶数据, 聚类方法都可以实现驾驶风格的有效识别。

4.4 识别结果分析

3

前述分析中将驾驶风格分为了 类,但没有将驾驶风格识别结果与人们对驾驶风格的定性认知结合起来。根据相关文献[1,2,4,5,8],按照驾驶员驾驶车辆激进程度的从弱到强将驾驶风格定性分为冷静型、普通型和激

3 3

进型 种。经计算,两种车型对应 种驾驶风格的驾驶

6

特征参数均值如表 所列。

6 3

由表 可知,对于商用车,在 种驾驶风格中,从冷静型到激进型,加速度均值、加速度标准差、冲击度均值、冲击度标准差都是从小到大,这与越激进的驾驶风

K

格越倾向于急加速和急减速的定义一致。因此用

Means

聚类对商用车驾驶风格进行识别是合理的。对

3

于乘用车,加速度与冲击度的相关参数是 种驾驶风格

5 结束语

993

为研究驾驶风格识别方法,采集了上海市浦东

HEV

路公交车和重庆市某 实际运行数据,参考已有研究

10 8s

构建了 个特征参数并确定驾驶风格识别周期为 。

K- means

综合使用主成分分析和 聚类方法对驾驶风格

3

进行了识别,结果表明,将驾驶风格分为 类具有较好

K-means

的聚类效果,且基于 的驾驶风格识别方法对乘用车和商用车均具有较好的识别效果,也进一步表明了该方法的通用性和有效性。

参考文献

[1] Eva Ericsson. Independent Driving Pattern Factors and Their Influence on Fuel- Use and Exhaust Emission Factors [J]. Transportation Research Part D, 2001, 6(5):325-345. [2] Constantinescu Z, Marinoiu C, Vladoiu M. Driving Style Analysis Using Data Mining Techniques[J]. International Journal of Computers Communications & Control, 2010, V (5):654-663. [3]Aljaafreh A, Alshabatat N, Al- Din M S N. Driving Style Rec⁃ ognition Using Fuzzy Logic[C]// IEEE International Confer⁃ ence on Vehicular Electronics and Safety. IEEE, 2012:460463. [4] Karginova N, Byttner S, Svensson M. Data- Driven Methods 的重要特征,它们数值越大表征驾驶风格越趋向激进

993

型,这与 路公交车数据得到的结论一致,因此基于

K-means

的驾驶风格识别方法对乘用车同样有效。 for Classification of Driving Styles in Buses[J]. Stäng, 2012. [5] Meiring G A, Myburgh HC. A Review of Intelligent Driving Style Analysis Systems and Related Artificial Intelligence Algorithms.[J]. Sensors (Basel, Switzerland), 2015, 15(12): 30653-30682. [6] . [D].胡婷婷 数据挖掘中的离群点检测算法研究 厦门:厦, 2014.门大学[7] , .刘艺柱 杨瑞兰 采用滑动平均滤波法提高硬币识别准确[J]. , 2010, 32(1):42-44.率的研究 制造业自动化[8] , , , .秦大同 詹森 曾育平等 基于驾驶风格识别的混合动力[J]. , 2016, 52(08):162汽车能量管理策略 机械工程学报169. [9] Tricot N, Sonnerat D, Popieul J C. Driving Styles and Traffic Density Diagnosis in Simulated Driving Conditions[C]// Intel⁃ ligent Vehicle Symposium. IEEE, 2002:298-303 vol.2. [10] , . [M].曹莉 文海玉 应用数理统计 哈尔滨:哈尔滨工业大, 2012.学出版社[11] , , , . K彭育辉 杨辉宝 李孟良等 基于 均值聚类分析的城[J]. , 2017市道路汽车行驶工况构建方法研究 汽车技术(11):13-18. (责任编辑 文楫) 2018 3 19修改稿收到日期为 年 月 日。

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.