基于双层评定模型的钳闭影响下乘员损伤严重程度分析与预测
李旋 韩天园 吕凯光 乔洁 刘永涛(长安大学,西安 710064)
【摘要】为确定轿车碰撞事故中钳闭影响下乘员损伤严重程度的影响因素,从陕西长安大学机动车物证司法鉴定中心数据库中筛选包括24种车型的714组轿车碰撞事故数据,通过 Apriori关联规则挖掘出相关的特征因素,建立双层评定模型( Logit Model)对车辆层次与乘员层次的特征因素进行分析。结果表明,致伤部件质量变量对组织结构、身体部位、损伤类型变量的影响分别达到28.89%、15.79%、14.03%,事故中头部相较于其他部位损伤更严重,损伤较为严重的情况往往伴随着乘员重度骨折与大面积损伤。最后,通过随机森林模型对乘员损伤严重程度进行预测,预测结果准确率可达到 82.97%。主题词:钳闭影响 损伤严重程度 Apriori关联规则 双层评定模型 随机森林 分析与预测U467.14 A 10.19620/j.cnki.1000-3703.20201261中图分类号: 文献标识码: DOI:【引用格式】 , , , . [J]. , 2021(8): 50
李旋 韩天园 吕凯光 等 基于双层评定模型的钳闭影响下乘员损伤严重程度分析与预测 汽车技术56.
LI X, HAN T Y, LÜ K G, et al. Analysis and Prediction of Passenger Injury Severity under the Influence of Clamping Based on Double-Layer Evaluation Model[J]. Automobile Technology, 2021(8): 50-56.
1 前言
不同的车辆事故中,乘员损伤严重程度不同,事故发生后乘员损伤需要考虑钳闭影响,即由于车身在碰撞中变形造成的致伤部件对乘员的伤害,因此研究车辆钳
闭影响下乘员损伤严重程度影响因素具有重要意义。针对乘员损伤严重程度分析,目前的研究方向主要包2
括 个方面,即在事故数据基础上建立相应的数据分析模型进行宏观分析和基于有限元的力学分析。陆颖等通过建立逻辑回归模型对驾驶员伤情进行预测,修改车辆事故
自动呼救系统阈值,提高系统对事故信息判断的准确性[1],
同时根据事故数据和朴素贝叶斯分类器建立驾驶员伤情预测算法,进行伤情预测[2];邹铁方等统计分析发现,绝大多数碰撞条件下,包括不同碰撞车速下,骑车人头、胸部和撞击侧下肢损伤指标参数均值均高于后座乘员[3];杨娜等通过构建逻辑回归模型研究了自动制动系统参数对事故
Maximum Abbreviated
中行人发生最大简明损伤定级(
Injury Scale,MAIS)3+
损伤风险和死亡风险的影响[4];武和全等人通过建立人体生物力学响应,提出通过旋转座椅改变人体朝向与碰撞方向的相对位置,从而提高老年乘员在自动驾驶车辆中的碰撞安全性[5],同时通过搭建老年人骨盆有限元模型,发现其碰撞峰值力和受力最大时的位移都最大,而碰撞中最大位移却最小[6];胡林等人通过建立行人下肢有限元模型发现,年龄因素对行人下肢损伤有重要影响[7]。可以发现,大多数研究建立的分析模型相对简单,没有考虑多个层次的影响因素对乘员损伤的影响。本文从陕西长安大学机动车物证司法鉴定中心数
24 714
据库中筛选包括 种车型的 组轿车碰撞事故数据,
Apriori
通过 关联分析挖掘影响乘员损伤严重程度的重要因素,采用双层评定模型探究变量与乘员损伤严重程度之间的相关性,利用随机森林预测模型对乘员损伤严重程度进行预测,以期为轿车碰撞事故钳闭影响下乘员损伤严重程度的降低提供一定的数据分析支撑。
2 数据预处理2.1 数据来源
根据美国机动车医学促进会提出的《简化伤害标
Abbreviated Injury Scale,AIS)[
准》( 8],按照人体各部位、
7
不同伤害类型的不同程度,其损伤可以划分为 个等级
AIS 0~6), AIS 0 AIS 6
(即 其中, 代表无损伤, 代表死亡,
2
等级越高,损伤越严重。乘员损伤严重程度等级分为
MAIS3+ MAIS3+
类,即乘员损伤等级达到 和未达到 。
24 2 074
本文的数据包括 种车型共 组事故数据,每组数据记录了乘员损伤的相关信息。为分析考虑钳闭影响的乘员损伤严重程度,保留存在钳闭影响的数据项,并组成事故信息处理数据集,同时,根据乘员损伤简易诊
Python
断书补充缺失信息,根据上述条件利用 筛选出
714 2
了 组数据。事故信息主要包括 个层次:
a.
乘员层次。包括乘员的损伤严重程度、身体部位、组织结构、损伤类型、损伤部位前、后位置和损伤部位左、右位置,乘员层次的特征变量数据来自不同事故中乘员的损伤情况,且每一组数据相互独立。
b.
车辆层次。包括致伤部件质量、高度位置和横
向位置,特征变量数据对应上述乘员层次的数据。
2.2 数据离散化
研究用于关联分析的数据包括乘员层次和车辆层次
9 1
共 个特征变量[9],如表 所示。为高效挖掘关联规则,需要对连续变量进行分级,其中致伤部件质量变量为连续
[10] 1变量,各特征变量通过文献 进行划分,如表 所示。
表1 数据分类和代号3.1 Apriori原理
Apriori
关联规则中支持度S和置信度Q为:
A→ B)= P( A∪ B) 1) S( ( A→ B)= P( A∪ B)∕ A) 2) Q( P( (
P( A∪ B) A B P( A)
式中, 为事件 与事件 同时出现的概率;
A
为事件 出现的概率。
3.2 结果与分析
0.75
关联规则中将置信度大于 的规则称为有用规则[11],为了保证结果的可靠性,在选择最小置信度值时
(0.75,0.80)
发现,取值在 范围内得到的规则相较于取
0.80
得到的规则只是多了一些重复的规则(包含相同变
0.80
量、等级和维数),因此本文设置最小置信度为 。同时,为了保证损伤严重程度存在等级变化,最小支持度不宜过大,但当设置过小时,又会导致规则数量过多,影
MAIS3+
响统计。由于乘员损伤严重程度达到 是本文分析的重点,为了保证关联规则的数量以及挖掘规则的可
MAIS3+
靠性,需要对有关 的关联规则进行大量分析,以
1 A0
确定最小支持度的取值,图 所示为与 相关的二维关联规则数量与最小支持度之间的关系。当最小支持
0.004 A0
度小于 时,与 相关的二维关联规则数量维持在
5 0.004
条。因此设置最小支持度为 。本文主要分析乘员损伤严重程度,故主要寻找后项
A0 A1 8
为 、 的关联规则,挖掘的结果最多包括 个维度,
5
分析发现,关联规则达 个维度时,规则数量大幅增加,
{B0,C1}→A0
并出现了大量无效规则,如二维关联规则
0.811 2, {B0,C1,F1}→A0
置信度为 三维关联规则 置信度
0.811 2,
也为 则将此三维关联规则视为无效规则,将其
2 A0 A1
剔除。表 所示为后项为 、 的关联规则。
2
其中,二维规则统计结果如图 所示,乘员不同损
B
伤严重程度对应的规则中,前项均出现了身体部位 、
D E G
损伤类型 、前后位置 、致伤部件质量 和致伤部件高
H, BDEG
度位置 但是只有 、、、 随着损伤严重程度变化
4
而变化,因此判断这 个因素与损伤严重程度相关。
3
三维规则统计结果如图 所示,分析发现乘员不同
B~I
损伤严重程度对应的规则中,前项均出现了 特征因
BCDG
素,但只有 、、、 随着损伤严重程度变化而变化,与
E
二维分析比较发现,前后位置 在三维规则中没有发生
C
变化,同时组织结构 在三维规则中表现出与损伤严重
CE
程度的相关性,因此暂时无法确认 、的相关性。
4 BDG
四维规则统计结果如图 所示,、、 与二维和三维规则分析的结果相同,即均随着损伤严重程度变化而
C E, E
变化,对于组织结构 和前后位置 在四维规则中 的
C
变化并没有影响损伤严重程度,而 却发生了变化。
BDG 3
由上述分析可知,、、 在 个层次的规则中均表
C
现出与损伤严重程度相关,而 在二维规则中表现出与
A A E
不相关,但在三维、四维规则中表现出与 相关,虽
A
然在二维规则中表现出与 相关,但在三维、四维规则A
中表现出与 不相关。
表 关联规则分布
因此,可以判断影响乘员损伤严重程度的特征主要4 BCDG 5
有 个,即 、、、。图 所示为卡方检验与P值分析结果,进一步验证了关联分析的结果。
4 双层Logit分析4.1 双层Logit模型
2
以乘员损伤严重程度为因变量,由于因变量存在个水平的值,故考虑使用二元逻辑回归进行分析,选取致伤部件质量、身体部位、组织结构、损伤类型作为自变量。本文中数据存在明显的嵌套结构,即乘员层次(层
1) 2) Logit
次 嵌套于车辆层次(层次 。不同于单层 模型,
Logit
双层 模型将影响系数(斜率)和常数项(截距)分为
2( 1
随机效应和固定效应,层次 车辆层次)影响着层次
6 Logit
(乘员层次)的斜率。图 所示为双层 模型效应,其中, H1、H2、H3分别表示在考虑车辆层次的影响下,致伤部件质量对身体部位、组织结构、损伤类型与损伤严重程度间关系斜率的影响, H4表示在不考虑车辆层次的影响下,身体部位、组织结构、损伤类型对损伤严重程度的影响, H5表示致伤部件质量对损伤严重程度的影响。HH 1~ HLM6.08
针对上述 的层次关系,本文通过 进
5
3
行建模分析,主要建立 个模型。为了判断损伤严重程
24
度在 种车型之间是否存在差异,构建一个空模型(模1),
型 即模型中不包含任何自变量,通过计算组内相关
Intraclass Correlation Coefficient,ICC)
系数( K,确定双层
Logit
模型的适用性以及乘员层次和车辆层次变量的影
1响力大小,模型 和K的定义分别为:
ì P(Y =0 ) = 1 ï ij 1+ exp( β0j + ε) ij exp( β0j + ε) 3) í ) ( P(Y =1 = ij ï ij 1+ exp( β0j + ε) ij β0j = γ00 + μ0j î V( μ0j) = 4)
K ( V( ε ) + V( μ0j) ij
Yij(i= 1,2,⋯, n; j =1,2,⋯,24)
式中, 为第j种车型中第i辆车
P(Yij= 0)上乘员的损伤严重程度; n为某款车型的数量; 、
P(Yij= 1) MAIS3+
分别为损伤严重程度未达到和达到 的概率; εij、β0j分别为乘员层次的随机效应和固定效应; γ00、μ0j V(εij) V(μ0j)
分别为车辆层次的固定效应和随机效应; 、 分别为乘员层次和车辆层次的方差。建立包括乘员层次所有自变量,但不包括车辆层次
2)
任何自变量的模型(模型 。通过模型可了解乘员层次
2
自变量对因变量(损伤严重程度)的影响,模型 定义为:
ì P(Y =0 ) = 1
ij æ Σ ö
3
1+ exp + + 5)
β0j βX ε í ç ( è kj kij ij
k =1
= +
β γ μ î k0 kj kj
Xkij(k= 1,2,3)
式中, 为第j种车型中第i辆车的第k个自变量; βkj为乘员层次的斜率; γk0、μkj分别为斜率的固定成分和随机成分。建立包括乘员层次和车辆层次所有自变量的完整
3), 3
模型(模型 通过模型 分析车辆层次的自变量如何
3
影响乘员层次的斜率与截距,模型 的定义为: β0j = γ00 + γ01W + μ0j
= + j + 6)
β γ γ k1W μ ( kj k0 j kj式中, Wj为车辆层次的自变量,即致伤部件质量; γ01为车辆层次的斜率,即车辆层次的自变量对乘员层次的截距部分的影响; γk1为车辆层次的斜率,即车辆层次的自变量对乘员层次的斜率部分的影响。
4.2 结果与分析
1
模型 的结果表明,固定效应检验与随机效应均达P< 0.01), 4) K= 1.825 1/
到了显著水平( 通过式( 计算得到
(1.015 3+1.825 1)=0.642 6,
即乘员损伤严重程度的差异
64.26% 35.74%
中 来源于车辆层次差异, 来源于乘员层
K> 0.138
次差异,同时 表明组内高度相关[12],分析乘员损伤严重程度不仅要考虑乘员自身层次的影响,还需
Logit
要考虑车辆层次的影响,即建立双层 模型分析。
1
在模型 的基础上加入乘员层次的自变量进行分
7 B(
析,如图 所示:加入 身体部位)变量,方差改善了
23.09%; B( C(
加入 身体部位)与 组织结构)变量,方差
20.52%; B( C( D(
改善了 加入 身体部位)、 组织结构)、 损
25.22%
伤类型)变量,方差改善了 。研究表明,效应值
0.15~0.35
变化在 之间,则表明加入的变量与因变量中度相关[12],同时组内方差逐渐下降,证明了乘员层次变
3 2
量均与乘员损伤严重程度相关。表 所示为模型 的分析结果,其中B为回归系数, E为标准误差。对乘员层次变量进行初步分析,由头部到下肢,随着损伤位置
B=- 0.070 8),
的下移,乘员损伤严重程度逐渐减小( 说明钳闭影响下,乘员身体上侧损伤更严重,特别是头部;组织结构中不同组织类型与乘员损伤严重程度成
B= 0.371 7), 1
正相关( 通过表 的等级划分,即器官与骨骼损伤更为严重,这与事故统计报告中的数据结果相吻合[9];损伤类型与乘员损伤严重程度成正相关
B= 0.084 8),
( 即骨折类型损伤更严重,这与上述组织结构的分析相吻合,但是现实事故中乘员大面积损伤往往对应严重的交通事故。乘员损伤严重[9],这与上述器官损伤更为严重结果不符,需要进一步分析验证。2
考虑车辆层次,在模型的基础上加入车辆层次
3 4
的自变量,即对模型 进行分析,结果如表 所示,乘
3
员层次的个变量方差成分均明显减少,再次证实了车辆层次变量,即致伤部件质量对乘员损伤严重程度的重要影响,具体的,车辆层次的变量加快了损伤类型、身体部位与组织结构损伤严重程度,反映到大量事故数据上,即随着致伤部件质量的增加,乘员损伤更加严重。5
具体分析各层次变量对损伤严重程度的影响,表
Logit
所示为双层 模型的参数估计结果,其中OR为比值比、P 为事件发生的概率,致伤部件质量的系数为
5.206 0,
表明在事故中,随着致伤部件质量的增加,乘员损伤越发严重,这是因为碰撞过程是高速过程,质量大的物体动量也大。针对乘员层次的变量,其中身体部位变量中除胸腔、脊椎之外,头部相较于其他部位损伤更严重,特别是上、下肢部位,损伤严重程度仅为头部的
0.422 0.346 3
、 倍,这与上述模型 分析的结构相吻合,胸
1.624
腔部位、脊椎部位损伤严重程度分别是头部的 、
1.202
倍,这是因为这些部位属于重要部位,发生损伤概
0.023 5 0.002 3),
率极小( 、 一旦损伤,严重程度极高,同时可以发现,事故中上、下肢损伤的概率最大分别为
0.423 5 0.443 5,
、 这是因为钳闭影响下乘员一般处于蜷缩状态;组织结构变量中,器官与骨骼的损伤更为严重
1.322 1 1.448 7), 3
( 、 这与模型 的正相关分析结果相吻合,主要是钳闭影响下身体组织受到车辆部件压迫造成
0.002 3),
的,神经损伤在事故中发生概率较小( 这与上述分析结论相符;损伤类型变量中,可以发现事故中骨
0.551 6 0.321 2 0.223 8),
折现象发生概率较高( 、 、 骨折损
1.841 2),
伤相较于其他损伤类型更严重( 同时事故中大面积的损伤发生概率较小,一旦发生损伤就极为严重,这是因为钳闭影响下乘员往往受到致伤部件局部挤压,一般在汽车火灾中更容易出现大面积的损伤(烧伤) [9]。
5 损伤严重程度预测5.1 随机森林模型
随机森林具体实施过程如下:
a.
原始训练集为N,应用自助法有放回地随机抽取k个新的自助样本集,并由此构建k棵分类树,每次未被抽到的样本组成了k个袋外数据。
b.
设有数量为M的变量,则在每一棵树的每个节点处随机抽取数量为M1的变量,然后在这些变量中选择一个最具有分类能力的变量,变量分类的阈值通过检查每一个分类点确定。
c.
将生成的多棵分类树组成随机森林,用随机森林分类器对新的数据进行判别与分类,分类结果按树分
5.2 模型评价指标
针对本文对乘员损伤严重程度的预测,可用接受者
Receiver Operating Characteristic,ROC)
操作特性( 曲线
ROC
反映模型的分类准确性,并通过计算 曲线下的面
Area Under Curve,AUC)
积( 来衡量模型的分类精确
AUC
度。 越大,表示模型分类效果越好。精确率W表示模型对样本做出预测,结果正确的可能性,召回率R
Recall)
( 反映了模型预测出的正例占实际正例的比例,
2
可以通过F值综合考虑 个指标。
6
表 所示混淆矩阵中包括了对样本测试集数据的
True预测与真实情况,其中abcd、、、分别为真正例(
Positive,TP) False Negative,FN)
、假反例( 、假正例
False Positive,FP) True Negative,TN)
( 、真反例( 的数量, ∕(
RMF、 、的计算公式为:
= ∕( + 7)
Ra a b)
(
= + 8)
Wa a c)
2∕ (
= 9)
F (
5.3 结果与分析
Logit
结合关联分析和双层 模型分析结果,通过预测模型进一步验证分析结果。将筛选后的特征,即身体部位、组织结构、损伤类型、致伤部件质量作为输入变量,损伤严重程度作为输出变量,建立基于随机森林的损伤严重程度预测模型,同时将筛选前的特征作为对照组,建立相应的模型进行预测。
Python Scikit-Learn
预设模型的参数范围,利用 中的
GridSearchCV
函数库中 函数做参数遍历选择,决策树数
Out Of Bag,OOB)
量n采用袋外( 数据误差来确定,其结
8 OOB
果如图 所示。 误差随着决策树数量的增加逐渐
1 000
减小,当决策树数量在 棵左右时趋于稳定。为了
n= 1 200
使得模型取得理想的效果,本文的取 棵。通过随机森林对每组数据中乘员损伤严重程度进行预测,按照预测平均准确度下降对各特征重要度进
9
行排序,如图 所示,结果与上述分析一致,再次证明了关联分析结果的可靠性。其中致伤部件质量变量在
25.8%,
乘员损伤严重程度预测中贡献最大,达到 这表明乘员损伤严重程度与致伤部件质量高度相关。
AUC 0.71
相较于决策树、逻辑回归模型的 值 与
0.62, AUC 0.76,
随机森林模型 值达到 能取得较好的预
3 10
测效果,对比 种模型预测结果,如图 所示,随机森林
MAIS3+
模型能更好地按照 划分乘员损伤严重程度。分
类效果不仅与模型中参数的设置有关,还取决于导入模型中的特征与结果的相关程度,特征选择后随机森林准
82.97%,
确率达到 间接证明了上述分析中筛选出的特征对乘员损伤严重程度有显著影响。
6 结束语
本文通过分析轿车碰撞事故数据,得到以下结论:
a.
轿车碰撞事故中乘员层次变量和车辆层次变量相关,其中致伤部件质量影响最大。
b.
车辆层次的变量对乘员层次变量存在影响,即致伤部件质量变量对组织结构、身体部位、损伤类型变
28.89% 15.79% 14.03%
量的影响分别达到 、 、 。随着致伤部件质量的增加,乘员身体上部较下部损伤更严重,即损伤严重部位上移。
c.
事故中头部相较于其他部位损伤更严重,但上、下肢出现损伤的概率却最大,器官与骨骼损伤相较于其他组织损伤更严重,事故中乘员发生骨折的概率较大,损伤较为严重的情况往往伴随着乘员重度骨折与大面积损伤。
d.
通过随机森林模型对乘员损伤严重程度进行
82.97%
预测,准确率达到 。
在本文基础上,下一步可增加环境层次因素,并考虑通过有限元建立力学模型对乘员损伤进行量化分析。
参考文献
[1] , , .陆颖 殷越洲 叶恒毅 高级车辆事故自动呼救系统阈值
[J]. , 2020(3): 5-9.对驾驶员伤情预测的影响 汽车技术LU Y, YIN Y Z, Ye H Y. The Influence of the Threshold of the Automatic Emergency Call System for Advanced Vehicles on the Prediction of Driver Injury[J]. Automobile Technology, 2020(3): 5-9.
[2] , , .陆颖 殷越洲 谢君平 朴素贝叶斯模型在驾驶员伤情预
[J]. , 2020(1): 181-184.测中的应用 机械设计与制造
LU Y, YIN Y Z, XIE J P. Application of Naive Bayesian Model in Driver Injury Prediction[J]. Machine Design & Manufacturing, 2020(1): 181-184. [3] , , , . -邹铁方 王冠 胡林 等 汽车 摩托车碰撞事故中骑乘人[J]. , 2020, 42(5): 621-627+员损伤差异对比研究 汽车工程643.
ZOU T F, WANG G, HU L, et al. Comparative Study on the Differences of Rider Injury in Car- Motorcycle Collision Accidents[J]. Automotive Engineering, 2020, 42(5): 621627+643.
[4] , , , .杨娜 张臻 赵桂范 等 自动制动系统行人保护效果的研
[J]. , 2015, 37(12): 1400-1405+1394.究 汽车工程
YANG N, ZHANG Z, ZHAO G F, et al. Research on the Pedestrian Protection Effect of Automatic Braking System[J]. Automotive Engineering, 2015, 37(12): 1400-1405+1394.
[5] , , .武和全 旷世杰 胡林 老年乘员在自动驾驶车辆中的碰
[J]. , 2020, 56(12): 144-154.撞响应研究 机械工程学报WU H Q, KUANG S J, HU L. Research on Collision Response of Elderly Occupants in Autonomous Vehicles[J]. Chinese Journal of Mechanical Engineering, 2020, 56(12): 144-154.
[6] , , .武和全 侯海彬 胡林 车辆碰撞中乘员骨盆力学响应特性的研究[J]. 汽车工程, 2020, 42(4): 468-476.
WU H Q, HOU H B, HU L. Research on the Mechanical Response Characteristics of Occupant’s Pelvis in Vehicle Crash[J]. Automotive Engineering, 2020, 42(4): 468-476.
[7] , , , .胡林 陈凯 黄晶 等 年龄因素对行人下肢损伤的影响研
[J]. , 2020, 56(2): 106-120.究 机械工程学报
HU L, CHEN K, HUANG J, et al. Research on the Influence of Age on Pedestrian Injury of Lower Limbs[J]. Chinese Journal of Mechanical Engineering, 2020, 56(2): 106-120.
[8] AAAM. Abbreviated Injury Scale [M]. Barrington: Associa⁃ tion for Advancement of Automatic Medicine, 2005.
[9] . CIDAS [R].中国交通事故深度调查工作组 数据事故分析, 2018.天津
China Traffic Accident In- depth Investigation Working Group. CIDAS Data Accident Analysis[R]. Tianjin, 2018.
[10] , , .李旋 沈鹏举 赵俊玮 基于多致伤部件的乘员损伤严重[J]. , 2020(8): 28-33.程度分析与预测 汽车技术
LI X, SHEN P J, ZHAO J W, et al. Analysis and Prediction of Occupant Injury Severity Based on Multiple Injury Components[J]. Automobile Technology, 2020(8): 28-33. [11] KIM J C, CHUNG K. Emerging Risk Forecast System Using Associative Index Mining Analysis[J]. Cluster Computing, 1993, 20(1): 547-558.
[12] 张雷, 雷雳, 郭伯良. 多层线性模型应用[M]. 北京: 教育
科学出版社, 2003.
ZHANG L, LEI L, GUO B L. Application of Multilayer Linear Model[M]. Beijing: Educational Science Press, 2003.
(责任编辑 斛畔)
修改稿收到日期为2021年1月16日。