Automobile Technology

SOTIF)自动驾驶预期功能安全( 接受准则的建立

李波 尚世亮 郭梦鸽 付越 童洪剑 (

-

李波1 尚世亮2 郭梦鸽2 付越1 童洪剑3 1. 300300;2. 201201;3. ( 中国汽车技术研究中心­有限公司,天津 泛亚汽车技术中心有限­公司,上海 博世华域201821)转向系统有限公司,上海

【摘要】为了评估自动驾驶汽车­是否达到合理可接受的­安全水平,全球汽车行业亟需建立­统一的安全接受准则。从自动驾驶汽车的安全­风险来源和运行场景出­发,通过安全分析和试验研­究,提出了量化思想的自动­驾驶预期功能安全( SOTIF)接受准则,包括危害行为事件接受­准则和总体风险接受准­则2个层面。针对自动驾驶需要依靠­大量的复杂道路场景测­试而导致效率低、开发周期长、针对性不强的问题,提出了SOTIF场景­用例库优先度子集的测­试评价方法。相关预期功能安全接受­准则、安全度量指标及 SOTIF场景优先度­子集的测试评价方法已­作为系列量化思想的中­国提案,成功写入全球首个自动­驾驶安全国际标准IS­O 21448中。主题词:自动驾驶 预期功能安全 接受准则 安全度量 场景优先度子集 测试评价U463.61 A 10.19620/j.cnki.1000-3703.20201017中图­分类号: 文献标识码: DOI: Establishm­ent of SOTIF Acceptance Criteria for Autonomous Driving Li Bo1, Shang Shiliang2, Guo Mengge2, Fu Yue1, Tong Hongjian3 1. China Automotive Technology and Research Center Co., Ltd., Tianjin 300300; 2. Pan Asia Technical Automotive Center ( Co., Ltd., Shanghai 201201; 3. Bosch HUAYU Steering Systems Co., Ltd., Shanghai 201821) Abstract In order to evaluate whether the autonomous driving vehicle achieves a reasonably and acceptable safety【 】level, it is urgently needed to establish unified safety acceptance criteria for the global automotive industry. Starting from the sources of safety risks and operationa­l scenarios of autonomous driving vehicles, this paper puts forward SOTIF acceptance criteria with quantitati­ve thinking, which includes 2 dimensions: hazardous behavior event acceptance criteria and overall risk acceptance criteria. A new test and evaluation method based on the priority subsets of SOTIF use case is proposed, which addresses the low efficiency, long developmen­t cycle and weak pertinence of public road testing for autonomous driving. The series of Chinese proposals, with quantitati­ve thinking including relevant SOTIF acceptance criteria, safety metrics and priority subsets of SOTIF use case verificati­on and validation, have been successful­ly written into ISO 21448, which is the world's first internatio­nal standards for autonomous driving safety. Key words: Autonomous driving, SOTIF (Safety Of The Intended Functional­ity), Acceptance criterion, Safety metric, Scenario priority subset, Verificati­on and validation

1 前言

多起因自动驾驶汽车引­发的致命交通事故表明,依靠传统的以质量保障(关注失效的预防和消除)为中心的车辆安全体系­已经不能满足自动驾驶­车辆的安全保障需求,汽车工业领域亟需建立­全新的自动驾驶安全评­判准则体系。为此,国际标准化组织下设的­功能安全工

ISO/TC22/SC32/WG8) 2018

作组( 于 年正式启动全球首

ISO/PAS 21448

个自动驾驶安全国际标­准 《道路车辆预

Road Vehicles- Safety of The Intended

期功能安全》(

Functional­ity)

的制定工作,旨在为全球自动驾驶车­辆的

ISO 26262

安全开发和测试评价提­供技术指导。不同于

GB/T 34590)

《道路车辆功能安全》(对应 关注并解决的

ISO/PAS 21448

是电控系统故障导致的­危害, 《道路车辆预期功能安全》立足对自动驾驶安全影­响更广泛的非故障安全­领域,重点关注自动驾驶系统­的行为安全,解决因自身设计不足或­性能局限在遇到一定触­发条件(如环境干扰或人员误用)时导致的危害[1- 2]。因此,功能安全

Functional Safety) Safety of the

( 和预 期 功 能 安 全(

Intended Functional­ity,SOTIF)

技术为确保自动驾驶车­辆在故障、非故障情况下的安全运­行提供了根本保障。

自动驾驶系统中涉及环­境干扰和人员误用等外­部触发条件的安全开发­最为复杂,且受目标市场的影响较­大,如何建立一套科学、合理并且广泛适用的安­全评价

ISO 21448

体系是国际标准 亟需解决的一项重要问­题。其中,安全接受准则作为自动­驾驶安全的最终认可标­准,重要性尤为突出。

本文从我国国情出发,通过自动驾驶预期功能­安全分析和试验研究,提出了基于量化思想的­自动驾驶安全接受准则,建立了自动驾驶量化安­全接受准则体系以及

SOTIF

基于 场景用例库优先度子集­的测试评价方法。中国提出的自动驾驶预­期功能安全接受准则的­定义方

ISO 21448

法和测试评价方法已成­功写入 并作为主线贯穿全文,为后续基于更广泛的中­国目标市场研究和测试,不断完善接受准则中的­相关量化指标,更好地指导以我国为目­标市场主体的自动驾驶­汽车功能安全和预期功­能安全开发、测试和评价工作奠定基­础。

2 自动驾驶预期功能安全( SOTIF)接受准则2.1 自动驾驶安全风险的新­特点

与传统车辆重点关注系­统失效预防与减轻不同,自动驾驶车辆因替代了­人类驾驶员的部分或全­部驾驶操作行为,更需要关注运行过程中­自身功能和性能的行为

SOTIF),

安全(即 由于使用场景的复杂性­和随机性,自动驾驶系统安全相关­的很多问题在设计阶段­无法预

1

见。对自动驾驶运行场景进­行分类,如图 所示,从安全性和已知性角度,将车辆运行场景分为已­知安全场景、已知不安全场景、未知不安全场景和未知­安全场景

4 2 3

个区域[3]。在开发之初,区域 和区域 的比例可能较

SOTIF

高, 技术通过对已知场景及­用例的评估,发现系

2 1, 2

统设计不足,将区域 转化为区域 并证明残留区域

3,SOTIF

的风险足够低;针对区域 技术基于真实使用场景­测试、用例测试、随机输入测试等,发现系统设计不

3 2,

足,将区域 转化为区域 同时基于统计数据和测­试结

3

果,间接证明区域 已经控制到合理可接受­的水平。由此实现对已知和未知­风险的合理控制,完成自动驾驶车辆系统­的安全提升和发布。

V

然而,汽车工业历经百年发展­形成的“模型”产品开发体系的出发点­仍是基于需求的定义和­迭代开发,而自动驾驶系统安全风­险的一个主要来源是未­知不安全场景区域,对其无法定义需求,这也成为全球自动驾驶

1图 自动驾驶运行场景分类[1] 2.2 现有自动驾驶安全评测­方法和准则

自动驾驶安全性受环境­和场景中的未知因素影­响极大,难以准确定义和模拟。为此,当前对自动驾驶产品的­安全评测主要依赖于真­实道路的里程累积测试,并将其结果作为安全发­布的重要评判依据。但目前行业对自动驾驶­需开展的道路验证总里­程缺少统一定义方法,测试道路和场景的选取­也缺少理论支撑,随机性较大。

2020

年,通用汽车公司自动驾驶­系统“超级巡航”

Super Cruise) 880×104 km ( 在中国上市,同时公布其实现了

Waymo真实道路测­试无事故[4]。同年, 公司宣布其

2 000自动驾驶真实道­路测试里程突破 万英里(约

3 220×104 km)[

合 5]。近日,特斯拉公司公布其自动­驾驶

Autopilot) 30

系统( 累计行驶里程已超过 亿英里(约合

48.3×108 km)[

6]。自动驾驶汽车开发厂商­竞相比较里程测试长度,不断推动着资源投入和­行业门槛的提高。自动驾驶系统取代人类­驾驶员并真正走向大规­模量产应用的前提是确­保安全,这已成为全球汽车行业­和监管机构的共识,但除了不断竞相推高的­累积里程,行业更为亟需建立科学、合理的安全接受准则。

2.3 基于量化思想的双层安­全接受准则的建立

ISO 21448

在 制定过程中,针对自动驾驶预期功能­安全的最终发布,中国提出了基于量化思­想的预期功能安全双层­接受准则。自动驾驶系统运行过程­由一系列驾驶行为组成,如果相关行为不当,将可能产生危害风险,最终导致事故发生。对于每个危害行为事件,可从其属性出发,定义出定性或定量的安­全度量准则,这是判断自动驾驶系统­行为是否可能引发危害­事件的接受准则,即第一层安全接受准则。在全部累积行驶里程中,自动驾驶系统可能产生­不止一次危害行为事件,特别是里程越高,危害行为事件的数量及­影响可能越大,自动驾驶预期功能安全­开发的目的是将总风险­控制在合理可接受的水­平,为此,需定义总的确认目标,即总体安全风险的接受­准则,也就是第二层安全接受­准则。

2图给出了自动驾驶预­期功能安全双层安全接­受准则的示例,自动驾驶过程中存在多­次主动制动行为,但可能存在因设计不足­或性能局限导致的制动­危害,如感知系统误识别等原­因造成的过大制动行为­事件。以制动行为为例,导致违背第一层安全接­受准则(如可控

SOTIF

性和信心度的安全度量­指标)的过大制动危害行为事­件将被记录下来,在完成全部里程累积测­试后(如

20×104 km),

将违背第一层准则的危­害行为事件数量与第二­层安全接受准则进行比­较,如果总数不超过一定数

2

量(例如次),则认为满足总体的预期­功能安全接受标准,以此作为自动驾驶预期­功能安全的最终发布准­则。

3 第一层安全接受准则的­建立方法

第一层安全接受准则,也就是危害行为事件接­受准则,即对自动驾驶过程中危­害行为事件的评价,包含SOTIF

定量准则和定性准则。其中,可控性指标和 信心度作为安全度量指­标,是定量准则的重要组成­部分。

3.1 可控性安全度量指标

GB/T 34590

按照国家标准 《道路车辆功能安全》中给出的可控性的定义,即为确定一个给定危害­的可控性等级,需要预估具有代表性的­驾驶员或其他涉及人员­为避免伤害发生而能对­场景施加影响的可能性。这种可能性预估包括:如果给定的危害将要发­生,具有代表性的驾驶员能­够保持或者重新控制车­辆的可能性,或者在危害发生范围内­的个体能够通过他们的­行动避免危害的可能性。这种考量基于的假设为:危害场景中的个体为保­持或者重新控制当前情­况采取必要的控制行为,以及所涉及的驾驶员采­取有代表性的驾驶行为。可控性预估可能受到很­多因素的影响,包括该目标市场的驾驶­员概况,如个体年龄、手眼配合、驾驶经验、文化背景等。因此,可控性表征驾驶员、乘客或其他涉险人员对­车辆电控系统危害风险­控制的难易程度,是衡量车辆行为是否构­成危害的关键指标。

2015

年,中华人民共和国工业和­信息化部下达了

ASIL

“整车及关键电控系统功­能安全 等级及测试评价规范”研究任务,同年,中国首个道路车辆功能­安全研究项目——车辆侧向运动可控性研­究启动。

该研究任务针对可控性­的衡量对象,即车辆侧向、纵向、垂向运动相关危害,开展安全分析,结合测试结果及行业经­验,对整车危害进行分类。通过分析车辆侧向、纵向、垂向运动功能特点,定义危害发生的典型场­景,并组织大量代表中国目­标市场的普通驾驶员开­展实车危害行为的评估­测试,定义出表征中国典型驾­驶员对车辆侧向、纵向、垂向运动行为控制能力­的客观度量指标。通过调整测试条件及被­测人员响应的及时性,兼顾传统汽车、新能源汽车和自动驾驶­汽车相关控制系统,

3

从整车侧向、纵向、垂向 个维度建立相关危害的­可控

3

性度量指标,如图 所示,为判断车辆行为是否构­成危害提供了合理的量­化准则,相关成果为自动驾驶系­统的正向设计开发与测­试评价,以及强制性国家标准和­推荐

GB

性国家标准的落地实施­提供了有效支撑,例如

17675 GB 21670

《汽车转向系基本要求》、 《乘用车制动

GB/T

系统技术要求及试验方­法》、 《乘用车转向系统功能安­全要求及试验方法》(制定中)等。

3.2 SOTIF信心度安全­度量指标

可控性衡量的是车辆行­为的安全边界,如车辆制动

0.5g

减速度达到 时,可能发生追尾事故。但自动驾驶汽

0.3g

车如果发生了一次 减速度的制动,就可能造成乘员的紧张­甚至恐慌。如果乘员对自动驾驶汽­车预期行为感到安全担­忧,将导致功能开启率低和­误干预等一系列问题,对自动驾驶的发展非常­不利。为此,在现有安全和舒适评价­维度基础上,需建立针对自动驾驶预­期功能

SOTIF 4

行为的“信心度”评价指标体系,如图 所示,在已有可控性安全边界­基础上,引入乘员对车辆行为的­安全感受评价,以更加全面地评判自动­驾驶安全性[7]。

4 SOTIF图 自动驾驶安全、舒适和“信心度”指标体系

SOTIF

信心度受人、车、环境等多因素影响,通过分析其影响因素,挑选典型场景,开展实车主、客观对标测试,针对不同车辆行为的安­全主观评价结果开展数­据学5

习,找出可代表乘员信心度­的客观指标,如图 所示。

4 第二层安全接受准则的­建立方法

第二层安全接受准则,也就是总体安全风险接­受准则,针对自动驾驶汽车在真­实道路累积全部行驶里­程过程中的总体安全风­险评价。同人类驾驶员一样,面对各种场景,自动驾驶系统也无法做­到杜绝危害行为事件的­发生。如果对比没有自动驾驶­功能的人类驾驶安全表­现,引入自动驾驶功能后,安全风险没有提高,则认为自动驾驶汽车的­安全表现是可以接受的。基于这种理念,建立第二层接受准则。

4.1 自动驾驶危害行为事件­的泊松分布规律

泊松分布适合描述单位­时间(或空间)内随机事件

ISO 21448,

发生的次数。根据 真实场景中自动驾驶功­能导致的危害行为事件­数量也可以用泊松分布­规律来描述。泊松分布的概率函数为:

P( X = k)= λk - λ,

! e 0, 1, 2,… 1)

k k= (式中, λ为单位里程(或单位时间)内危害行为事件的平均­发生次数; k为危害行为事件发生­次数。通过转化,可得危害行为事件发生­的平均里程或时间间隔(即无事故里程或时长)为:

ln(1- α)/ 2) τ=- λ (式中, α为置信度水平。

100×104 km

例如,当无危害行为事件里程­数达到

99%

时,具有 置信度水平认为该系统­在同等驾驶场景中

4.6×10- /km

危害事故率能达到 6次。

4.2 自动驾驶总体安全风险­接受准则

对自动驾驶系统总体安­全水平的评估,应考虑其是否带来了不­合理的安全风险,即与同等驾驶场景下人­类驾驶员的安全驾驶能­力指标(如平均无事故里程)相比,引入自动驾驶系统后,相关指标不应变差。因此,可以认为如果自动驾驶­系统没有带来明显的不­合理风险,则其总体安全风险是可­以接受的。

总体安全风险接受准则­的定义和确认需要基于­目标市场情况,假设驾驶员安全水平较­高的乘用车驾驶员

2×104 km, 10 1

平均每年行驶 每 年发生 次交通事故。以

95% τ≈ 60×104 km

此作为目标,选择 置信度,则 。即为了

95%

证明在 置信度下认为自动驾驶­车辆事故率能达到

60×104 km

上述驾驶员的驾驶安全­水平,需要累积测试无危害事­故。通过基于目标市场的统­计研究,可以得到危害行为事件­的平均行驶里程,再考虑合理的设计余量,作为自动驾驶总体安全­风险的接受准则。

4.3 自动驾驶里程累积测试­终止原则

在自动驾驶里程累积测­试过程中,通常会伴随危害行为事­件的出现,特别是随着新功能、新设计的实施,发生危害行为事件的平­均里程会出现先下降后­逐步上升

6

的情况,如图 所示,从统计规律定性描述了­引入新功能后,由于该新功能应对各种­场景的能力较低,因此安全行驶里程相对­较短,但通过预期功能安全的­迭代开发、功能改进,危害事件发生率下降,从而无危害事件发生的­安全平均行驶里程增加,也就是通过预期功能安­全的迭代开发,车辆发生危害事件的次­数降低,安全行驶里程增加,安全能力得到提升。

6图 自动驾驶危害行为事件­出现的平均里程如果在­达到累积测试里程目标­前出现了危害行为事件,修复后为了继续确认自­动驾驶系统是否可以满­足初始设定的安全目标(相同危害行为事件发生­率和置信度水平),后续测试里程会比无危­害行为事件发生时更长[8]。假设在里程达到τ1时­发生危害行为事件,当迭代改进后,验证达到同等置信度水­平的危害行为事件发生­3)

率目标λ所需要的里程­s可由式( 确定: λ0 ∫

1, τ1 dλ 1- ( 3) p( λ| + s) = α 0式中, λ0为危害事件发生率­的目标值; p为概率函数。

λ= 0.001 /km,

例如,定义危害行为事件发生­率为 次α= 99%, j

置信度水平 则发生 次危害行为事件后,需要补

1

充测试的无危害行为事­件里程如表 所示。表1 自动驾驶危害行为事件­发生后的补充测试里程

5 基于场景优先度子集的­自动驾驶预期功能安全­测试评价方法

自动驾驶的安全评价需­要基于目标市场场景,对于无事故里程,如果场景差异较大,其展现的安全水平也不­相同。目前,自动驾驶实际道路测试­耗时久、成本高、针对性不强,为了提升自动驾驶测试­的时效性,更好地

7

为量产开发服务,对已知场景进行分析和­管理:如图所示,建立关键场景因素子集,将场景构成因素按照敏­感性、严重度、暴露频次进行评级,并据此生成优先度顺序,在同等投入下,提升自动驾驶里程测试­的时效性;同时,针对场景优先度子集建­立仿真测试,也可大幅提升自动驾驶­测试的效率,实现用更少的里程达到­更好的验证效果;基于优先度子集衍生出­的未知用例,也可更快发现相关未知­风险场景。该方法已作为中国提案,写入

ISO 21448

国际标准 草案中。

图7 SOTIF场景优先度­子集的建立和应用6 结束语

科学、合理的自动驾驶预期功­能安全接受准则和测试­评价方法对于从源头提­升自动驾驶汽车安全水­平,避免竞相推高无止境的­累积测试里程、降低开发成本、提高开发效率具有重要­的指导意义。本文从我国国情出发,通过自动驾驶预期功能­安全分析和试验研究,提出

SOTIF)

了基于量化思想的自动­驾驶预期功能安全( 接受准则,建立了自动驾驶量化安­全接受准则体系以及基

SOTIF

于 场景用例库优先度子集­的测试评价方法。后续,将基于更广泛的中国目­标市场研究和测试,不断完善安全接受准则­中的相关量化指标,更好地指导以我国为目­标市场主体的自动驾驶­汽车功能安全和预期功­能安全开发、测试和评价工作。[1] ISO. Road Vehicles Safety of the Intended Functional­ity: ISO/PAS 21448: 2019[S]. Switzerlan­d: ISO, 2018. [2] , . [J].尚世亮 李波 车辆电控系统预期功能­安全技术研究, 2016(10): 58-62.中国标准化[3] , , , . SOTIF尚世亮 崔海峰 郭梦鸽 等 自动化测试在 开发中[J]. , 2018(11): 23-26.的应用 汽车技术[4] . Super Cruise, [EB/程功 所有的 源于一个勇敢的凯迪拉­克OL]. (2020- 08- 06)[2020- 11- 21]. https://www.sohu.com/a/ 411652832_455835. [5] Solidot. Waymo 2000自主驾驶汽车­公路测试里程超 万英18 [EB/OL]. (2020- 01- 11)[2020- 11- 21].里,用 个月翻倍http://www.elecfans.com/d/1155663.html. [6] . 30十轮网 里程标完成,特斯拉自动驾驶累计里­程已超过[EB/OL]. (2020- 04- 24) [2020- 11- 21]. https://亿英里baijiah­ao.baidu.com/s?id=1664864717­722426287&wfr= spider&for=pc. [7] , , , . SOTIF尚世亮 童菲 郭梦鸽 等 基于驾驶员信心度的 评价[J]. , 2020, 36(2): 119-123.模型建立与试验 机械设计与研究[8] LITTLEWOOD B, WRIGHT D. Some Conservati­ve Stopping Rules for the Operationa­l Testing of Safety- Critical Software [J]. IEEE Transactio­ns on Software Engineerin­g, 1997, 23 (11): 673-683.

(责任编辑 斛畔) 2020 11 12修改稿收到日期为 年 月 日。

 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China