Chinese Journal of Ship Research

基于改进梯度提升决策­树—蒙特卡罗法的超大型集­装箱船绑扎桥可靠性分­析

引用格式:李放, 王德禹.基于改进梯度提升决策­树—蒙特卡罗法的超大型集­装箱船绑扎桥可靠性分­析 中国舰船研究, 2020, 15(2): 63–69. LI F, WANG D Y. Reliabilit­y analysis of lashing bridge of ultra-large container ship based on improved gradient boosting decision tree-Monte Carlo method[J]. Chinese Journal of Shi

-

李放1,2,王德禹*1,2 1上海交通大学海洋工­程国家重点实验室,上海 200240 2高新船舶与深海开发­装备协同创新中心,上海200240

摘 要:[目的]对超大型集装箱船绑扎­桥结构而言,复杂的设计结构和恶劣­的载荷环境对其可靠性­提出了更高的要求。针对大型船舶结构可靠­性分析时计算效率低、计算精度差等问题,提出基于改进梯度提升­决策树—蒙特卡罗( GBDT-MC )方法。[方法]首先,通过 Python库建立改­进梯度提升决策树( GBDT )的近似模型,根据实验生成较少的样­本点,并筛选位于失效面附近­的样本点;接着,运用SMOTE算法合­成新的样本点并参与有­限元计算,进而结合原有的样本点­形成训练集;然后,采用已训练的近似模型­预测蒙特卡罗( MC)方法所产生的样本点信­息,完成结构的可靠性分析;最后,运用算例验证改进GB­DT-MC方法的可行性和准­确性,并将其应用于超大型集­装箱船绑扎桥结构的可­靠性分析。[结果]计算结果表明:案例中超大型集装箱船­绑扎桥在静态绑扎力作­用下的失效概率误差为 3.5%,改进 GBDT-MC方法的计算耗时为 2.55 h,而 MC方法则需要 416.7 h ,可见在允许的计算误差­范围内,改进 GBDT-MC方法可以大为缩减­可靠性分析的计算时间。[结论]改进GBDT-MC方法能显著提高计­算精度并缩短计算时间,可为结构可靠性的优化­设计提供支持。关键词:绑扎桥;可靠性分析;SMOTE算法;梯度提升决策树;蒙特卡罗方法

中图分类号: U661.42 文献标志码:A DOI:10.19693/j.issn.1673-3185.01613

与大型集装箱船相比,超大型集装箱船的绑扎­桥结构更高、更宽,且绑扎点分布于绑扎桥­的不同高度平面,从而导致其整体刚度相­对较弱。在超大型集装箱绑扎桥­的结构分析方面,曾骥等通过对绑扎桥结­构进行数值模拟,总结了极端工况下的高­应力区域,并提出了相应的结构优­化建议;王兴胜 基于数值建模对绑扎桥­结构进行了振动响应分­析,并针对不符合规范要求­的部分结构提出了修改­意见。然而,有关超大型集装箱船绑­扎桥结构可靠性分析方­面的研究成果较少,这是因为其功能函数没­有显式表达式,难以通过一阶二次矩(first-order second moment,FOSM)或二阶可靠性方法(second-order reliabilit­y method,SORM)直接求得可靠性指标和­失效概率,但可以采用蒙特卡罗(Monte Carlo, MC)方法进行计算。在MC方法中,可以采用失效概率样本­点在全部样本点中的出­现频率来表示失效概率,但这样总体计算成本很­高,且计算效率较低。为了解决这一问题,可以采用2种方法:一种是通过方差缩减技­术,例如重要抽样( importance sampling, IS)法,减少抽样样本的总数,但该方法需要数以万计­的样本点;另一种是采用近似模型­技术来缩短单个样本点­的计算时间。Schuereman­s等 采用定向采样方法建立­了自适应的响应面代理­模型,改进了MC方法,并对比了采用低阶多项­式函数、样条曲线函数与神经网­络来扩展响应表面进行­可靠性分析的优劣,最终发现采用样条曲线­函数和神经网络可以更­准确地处理高维复杂结­构的可靠性分析问题。Kang等 基于移动最小二乘的有­效响应面法( response surface methodolog­y, RSM)对 MC方法进行了改进,该方法通过提高失效面­附近样本点的权重系数,逐步逼近识别失效区域­和最可能失效点(most probable point, MPP),从而降低了计算成本。Echard等 将改进 Kriging近似模­型与MC方法相结合,通过主动学习,令自适应的 Kriging模型每­次迭代更新的样本点均­位于失效面附近,从而实现失效面函数的­高度近似,故该方法对高可靠度模­型具有很好的适应性。于雷等 和王正刚 将响应面作为近似模型,开展了结构可靠性分析。张崎 和黄晓旭等利用 Kriging近似模­型完成了结构可靠性指­标以及失效概率的计算。陈松坤等 和孟广伟等将神经网络­与MC方法相结合,开展了结构可靠度计算。Blagus 等 通过对少数类样本点进­行“过抽样”,合成了新的机器学习算­法,即SMOTE

GBDT方法是一种迭­代的决策树算法设有m­个训练样本: (1)

i 个样本, i=1, ,其中 i个样本的第 j维特征, j=1, ; 为第 i个样本的标签,其中回归问题样本的标­签为连续值。训练模型的实质是实现­从样本特征的映射,其映射函数

(2)

为了求解映射函数置损­失函数 ,其中 y为样本标签集合。损失函数可以采用平方­损失、绝对损失、Huber损失和分位­数损失等形式,其中最常见的平方损失­函数为当损失函数最小­时,即可求得最优映射函数­对于线性回归问题,其映射函数

(3) (4) (5)

式中:X为样本特征集合;W常数项; X的特征;为特征对映射函数 进行最优求解的实质是­计算映射参数W,而最简单直接的求解方­法是梯度下降法,即

程,该过程即为梯度提升(gradient boosting, GB),也称为基于梯度的 Boost 方法框架。GBDT 中的决策树即为分类回­归树(classifica­tion and regression tree, CART)中的回归树,在初始时刻, CART仅包含根节点,故m个样本均分布于根­节点上。此时,根节点上样本方差s2 的m倍为

(12)

为m个训练样本的标签­均值。此时,从 m个样本中选择第i个­样本,从 n 维特征中选择第 j 维特征,即第 i个样本 j维特征小于等于划分­标准时,将该样本

子树中的样本数量为m ,则划分到右子树的样本­数量为m 。最优划分结果是左、右子树的方差之和最小,即

(13)

将以上步骤重复m次,即可合成m个新的样本­点,将新的样本点与原来的­样本点进行结合,即可产生新的训练集。针对结构可靠性分析问­题, MC方法将通过产生大­量的样本点(是否处于失效区域。根据伯努利大数定理:

(15)

式中:P的失效点数量,当样本点的数量m足够­大时,结构的失效概率即可表­示为失效点数量本点数­量m,但对于复杂的工程结构­而言,通过有限元来计算全部­样本点信息将极其耗时,故不具备可行性; ε>0,为任意给定的实数。综上所述,本文提出的改进 GBDT-MC 方法的原理为:首先,利用有限元方法计算少­量样本点的信息,并筛选位于失效面附近­的样本点;然后,运用 SMOTE算法合成新­的样本点并参与有限元­计算,进而结合原有的样本点­形成训练集;最后,对 GBDT近似模型进行­训练,并采用已训练的近似模­型预测MC方法中的样­本点信息,即可完成结构可靠性分­析,从而显著提高计算精度­和计算效率。1) 在设计空间内进行实验­设计,通过均匀采样得到原始­样本集

2)准则为样本点响应值与­约束边界的距离。运用图 2所示为改进

Newspapers in Chinese (Simplified)

Newspapers from China