Chinese Journal of Ship Research
基于改进梯度提升决策树—蒙特卡罗法的超大型集装箱船绑扎桥可靠性分析
引用格式:李放, 王德禹.基于改进梯度提升决策树—蒙特卡罗法的超大型集装箱船绑扎桥可靠性分析 中国舰船研究, 2020, 15(2): 63–69. LI F, WANG D Y. Reliability analysis of lashing bridge of ultra-large container ship based on improved gradient boosting decision tree-Monte Carlo method[J]. Chinese Journal of Shi
李放1,2,王德禹*1,2 1上海交通大学海洋工程国家重点实验室,上海 200240 2高新船舶与深海开发装备协同创新中心,上海200240
摘 要:[目的]对超大型集装箱船绑扎桥结构而言,复杂的设计结构和恶劣的载荷环境对其可靠性提出了更高的要求。针对大型船舶结构可靠性分析时计算效率低、计算精度差等问题,提出基于改进梯度提升决策树—蒙特卡罗( GBDT-MC )方法。[方法]首先,通过 Python库建立改进梯度提升决策树( GBDT )的近似模型,根据实验生成较少的样本点,并筛选位于失效面附近的样本点;接着,运用SMOTE算法合成新的样本点并参与有限元计算,进而结合原有的样本点形成训练集;然后,采用已训练的近似模型预测蒙特卡罗( MC)方法所产生的样本点信息,完成结构的可靠性分析;最后,运用算例验证改进GBDT-MC方法的可行性和准确性,并将其应用于超大型集装箱船绑扎桥结构的可靠性分析。[结果]计算结果表明:案例中超大型集装箱船绑扎桥在静态绑扎力作用下的失效概率误差为 3.5%,改进 GBDT-MC方法的计算耗时为 2.55 h,而 MC方法则需要 416.7 h ,可见在允许的计算误差范围内,改进 GBDT-MC方法可以大为缩减可靠性分析的计算时间。[结论]改进GBDT-MC方法能显著提高计算精度并缩短计算时间,可为结构可靠性的优化设计提供支持。关键词:绑扎桥;可靠性分析;SMOTE算法;梯度提升决策树;蒙特卡罗方法
中图分类号: U661.42 文献标志码:A DOI:10.19693/j.issn.1673-3185.01613
与大型集装箱船相比,超大型集装箱船的绑扎桥结构更高、更宽,且绑扎点分布于绑扎桥的不同高度平面,从而导致其整体刚度相对较弱。在超大型集装箱绑扎桥的结构分析方面,曾骥等通过对绑扎桥结构进行数值模拟,总结了极端工况下的高应力区域,并提出了相应的结构优化建议;王兴胜 基于数值建模对绑扎桥结构进行了振动响应分析,并针对不符合规范要求的部分结构提出了修改意见。然而,有关超大型集装箱船绑扎桥结构可靠性分析方面的研究成果较少,这是因为其功能函数没有显式表达式,难以通过一阶二次矩(first-order second moment,FOSM)或二阶可靠性方法(second-order reliability method,SORM)直接求得可靠性指标和失效概率,但可以采用蒙特卡罗(Monte Carlo, MC)方法进行计算。在MC方法中,可以采用失效概率样本点在全部样本点中的出现频率来表示失效概率,但这样总体计算成本很高,且计算效率较低。为了解决这一问题,可以采用2种方法:一种是通过方差缩减技术,例如重要抽样( importance sampling, IS)法,减少抽样样本的总数,但该方法需要数以万计的样本点;另一种是采用近似模型技术来缩短单个样本点的计算时间。Schueremans等 采用定向采样方法建立了自适应的响应面代理模型,改进了MC方法,并对比了采用低阶多项式函数、样条曲线函数与神经网络来扩展响应表面进行可靠性分析的优劣,最终发现采用样条曲线函数和神经网络可以更准确地处理高维复杂结构的可靠性分析问题。Kang等 基于移动最小二乘的有效响应面法( response surface methodology, RSM)对 MC方法进行了改进,该方法通过提高失效面附近样本点的权重系数,逐步逼近识别失效区域和最可能失效点(most probable point, MPP),从而降低了计算成本。Echard等 将改进 Kriging近似模型与MC方法相结合,通过主动学习,令自适应的 Kriging模型每次迭代更新的样本点均位于失效面附近,从而实现失效面函数的高度近似,故该方法对高可靠度模型具有很好的适应性。于雷等 和王正刚 将响应面作为近似模型,开展了结构可靠性分析。张崎 和黄晓旭等利用 Kriging近似模型完成了结构可靠性指标以及失效概率的计算。陈松坤等 和孟广伟等将神经网络与MC方法相结合,开展了结构可靠度计算。Blagus 等 通过对少数类样本点进行“过抽样”,合成了新的机器学习算法,即SMOTE
GBDT方法是一种迭代的决策树算法设有m个训练样本: (1)
i 个样本, i=1, ,其中 i个样本的第 j维特征, j=1, ; 为第 i个样本的标签,其中回归问题样本的标签为连续值。训练模型的实质是实现从样本特征的映射,其映射函数
(2)
为了求解映射函数置损失函数 ,其中 y为样本标签集合。损失函数可以采用平方损失、绝对损失、Huber损失和分位数损失等形式,其中最常见的平方损失函数为当损失函数最小时,即可求得最优映射函数对于线性回归问题,其映射函数
(3) (4) (5)
式中:X为样本特征集合;W常数项; X的特征;为特征对映射函数 进行最优求解的实质是计算映射参数W,而最简单直接的求解方法是梯度下降法,即
程,该过程即为梯度提升(gradient boosting, GB),也称为基于梯度的 Boost 方法框架。GBDT 中的决策树即为分类回归树(classification and regression tree, CART)中的回归树,在初始时刻, CART仅包含根节点,故m个样本均分布于根节点上。此时,根节点上样本方差s2 的m倍为
(12)
为m个训练样本的标签均值。此时,从 m个样本中选择第i个样本,从 n 维特征中选择第 j 维特征,即第 i个样本 j维特征小于等于划分标准时,将该样本
子树中的样本数量为m ,则划分到右子树的样本数量为m 。最优划分结果是左、右子树的方差之和最小,即
(13)
将以上步骤重复m次,即可合成m个新的样本点,将新的样本点与原来的样本点进行结合,即可产生新的训练集。针对结构可靠性分析问题, MC方法将通过产生大量的样本点(是否处于失效区域。根据伯努利大数定理:
(15)
式中:P的失效点数量,当样本点的数量m足够大时,结构的失效概率即可表示为失效点数量本点数量m,但对于复杂的工程结构而言,通过有限元来计算全部样本点信息将极其耗时,故不具备可行性; ε>0,为任意给定的实数。综上所述,本文提出的改进 GBDT-MC 方法的原理为:首先,利用有限元方法计算少量样本点的信息,并筛选位于失效面附近的样本点;然后,运用 SMOTE算法合成新的样本点并参与有限元计算,进而结合原有的样本点形成训练集;最后,对 GBDT近似模型进行训练,并采用已训练的近似模型预测MC方法中的样本点信息,即可完成结构可靠性分析,从而显著提高计算精度和计算效率。1) 在设计空间内进行实验设计,通过均匀采样得到原始样本集
2)准则为样本点响应值与约束边界的距离。运用图 2所示为改进