基于DPC-GMM算法的船舶燃油系统故障诊断

魏一,张跃文,李斌 116026大连海事大学 轮机工程学院,辽宁 大连

Chinese Journal of Ship Research - - Contents -

Fault diagnosis of ship fuel system based on DPC-GMM algorithm

WEI Yi,ZHANG Yuewen,LI Bin Marine Engineering College,Dalian Maritime University,Dalian 116026,China Abstract:[Objectives]The traditional Gaussian Mixture Model(GMM)has the inherent shortcoming of slow convergence which can easily lead to over-fitting and cause the parameter calculation to fall into a local optimum. As such,it is not suitable for the fault diagnosis of marine fuel systems.[Methods]A fault diagnosis method for a ship fuel system based on the DPC-GMM algorithm is proposed. First,the GMM and parameter estimation algorithms are analyzed. Combined with the Density Peaks Clustering (DPC) algorithm,GMM parameters corresponding to the state of the fuel system of ship are calibrated to achieve the unsupervised diagnosis of the failure of a ship's fuel system. Based on the obtained fuel system failure data,the proposed method is verified. [Results] The experimental results show that this method has higher recognition accuracy and faster recognition speed than the traditional Back Propagation(BP)neural network and Support Vector Machine (SVM) diagnosis algorithm. [Conclusions] The analysis results have important guiding significance for the fault diagnosis of marine fuel systems. Key words:fault diagnosis;Gaussian Mixture Model(GMM);Expectation Maximum(EM);Density Peaks Clustering(DPC)

0引言

船舶燃油系统作为船舶的核心动力装置,通 过燃油系统各个组件间的协作,将雾化好的燃油输送至设备的喷油入口。燃油系统故障类型繁多,故障导致的重大事故屡见不鲜,并且传统的故

障诊断方法无法满足现代化的需求[1-2]。因此,及时、准确地诊断船舶燃油系统异常,判断和识别船舶燃油系统故障十分重要。目前船舶燃油系统的故障诊断研究主要集中2于 个方面:一是基于专家的定性故障诊断方法研究,一般通过专家经验判断故障指标,推理路径清晰,便于用户参与,但是难以处理复杂的、数据量大的诊断对象,不适用于数据驱动情境下的研究[3];二是基于模型的定量故障诊断方法研究,一般借助机器学习算法,基于数据特征对故障参数进行诊断,常用的故障诊断方法包括反向传播(Back Propagation,BP )神经网络[4]、支持向量机(Support Vector Machine,SVM)5 [ ]等。上述传统算法能够满足对数据的有监督(需要人工标注训练样本类型)诊断[6],但无法实现船舶燃油系统的故障自动诊断,泛化能力较差。Gaussian Mixture Model,高 斯 混 合 模 型( GMM )算法是一种基于非参数的概率性方法,可以根据不同的历史数据自适应训练获取模型参7]。数,对于不同类型的数据集有较好的灵活性[ GMM算法能够很好地解决需人工标注训练样本导致的成本增加[8]、泛化能力差的问题,实现无监督的故障诊断过程,极大地提升故障诊断的效GMM率。同时,为了进一步增加 算法的精度,引入了密度峰值聚类(Density Peaks Clustering,DPC) GMM算法[9],以保证观察数据对数似然增大,解决算法存在的局限性。因此,针对已有研究的不足, DPC-GMM本文拟提出基于 算法的船舶燃油系统故障诊断方法。针对采集的船舶燃油系统故障模式数据少的特点,首先,采用高斯白噪声对原始数据样本进行扩充;然后,采用本文提出的基于DPC-GMM算法的无监督船舶燃油系统故障诊断方法,基于故障参数智能构建故障诊断模型,进行故障的识别。以期实现对船舶燃油系统不同工作状态的准确判断,为船舶燃油系统状态的监测和故障诊断系统的建立提供新思路和新方法。

1 算法原理 1.1 GMM定义

假设船舶燃油系统状态的训练数据样本X ={x1 x  xi} ,xi 为系统状态量,i=1,2,…,K , 2 K 为系统状态类型数目。GMM是一种描述混合密度函数分布的模型,采用若干个高斯概率密度函数的加权和来描述矢量特征在概率空间的分布状况[10]。即每个高斯混合 1模型是由K个高斯分布组成,如图 所示,形成不同系统状态的分类器,将这些表征故障类别的高GMM的概率密度函数[11]:斯分布线性相加,得到 K å 1 p (x )= i|θ αjGj (xi |μ å j) ( ) j j =1式中: Gj (xi |μj å j) 为系统状态量 xi 相对于第j类系统状态的高斯概率分布函数, μj和å 分别是j第 j 类系统状态在 X 集上的均值与协方差, j = 1 2  K ;αj 为第j类系统状态的权重,且满K { å j}足约束条件 αj = 1 ;θ= αj μj å 。j =1

1.2 GMM原理

GMM的基本思想是:首先,使用概率密度函Expectation数进行建模;然后,借助期望最大化( Maximum,EM)算法迭代获取相应参数的最优解,

根据正态分布的条件分布获得K个高斯过程函数[12];最后,对测试样本的船舶燃油系统状态类型值进行计算。GMM基于 的故障诊断是以船舶燃油系统状GMM态数据样本为基础,计算 的概率分布,获得K个系统状态,然后采用高斯过程对系统状态数DPC据进行分类,进而进行故障诊断。借助 算法,自动聚类获得系统状态数据样本的中心值,以作GMM为 的K值输入。综合式(1)和式(2)发现,构建GMM模型需要DPC的初始参数主要包括K和 θ ,K值借助 算法

={ j} EM αj μj获得,而参数 θ å 的常用估计方法是

算法。

1.3 EM算法的参数求解原理

GMM准确的 θ 才能构建出高效的 分类模型。由于难以直接求解 P ( X|θ ) ,用 lg P ( X|θ )替代入式(3),得到换 P ( X|θ ) ( )= å K 4 J θ θ ' p ( xi n|θ ) lg p(xi n|θ ') ( ) i =1 ' ' '式中:θ ={αj,μj,å '} ,为模型构造过程的另一组j参数;p ( xi n|θ )为在参数θ 条件下数据样本 xi 被划分到第 n类的概率密度。EM采用 算法逐步迭代来改善 θ 值的估计。迭代过程中,加大估计参数 θ 与观测训练样本 xi ( 1) ( ) + l之间的匹配率,使之满足 P X|θl > P X|θ ,其

中 l 为迭代次数。逐次迭代得到最优参数值,从而找到使 P ( X|θ )最大的θ* ,即

(5)

θ* = arg max P( X|θ)结合式(4)与式(5),通过运算得到( )- K ' ') J θ θ J ( θ θ )=å p ( x  n|θ ) [lg p(x  n|θ - i i i =1 K å lg p ( xi n|θ )] = p ( x  n|θ )lg p(xi n|θ ') 6 ( ) p(xi n|θ) i i =1 ( ')-其 中 ,函 数 J θ θ J ( θ θ )= lg X ,在{X[J )]}| ( )θ θ ' J ( θ θ 点的切线方程为x = 1 ( φ ( x )= X - 1,有 J θ θ ')- ,根据式(6), J ( θ θ )  φ(x)

进一步可得

( K p(xi n|θ ') å

J θ θ ')- J ( θ θ )  p(xi|θ) - 1 = p(x  n|θ) i =1 i K

å 7

{ p(x  n|θ ') - p(x  n|θ)} ( ) i i i =1即

( ')- ( (8) J θ θ J ( θ θ )  P X θ ')- P( X θ) 8 ( ') ( )通过式( )分析可得, J θ θ 与 P X θ'的单调性相同,因此对 P( X θ) 取关于 θ 的微分,得K å[Ñ

Ñ P ( X θ )=Ñ p(xi n|θ)]= θ θ θ i =1

K

å (9)

p(xi n|θ)[Ñ lg P( X θ)] θ i =1结合式(8)与式(9),可得( ')|θ 10 Ñ P ( X θ )=Ñ J θ θ ( ) θ θ = θ'其中,当θ = θ 时, J (θ θ ') 与 P( X θ)在 θ 点同时' 达到极值。综合式(8),说明二者不仅有相同的单调性,极值点也一样。根据式(7),求偏导为0时对应的 θ′ 值,求解E-step过 程 分 为 计 算 期 望( )与 计 算 极 大 值(M-step)。1)E-step:数据样本 xi 属于船舶燃油系统状态类型 i 的概率,即

αj p(xi |n θ) p ( n|xi θ )= ( 11 ) p(xi |θ)式中, p ( n|xi θ ) 为在数据样本 xi 和参数 θ 条件下,船舶燃油系统状态样本属于状态n的概率。2)M-step GMM :使用期望最大化算法求取参数的迭代式,即K

K M åå

式中, T = p ( n|xi θ ) ,M = 1 2 3 ,为 船n = 1i =1舶燃油系统状态样本的个数。

GMM E-step假设 的参数 θ 已知,利用 对GMM权值进行估计。M-step是基于估计的权值, GMM 2以优化并确定 的参数。重复上述 个步骤直到波动很小,在近似达到极值后结束迭代。

1.4 基于DPC算法初始化的GMM算法

DPC 9],其算法是一种基于密度的聚类算法[基于中心决策图来确定密簇心和类簇个数K,其中K值通过前K个高密度点来判断,然后将非簇心样本点划分到最邻近的峰值密度样本所在类。DPC簇,完成样本数据的聚类 具有无需指定聚类参数,能够发现非球类簇并识别噪声点,有益于处理大批量数据的特点[13]。GMM EM方法结合 算法虽然可以保证每次迭代都能使观察数据对数似然增大,但其收敛速度较慢[10]。选定较好的数据初始化结果能够避免这GMM个缺点,并解决参数初始化对 方法最终结果造成的影响。EM先对输入初始数据进行粗分类,再将 算GMM法迭代得到的数据作为 方法的初始化数DPC GMM EM据。将 算法与 算法结合可提高 算

法的收敛速度[14],从而提高方法的精度,并能从整体上降低模型的时间复杂度。

2 框架模型

3本文提出模型的系统框架如图 所示,图中 μ 3为均值,σ 为方差。其工作原理分为 个步骤: 1)提取船舶燃油系统状态的特征向量,并采用高斯白噪声对数据样本进行扩充; 2 DPC )采用 算法初始化船舶燃油系统状态GMM数据类型的数目,对不同类型数据进行 模型EM构建,利用最大似然估计 算法获取聚类模型参数; 3 GMM )利用 训练得到测试模型,根据输入的新样本诊断船舶燃油系统最可能的状态。 2算法优化过程如图 的伪代码所示。图中, Th是最小误差值。

3 模型构建与仿真实验结果 3.1 船舶燃油系统故障特征的选取

船舶燃油系统故障诊断主要通过高压油管的压力波来体现,当燃油系统中的组件发生故障时,与之相关的特征指标会发生改变。所以,本文选取高压油管的压力波特征进行故障分析。为了获得更好的诊断效果,基于文献[15],选 8取 个压力波特征参数,包括燃油喷射最大压力、喷油器启阀压力、次最大压力、波形幅度、上升沿宽度、波形宽4)。度、最大余波宽度以及波形面积(图

40对采用 组原始数据的压力波特征的描述5性分析如图 所示。

3.2 模型构建

GMM为了增大训练样本的数量,使得建立的40,45,更具代表性,将上述特征值分别加上了50,55,60,65,70,75,80 dB 40的高斯白噪声,将400 400组原始数据扩充到了 组。然后再将这 组数DPC据作为训练样本,采用 算法寻找数据的最佳EM聚类中心,以作为 算法初始化的中心值来构

GMM建 模型。DPC通过 算法对数据进行聚类,结果表明船8 6)。舶燃油系统有 种状态(图 DPC算法聚类结果与本文中船舶燃油系统的8 6 1~8种状态一致,如图 所示,状态 分别为:正常喷油、75%油量、25%油量、怠速油量、喷油器针阀1、喷 2、喷油器针阀泄漏、高压卡死 油器针阀卡死油泵出油阀失效[14]。DPC EM将 算法获取的聚类中心值作为 算法GMM的初始值来构建 模型。

3.3 实验结果分析

GMM 400×8模型中, μi 为 维数据,规模为400×400×8。8在测试阶段,将 组船舶燃油系统故障特征GMM值代入构建的 模 型 中 ,比 较 基 于( x|μi å )对应的每行样本中的数值,数值大的αiGi i维度代表对应维度的船舶燃油系统状态。得到如下结果: ( x|μi å )= αiGi i 5.43E - 101 64 162.39 6.72E - 05 7.03E - 09 1.13E - 28 1.01E - 18 1.29E - 70 0 1.38E - 116 6.72E - 05 64 162.39 4.17E - 21 2.28E - 65 4.98E - 05 4.49E - 72 0 1.16E - 72 1.13E - 82 2.28E - 65 2.22E - 100 64 162.39 7.99E - 56 7.18E - 98 5.81E - 233 1.16E - 205 0 0 0 5.81E - 233 0 0 64 162.39 64 162.39 5.43E - 101 1.38E - 116 1.22E - 105 1.16E - 72 2.31E - 132 4.53E - 74 1.16E - 205 4.53E - 74 1.29E - 70 4.49E - 72 2.18E - 60 7.18E - 98 8.65E - 88 64 162.39 0 2.31E - 132 1.01E - 18 4.98E - 05 2.24E - 51 7.99E - 56 64 162.39 8.65E - 88 0 1.22E - 105 7.03E - 09 4.17E - 21 64 162.39 2.22E - 100 2.24E - 51 2.18E - 60 0 13 DPC-GMM实验结果如式( )所示,基于 算法的船舶燃油系统故障识别方法准确率达到了100%,能够准确识别8类系统状态,并且不需要人工标注训练样本,实现了无监督的船舶燃油系统故障识别过程。BP采用相同的训练样本和测试样本,运用 神经网络算法对船舶燃油系统故障进行诊断,设置5个神经网络隐含层、8个输入神经元、1了 个输出5 000神经元,最大训练次数为 ,训练精度默认。测试集输出的结果为 [1.81 5.61 3.01 3.05 5.00 5.61 5.61 5.61] ,与标注结果 [1 2 3 4 5 6 7 8] 14),得 37.5%进行对比,根据式( 到正确率为 ,故障诊断的准确率较差。正确总识样别本样数本数14正确率= ( ) SVM同样,采用 方法识别上述船舶燃油系统状态,诊断故障类型。训练采用径向基函数(Radical Basis Function,RBF),对 DPC-GMM,BP SVM神经网络和 支持向量机算法的实验结果进1行了对比,结果如表 所示。 1 DPC-GMM由表可见,采用 算法对船舶燃BP油系统进行故障诊断时,其效果明显优于 神经SVM 100%网络和 算法,故障诊断的正确率达 ,所有故障类型都能正确划分,诊断能力较强,解决了常用船舶燃油系统故障诊断方法泛化能力低的局限性。对常用船舶燃油系统故障诊断方法的训练时GMM间进行对比,同时还对比了直接采用 方法的2训练时间,结果如表 所示。由表可见,本研究提

出的基于DPC-GMM算法的船舶燃油系统故障诊断方法能够实现故障的精准与快速诊断。表2 船舶燃油系统状态识别模型训练时间对比Table 2 Training time of fault diagnosis model of ship fuel DPC-GMM综合上述研究得出,本文提出的方法解决了常用船舶燃油系统故障诊断方法存在的识别精度低、收敛速度慢的问题,也解决了GMM算法本身存在的收敛速度慢的局限性。

4结语

针对现有研究无法实现船舶燃油系统故障自动诊断、泛化能力较差的问题,本文提出了基于DPC-GMM算法的船舶燃油系统故障诊断方法, 8根据船舶燃油系统的特征抽取出 个维度的特征GMM DPC向量。构建 时,应用 算法对船舶燃油系EM统特征参数进行初始化,使用 算法进行参数估计,建立完整、高效的故障诊断模型。实验结果DPC-GMM表明,本文提出的基于 算法的船舶燃100%油系统故障诊断方法,诊断准确率可达 ,优BP SVM于传统的 神经网络和 算法,同时可节约人工标注成本,是一种高效、无监督的故障诊断方法,具有较高的实用价值,也为船舶燃油系统故障诊断问题提供了一种新的方法。

参考文献:

1] 石灵丹,槐博超,马修真,等. RBF [ 神经网络在柴油机燃油系统故障诊断中的应用研究[J].船电技术, 2009,29(8):18-22. SHI L D ,HUAI B C, MA X Z ,et al. Research on ap⁃ plication of RBF neural network in the diesel engine fu⁃ el system fault diagnosis[J]. Marine Electric & Elec⁃ tronic Engineering,2009,29(8):18-22 (in Chi⁃ nese). [2] LIU Y,ZHANG J H, QIN K J ,et al. Diesel engine fault diagnosis using intrinsic time-scale decomposi⁃ tion and multistage Adaboost relevance vector machine [J]. Proceedings of the Institution of Mechanical Engi⁃ neers,Part C:Journal of Mechanical Engineering Sci⁃ ence,2018,232(5):881-894. [3] CAI C T ,WENG X Y,ZHANG C B. A novel ap⁃ proach for marine diesel engine fault diagnosis[J]. Cluster Computing,2017,20(2):1691-1702. 4] 韩小溪,胡光振,杨元. BP [ 基于 神经网络的维修性J]. 2008,3设计参数灵敏度分析[ 中国舰船研究, (6):66-69. HAN X X , HU G Z ,YANG Y. Sensitivity analysis of maintainability design parameters based on BP neural network[J]. Chinese Journal of Ship Research,2008, 3(6):66-69(in Chinese). 5] 李冬琴,王丽铮,王呈方. [ 支持向量机回归方法在船型要素建模中的应用[J]. 中国舰船研究,2007, 2(3):18-21,39. LI D Q ,WANG L Z,WANG C F. Method of support vector regression in modeling ship principal particulars [J]. Chinese Journal of Ship Research,2007,2(3): 18-21,39(in Chinese). [6] JIANG W, HU W W ,XIE C H. A new engine fault di⁃ agnosis method based on multi-sensor data fusion[J]. Applied Sciences,2017,7(3):280. [7] SKAKUN S,FRANCH B,VERMOTE E,et al. Early season large-area winter crop mapping using MODIS NDVI data, growing degree days information and a Gaussian mixture model[J]. Remote Sensing of Envi⁃ ronment,2017,195:244-258. [8] CUI M J ,FENG C,WANG Z K,et al. Statistical rep⁃ resentation of wind power ramps using a generalized Gaussian mixture model[J]. IEEE Transactions on Sustainable Energy,2018,9(1):261-272. [9] RODRIGUEZ A,LAIO A. Clustering by fast search and find of density peaks[J]. Science,2014,344 (6191):1492-1496. 10] 乔少杰,金琨,韩楠,等. [ 一种基于高斯混合模型J]. 2015,26(5):的轨迹预测算法[ 软件学报, 1048-1063. QIAO S J,JIN K,HAN N,et al. Trajectory predic⁃ tion algorithm based on Gaussian mixture model[J]. Journal of Software,2015,26(5):1048-1063 (in Chinese). 11] 邢长征,赵全颖,王星,等. [ 基于鲁棒高斯混合模

EM J].型的加速 算法研究[ 计算机应用研究, 2017,34(4):1042-1046. XING C Z,ZHAO Q Y,WANG X,et al. Accelerat⁃ ed EM algorithm research based on robust Gaussian mixture model[J]. Application Research of Comput⁃ ers,2017,34(4):1042-1046(in Chinese). [ 12] 唐炉亮,杨雪,靳晨,等. 基于约束高斯混合模型

的车道信息获取[ J]. 武汉大学学报(信息科学版),2017,42(3):341-347. TANG L L,YANG X,JIN C,et al. Traffic lane num⁃ ber extraction based on the constrained Gaussian mix⁃ ture mode[l J]. Geomatics and Information Science of Wuhan University,2017,42(3):341-347(in Chi⁃ nese). [ 13] 尹海明. 基于SVDD的密度峰值聚类算法及其接入网入侵检测研究[D]. 成都:电子科技大学,2017. 165 (下转第 页)

图1 GMM的构造Fig.1 Structure of GMM

图3 DPC-GMM基于 算法的船舶燃油系统故障诊断框架Fig.3 Fault diagnosis framework of ship fuel system based on DPC-GMM algorithm

图2 DPC-GMM基于 算法的船舶燃油系统故障识别方法伪代码Fig.2 Pseudo-code of fault diagnosis framework of ship fuel system based on DPC-GMM algorithm

图5 归一化后的压力波特征图Fig.5 Normalized pressure wave characteristics

图4 压力波形特征参数示意图Fig.4 Schematic diagram of characteristic parameters for pressure waveform

图6 DPC基于 算法的船舶燃油系统故障聚类结果Fig.6 Fault diagnosis clustering results of ship fuel system based on DPC algorithm

Newspapers in Chinese (Simplified)

Newspapers from China

© PressReader. All rights reserved.