# 基于DPC-GMM算法的船舶燃油系统故障诊断

## 魏一，张跃文，李斌 116026大连海事大学 轮机工程学院，辽宁 大连

Chinese Journal of Ship Research - - Contents -

Fault diagnosis of ship fuel system based on DPC-GMM algorithm

WEI Yi，ZHANG Yuewen，LI Bin Marine Engineering College，Dalian Maritime University，Dalian 116026，China Abstract：［Objectives］The traditional Gaussian Mixture Model（GMM）has the inherent shortcoming of slow convergence which can easily lead to over-fitting and cause the parameter calculation to fall into a local optimum. As such，it is not suitable for the fault diagnosis of marine fuel systems.［Methods］A fault diagnosis method for a ship fuel system based on the DPC-GMM algorithm is proposed. First，the GMM and parameter estimation algorithms are analyzed. Combined with the Density Peaks Clustering （DPC） algorithm，GMM parameters corresponding to the state of the fuel system of ship are calibrated to achieve the unsupervised diagnosis of the failure of a ship's fuel system. Based on the obtained fuel system failure data，the proposed method is verified. ［Results］ The experimental results show that this method has higher recognition accuracy and faster recognition speed than the traditional Back Propagation（BP）neural network and Support Vector Machine （SVM） diagnosis algorithm. ［Conclusions］ The analysis results have important guiding significance for the fault diagnosis of marine fuel systems. Key words：fault diagnosis；Gaussian Mixture Model（GMM）；Expectation Maximum（EM）；Density Peaks Clustering（DPC）

0引言

1 算法原理 1.1 GMM定义

1.2 GMM原理

GMM的基本思想是：首先，使用概率密度函Expectation数进行建模；然后，借助期望最大化（ Maximum，EM）算法迭代获取相应参数的最优解，

={ j} EM αj μj获得，而参数 θ å 的常用估计方法是

1.3 EM算法的参数求解原理

GMM准确的 θ 才能构建出高效的 分类模型。由于难以直接求解 P ( X|θ ) ，用 lg P ( X|θ )替代入式（3），得到换 P ( X|θ ) ( )= å K 4 J θ θ ' p ( xi n|θ ) lg p(xi n|θ ') （ ） i =1 ' ' '式中：θ ={αj，μj，å '} ，为模型构造过程的另一组j参数；p ( xi n|θ )为在参数θ 条件下数据样本 xi 被划分到第 n类的概率密度。EM采用 算法逐步迭代来改善 θ 值的估计。迭代过程中，加大估计参数 θ 与观测训练样本 xi ( 1) ( ) + l之间的匹配率，使之满足 P X|θl > P X|θ ，其

（5）

θ* = arg max P( X|θ)结合式（4）与式（5），通过运算得到( )- K ' ') J θ θ J ( θ θ )=å p ( x  n|θ ) [lg p(x  n|θ - i i i =1 K å lg p ( xi n|θ )] = p ( x  n|θ )lg p(xi n|θ ') 6 （ ） p(xi n|θ) i i =1 ( ')-其 中 ，函 数 J θ θ J ( θ θ )= lg X ，在{X[J )]}| ( )θ θ ' J ( θ θ 点的切线方程为x = 1 ( φ ( x )= X - 1，有 J θ θ ')- ，根据式（6）， J ( θ θ )  φ(x)

( K p(xi n|θ ') å

J θ θ ')- J ( θ θ )  p(xi|θ) - 1 = p(x  n|θ) i =1 i K

å 7

{ p(x  n|θ ') - p(x  n|θ)} （ ） i i i =1即

( ')- ( （8） J θ θ J ( θ θ )  P X θ ')- P( X θ) 8 ( ') ( )通过式（ ）分析可得， J θ θ 与 P X θ'的单调性相同，因此对 P( X θ) 取关于 θ 的微分，得K å[Ñ

Ñ P ( X θ )=Ñ p(xi n|θ)]= θ θ θ i =1

K

å （9）

p(xi n|θ)[Ñ lg P( X θ)] θ i =1结合式（8）与式（9），可得( ')|θ 10 Ñ P ( X θ )=Ñ J θ θ （ ） θ θ = θ'其中，当θ = θ 时， J (θ θ ') 与 P( X θ)在 θ 点同时' 达到极值。综合式（8），说明二者不仅有相同的单调性，极值点也一样。根据式（7），求偏导为0时对应的 θ′ 值，求解E-step过 程 分 为 计 算 期 望（ ）与 计 算 极 大 值（M-step）。1）E-step：数据样本 xi 属于船舶燃油系统状态类型 i 的概率，即

αj p(xi |n θ) p ( n|xi θ )= （ 11 ） p(xi |θ)式中， p ( n|xi θ ) 为在数据样本 xi 和参数 θ 条件下，船舶燃油系统状态样本属于状态n的概率。2）M-step GMM ：使用期望最大化算法求取参数的迭代式，即K

K M åå

GMM E-step假设 的参数 θ 已知，利用 对GMM权值进行估计。M-step是基于估计的权值， GMM 2以优化并确定 的参数。重复上述 个步骤直到波动很小，在近似达到极值后结束迭代。

1.4 基于DPC算法初始化的GMM算法

DPC 9］，其算法是一种基于密度的聚类算法［基于中心决策图来确定密簇心和类簇个数K，其中K值通过前K个高密度点来判断，然后将非簇心样本点划分到最邻近的峰值密度样本所在类。DPC簇，完成样本数据的聚类 具有无需指定聚类参数，能够发现非球类簇并识别噪声点，有益于处理大批量数据的特点［13］。GMM EM方法结合 算法虽然可以保证每次迭代都能使观察数据对数似然增大，但其收敛速度较慢［10］。选定较好的数据初始化结果能够避免这GMM个缺点，并解决参数初始化对 方法最终结果造成的影响。EM先对输入初始数据进行粗分类，再将 算GMM法迭代得到的数据作为 方法的初始化数DPC GMM EM据。将 算法与 算法结合可提高 算

2 框架模型

3本文提出模型的系统框架如图 所示，图中 μ 3为均值，σ 为方差。其工作原理分为 个步骤： 1）提取船舶燃油系统状态的特征向量，并采用高斯白噪声对数据样本进行扩充； 2 DPC ）采用 算法初始化船舶燃油系统状态GMM数据类型的数目，对不同类型数据进行 模型EM构建，利用最大似然估计 算法获取聚类模型参数； 3 GMM ）利用 训练得到测试模型，根据输入的新样本诊断船舶燃油系统最可能的状态。 2算法优化过程如图 的伪代码所示。图中， Th是最小误差值。

3 模型构建与仿真实验结果 3.1 船舶燃油系统故障特征的选取

40对采用 组原始数据的压力波特征的描述5性分析如图 所示。

3.2 模型构建

GMM为了增大训练样本的数量，使得建立的40，45，更具代表性，将上述特征值分别加上了50，55，60，65，70，75，80 dB 40的高斯白噪声，将400 400组原始数据扩充到了 组。然后再将这 组数DPC据作为训练样本，采用 算法寻找数据的最佳EM聚类中心，以作为 算法初始化的中心值来构

GMM建 模型。DPC通过 算法对数据进行聚类，结果表明船8 6）。舶燃油系统有 种状态（图 DPC算法聚类结果与本文中船舶燃油系统的8 6 1~8种状态一致，如图 所示，状态 分别为：正常喷油、75%油量、25%油量、怠速油量、喷油器针阀1、喷 2、喷油器针阀泄漏、高压卡死 油器针阀卡死油泵出油阀失效［14］。DPC EM将 算法获取的聚类中心值作为 算法GMM的初始值来构建 模型。

3.3 实验结果分析

GMM 400×8模型中， μi 为 维数据，规模为400×400×8。8在测试阶段，将 组船舶燃油系统故障特征GMM值代入构建的 模 型 中 ，比 较 基 于( x|μi å )对应的每行样本中的数值，数值大的αiGi i维度代表对应维度的船舶燃油系统状态。得到如下结果： ( x|μi å )= αiGi i 5.43E - 101 64 162.39 6.72E - 05 7.03E - 09 1.13E - 28 1.01E - 18 1.29E - 70 0 1.38E - 116 6.72E - 05 64 162.39 4.17E - 21 2.28E - 65 4.98E - 05 4.49E - 72 0 1.16E - 72 1.13E - 82 2.28E - 65 2.22E - 100 64 162.39 7.99E - 56 7.18E - 98 5.81E - 233 1.16E - 205 0 0 0 5.81E - 233 0 0 64 162.39 64 162.39 5.43E - 101 1.38E - 116 1.22E - 105 1.16E - 72 2.31E - 132 4.53E - 74 1.16E - 205 4.53E - 74 1.29E - 70 4.49E - 72 2.18E - 60 7.18E - 98 8.65E - 88 64 162.39 0 2.31E - 132 1.01E - 18 4.98E - 05 2.24E - 51 7.99E - 56 64 162.39 8.65E - 88 0 1.22E - 105 7.03E - 09 4.17E - 21 64 162.39 2.22E - 100 2.24E - 51 2.18E - 60 0 13 DPC-GMM实验结果如式（ ）所示，基于 算法的船舶燃油系统故障识别方法准确率达到了100%，能够准确识别8类系统状态，并且不需要人工标注训练样本，实现了无监督的船舶燃油系统故障识别过程。BP采用相同的训练样本和测试样本，运用 神经网络算法对船舶燃油系统故障进行诊断，设置5个神经网络隐含层、8个输入神经元、1了 个输出5 000神经元，最大训练次数为 ，训练精度默认。测试集输出的结果为 [1.81 5.61 3.01 3.05 5.00 5.61 5.61 5.61] ，与标注结果 [1 2 3 4 5 6 7 8] 14），得 37.5%进行对比，根据式（ 到正确率为 ，故障诊断的准确率较差。正确总识样别本样数本数14正确率= （ ） SVM同样，采用 方法识别上述船舶燃油系统状态，诊断故障类型。训练采用径向基函数（Radical Basis Function，RBF），对 DPC-GMM，BP SVM神经网络和 支持向量机算法的实验结果进1行了对比，结果如表 所示。 1 DPC-GMM由表可见，采用 算法对船舶燃BP油系统进行故障诊断时，其效果明显优于 神经SVM 100%网络和 算法，故障诊断的正确率达 ，所有故障类型都能正确划分，诊断能力较强，解决了常用船舶燃油系统故障诊断方法泛化能力低的局限性。对常用船舶燃油系统故障诊断方法的训练时GMM间进行对比，同时还对比了直接采用 方法的2训练时间，结果如表 所示。由表可见，本研究提

4结语

1］ 石灵丹，槐博超，马修真，等. RBF ［ 神经网络在柴油机燃油系统故障诊断中的应用研究［J］.船电技术， 2009，29（8）：18-22. SHI L D ，HUAI B C， MA X Z ，et al. Research on ap⁃ plication of RBF neural network in the diesel engine fu⁃ el system fault diagnosis［J］. Marine Electric & Elec⁃ tronic Engineering，2009，29（8）：18-22 （in Chi⁃ nese）. ［2］ LIU Y，ZHANG J H， QIN K J ，et al. Diesel engine fault diagnosis using intrinsic time-scale decomposi⁃ tion and multistage Adaboost relevance vector machine ［J］. Proceedings of the Institution of Mechanical Engi⁃ neers，Part C：Journal of Mechanical Engineering Sci⁃ ence，2018，232（5）：881-894. ［3］ CAI C T ，WENG X Y，ZHANG C B. A novel ap⁃ proach for marine diesel engine fault diagnosis［J］. Cluster Computing，2017，20（2）：1691-1702. 4］ 韩小溪，胡光振，杨元. BP ［ 基于 神经网络的维修性J］. 2008，3设计参数灵敏度分析［ 中国舰船研究， （6）：66-69. HAN X X ， HU G Z ，YANG Y. Sensitivity analysis of maintainability design parameters based on BP neural network［J］. Chinese Journal of Ship Research，2008， 3（6）：66-69（in Chinese）. 5］ 李冬琴，王丽铮，王呈方. ［ 支持向量机回归方法在船型要素建模中的应用［J］. 中国舰船研究，2007， 2（3）：18-21，39. LI D Q ，WANG L Z，WANG C F. Method of support vector regression in modeling ship principal particulars ［J］. Chinese Journal of Ship Research，2007，2（3）： 18-21，39（in Chinese）. ［6］ JIANG W， HU W W ，XIE C H. A new engine fault di⁃ agnosis method based on multi-sensor data fusion［J］. Applied Sciences，2017，7（3）：280. ［7］ SKAKUN S，FRANCH B，VERMOTE E，et al. Early season large-area winter crop mapping using MODIS NDVI data， growing degree days information and a Gaussian mixture model［J］. Remote Sensing of Envi⁃ ronment，2017，195：244-258. ［8］ CUI M J ，FENG C，WANG Z K，et al. Statistical rep⁃ resentation of wind power ramps using a generalized Gaussian mixture model［J］. IEEE Transactions on Sustainable Energy，2018，9（1）：261-272. ［9］ RODRIGUEZ A，LAIO A. Clustering by fast search and find of density peaks［J］. Science，2014，344 （6191）：1492-1496. 10］ 乔少杰，金琨，韩楠，等. ［ 一种基于高斯混合模型J］. 2015，26（5）：的轨迹预测算法［ 软件学报， 1048-1063. QIAO S J，JIN K，HAN N，et al. Trajectory predic⁃ tion algorithm based on Gaussian mixture model［J］. Journal of Software，2015，26（5）：1048-1063 （in Chinese）. 11］ 邢长征，赵全颖，王星，等. ［ 基于鲁棒高斯混合模

EM J］.型的加速 算法研究［ 计算机应用研究， 2017，34（4）：1042-1046. XING C Z，ZHAO Q Y，WANG X，et al. Accelerat⁃ ed EM algorithm research based on robust Gaussian mixture model［J］. Application Research of Comput⁃ ers，2017，34（4）：1042-1046（in Chinese）. ［ 12］ 唐炉亮，杨雪，靳晨，等. 基于约束高斯混合模型