Chinese Journal of Ship Research
基于随机森林的离心泵滚动轴承故障诊断
周海军
择的训练数据对多棵决策树进行训练,生成多个可以进行决策的基分类器,然后对基分类器进行权值分配来达到提高诊断结果的目的[8]。因此,为了提高对滚动轴承故障诊断的准确度,本文将在提取故障特征的基础上,利用随机森林(random forest)作为分类器进行故障诊断,从而完成泵组设备中滚动轴承的故障诊断研究。
1 基于LCD-样本熵与随机森林分类的滚动轴承故障诊断原理
本文所采用的离心泵滚动轴承故障诊断方法包括小波降噪、时域分析及随机森林等,其故障诊1断流程如图 所示。图中:ca为高频分量;cd为低(i) 和 ( j)为小波降噪后的振动信号。
X由于在振动信号采集过程中环境因素会对信号采集产生很大干扰,因此,首先采用小波降噪的LCD方法对振动信号进行降噪处理,然后采用 对降噪后的振动信号进行时频分析,获取各故障模ISC ISC式信号的 分量,之后,提取各 分量的样本熵作为振动信号的故障特征。进行故障诊断时, ISC利用提取的各故障模式 分量的样本熵对随机森林进行训练。随机森林由若干棵分类回归决策树(classification and regression tree,CART )组合2而成,并由决策树进行投票决策,如图 所示[ 9]。随机森林是一种以决策树为基础学习器的集成学习算法,而决策树是随机森林的基础分类器,其是一种由节点和有向边构成的树状结构。训练时,在每一个非叶子节点针对某一属性进行分裂,迭代这一过程,直到每个叶子节点上的样本均处于单一的类别或者每个属性都被选择过为止。叶子节点代表分类的结果,从根节点到叶子节点的完整路径代表一种决策过程。决策树的算法本质上ID3,是节点如何进行分裂的方法,常见的有C4.5P,CART等。决策树算法得到的结果一般是二叉树,少数情况下也存在非二叉树情况。决策树构造完成以后,因为样本集中噪声和离群点的存在,得到的决策树往往庞大而复杂,为了克服这一缺点,通常还要再对其进行剪枝处理,以限制其规模,提高分类的准确率。大而复杂的决策树得到的分类结果是不准确的,因为许多树分枝反映的是样本集中的异常数据。对模型中的各个子树进行评估,若满足条件,则将该子树转化为一个叶子节点,再对整个分类器的性能进行评估,看其是否提高了分类的准确度。若得到了提高,则进行此种转化,若没有提高,则进行下一棵子树的检
测。循环此过程,直到分类器得到比较满意的分Bagging类效果。本文在此基础上采用 的方式随机抽取训练样本对决策树进行训练,建立多棵决策树,然后利用训练好的随机森林对测试数据进行诊断测试,从而获得故障诊断结果。16过构建的 通道的硬件采集系统采集,采样频率20 000 Hz,采 2.5 h 1s为 样时间为每隔 采集 振动7数据,每种故障模式的振动数据共采集 次,形成7组故障数据。3离心泵组试验系统原理如图 所示。试验场380 V地提供 的交流电源,然后控制交流电机运转,电源与电机通过电缆连接,交流电机带动离心泵实现吸/排水过程;离心泵进口通过DN50×1.096 DN40 DN40 ×法兰与 过渡管路连接,出口通过1.096 DN40法兰与 过渡管路连接,进、出口处的DN40 ϕ64.2SP过渡管路分别通过 液压软管与DN80管路相连并接入水箱。流量传感器用于检测离心泵组出口的流量。其中,离心泵组通过螺T栓固定在 型钢结构挂架上,挂架与基座通过螺
栓固定。3根据图 所示位置关系,通过螺栓将挂架、电机、离心泵连接起来,然后将挂架侧面与基座用螺栓固定。将各传感器与诊断系统相连,完成试验4系统的安装,如图 所示。离心泵故障诊断系统5现场测试设备如图 所示,主要包括传感器系统、数据采集及预处理模块、诊断主机系统。其中离心泵分别连接进水管和出水管,流量计通过法兰连接在出水管路上,其他传感器(振动传感器、电流传感器和轴心轨迹检测传感器)均直接安装在离心泵设备(包括电机、离心泵外壳,主轴等)上。LabVIEW基于 开发的离心泵综合故障诊断系统软件以可执行程序(.exe)的方式安装在诊断主机系统中;数据采集及预处理模块(包括电源模块、电荷放大器模块、输入输出端子等)起着数据预处理及转接的作用,用于数据融合、信号输入输出4 4等,采集的 种传感器信号通过 个输入端子输入4转接模块仪表箱,再通过相应的 个输出端子将信号输出并接入到诊断主机系统(包括电源、信号A/D前置放大、滤波、数据采集及 转换等模块)的输入端子,最终实现信号的全方位分析及诊断。
3 诊断方法验证
7首先,将采集到的每种故障模式的 组数据进行整合,按时间顺序将其组合成一个数据列, 10 000 Hz。通过降采样处理后,数据采样频率改为之后,利用小波降噪方法降低试验过程中由振动传感器所采集故障信号中的噪声,提高所采集数db1据的信噪比。在本方法中,选取 小波函数强制降噪,每种故障模式的时域数据降噪后的对比6如图 所示。将每种故障模式数据进行分段处理,每段数10 000据长度选取为 个点,通过滑移取值获得100 LCD组数据;然后,利用 对每段数据进行分5解,分解层数设定为 层,每种故障模式任意一段
LCD 7数据的 分解结果如图 所示。从图中可以看LCD 5出,信号经 分解 层之后,每种故障模式振动型号的时域特征值已比较明显。因此,对于开展5后续的信号处理分析来说,采用 层分解进行故障诊断完全足够。LCD所有故障模式数据分解结束之后,提取分解的每组信号的样本熵作为故障特征,生成每5种故障模式的 维特征,正常状态、内环故障、滚