基于机器学习的铁路道岔故障识别

来源：核心期刊咨询网发布时间：咨询：次

摘要：摘要：道岔的正常运转是保证列车正常运行的必备条件，传统的道岔故障检测方法主要来源于人的工作经验，根据电流的非正常变化来判别道岔是否发生故障，消耗较多的人力资源与物力资源。为了提升资源的有效利用率，本文运用概率主成分分析法提取数据的主要特征

　　摘要：道岔的正常运转是保证列车正常运行的必备条件，传统的道岔故障检测方法主要来源于人的工作经验，根据电流的非正常变化来判别道岔是否发生故障，消耗较多的人力资源与物力资源。为了提升资源的有效利用率，本文运用概率主成分分析法提取数据的主要特征，分别采用支持向量机模型和[k]近邻模型作为道岔故障分类器，然后使用十折交叉验证法作为模型的评价标准，以达到智能识别铁路道岔故障的目的。

　　关键词：概率主成分分析;支持向量机;故障识别;[k]近邻法

科学技术论文

　　目前，大部分地區通过微机监控系统采集道岔开闭时的电流值来判断铁路道岔是否发生故障。转辙机正常动作时的电流曲线如图1所示，发生故障时的转辙机动作电流曲线如图2至图6所示。由图像可以看出，除了故障时转辙机动作电流与正常时转辙机动作电流不同外，不同情形下的故障电流也不相同。

　　随着人工智能行业的发展和完善，人们可以使用机器学习算法进行铁路道岔故障识别，减少人力和物力的浪费，提高铁路道岔故障识别的准确性，减少故障识别的时间成本。唐维华[1]等利用LSTM(Long-Short Term Memory)电流数据的特征，将神经网络算法应用到道岔动作电流曲线分类器中。程宇佳[2]以核方法为基础，研究高速铁路道岔故障诊断方法。可婷等[3]利用主成分法提取道岔工作电流特征的主成分，并利用查准率和查全率构造道岔识别性能指标。杨菊花等[4]利用基于密度的聚类方法提取电流曲线数据的故障敏感特征，并利用PSO-SOM算法作为故障分类器。

　　1 道岔电流数据特征的提取

　　1.1 概率主成分分析法

　　利用高维度的数据来训练道岔故障识别模型时，模型的时间复杂度会较大，同时冗余信息也会影响模型分类的准确性。因此，人们可以通过特征提取技术将数据的主成分提取出来，减少数据特征相关性带来的影响。主成分分析(Principal Component Analysis)是最常用的降维技术，这一技术利用线性变换把高维度的线性相关的向量转化为低维度的线性无关的向量。

　　概率主成分分析法将概率框架引入主成分分析中，并引入非主成分因子，相较于主成分分析法，概率主成分分析法可以提取同样个数的特征数，其累计贡献率高于经典的主成分分析法[5]。

　　设[s1，s2，…，sd]为[d]维观测数据，样本数为[N]，对于单个样本，人们可以通过隐变量模型得到观测数据[s]与隐变量[x]的关系，即

　　[s=wx+μ+ε] (1)

　　式中，[w]为[d×q]因子载荷矩阵;[x]为[q]维隐变量;[μ]为非零均值;[ε]为误差。

　　设[x?N0，1]，[ε?N0，σ2I]，人们可以建立模型，表示隐变量[x]条件下观测数据[s]的概率分布情况，即　[p(s|x)=(2πσ2)-d2e-12σ2∥s-Wx-μ∥2] (2)

　　式中，[W]为变量[x]的系数。

　　若隐变量模型[x]的先验概率分布为标准的高斯分布[见式(3)]，则观测数据[s]的概率分布可以用式(4)表示。

　　[p(x)=(2π)-q2e-12xTx] (3)

　　[p(s)=(2π)-d2|C|-12e-12(s-μ)TC-1(s-μ)] (4)

　　式中，[T]為变量[x]的指数;[C=WWT+σ2I]，维数为[d×d]。

　　基于贝叶斯公式，人们可以计算出隐变量[x]关于观察值[s]的后验概率分布，即

　　[p(x|s)=(2π)-q2σ2M-12e-12(s-μ)TC-1(s-μ)] (5)

　　式中，[M=WTW+σ2I]，维数为[q×q]。

　　在此模型下，对数似然函数为：

　　[Ls=-N2dln2π+lnC+trC-1U] (6)

　　式中，[U]为观测样本的协方差矩阵。

　　参数[U]用公式可以表示为：

　　[U=1Nn=1N(sn-μ)(sn-μ)T] (7)

　　对参数[μ]和[W]求解后，人们就可以对高维空间中的样本[见式(8)]进行降维，降维后数据的重构形式如式(9)所示。

　　[xn=WTsn-μ] (8)

　　[sn=W(WTW)-1xn+μ] (9)

　　1.2 主成分分析法和概率主成分分析法的实践比较

　　在Matlab软件中，本研究利用主成分分析法提取铁路道岔电流的主成分，原样本数据维数为960×371，样本数据的协方差矩阵前9个特征值的累计贡献率为0.952 933。利用概率主成分分析法后，人们仍提取9个主成分，累计贡献率达到0.953 001。

　　2 道岔故障识别模型的建立

　　2.1 支持向量机故障识别模型

　　支持向量机(Support Vector Machines，SVM)是一种二分类模型。由图1可以看出，道岔故障有5种不同的情况，将所有道岔故障类的标签记为[yi=-1]，将正常状况标签记为[yi=+1]，[yi∈+1，-1]，然后建立支持向量机模型，即

　　[ minw，b，η12|a|2+Cs.t. yiaxi+b≥1-ηi， i=1，2，…，p ηi≥0， i=1，2，…，p] (10)

　　式中，[a]为超平面的法向量;[ηii=1，2，…，p]为松弛变量;[C]为惩罚参数。

　　通过求解上述优化模型的解[a*]和[b*]，人们可以得到相应的分类决策函数，即

　　[fx=signa*x+b*] (11)

　　2.2 KNN算法识别模型

　　[k]近邻法(k-Nearest Neighbor)是一种基本分类与回归的方法，本文利用Matlab中的Statistics and Machine Learning Toolbox，基于概率主成分分析法降维后的数据训练[k]近邻法分类器，距离度量为曼哈顿距离，[k]值取5。

　　3 模型评价与比较

　　3.1 10次10折交叉验证法

　　本试验中，数据量一共有960例，数据量较小，为了充分利用所有数据，其采用十折交叉验证(10-Fold Cross Validation)法。该方法能够在较少数据的情况下充分利用数据训练模型，并且可以得到可靠的模型评价。

　　3.2 模型比较

　　如表1所示，SVM模型10折交叉验证的错误率为0.001 2，KNN模型10折交叉验证的错误率为0.004 9，虽然将[k]近邻算法做二分类降低了错误率，但是其仍然不如支持向量机方法。KNN算法能够判断道岔故障类型，减少维修的时间成本。

　　表1 SVM和KNN模型交叉验证错误率

　　[序号模型错误率 1 SVM 0.001 2 2 KNN 0.004 9 ]

　　4 结论

　　本文首先对不同故障类别电流数据进行可视化处理，然后利用概率主成分分析法提取转辙机动作电流的数据特征，在371维的电流数据中提取9个主成分，方差累计贡献率达到95.3%，高于主成分分析法提取9个主成分的方差累计贡献率，支持向量机分类模型的准确率为99.88%，[k]近邻法分类模型的准确率为99.51%，因此支持向量机模型在准确性方面优于[k]近邻法模型。在实践中，训练好的模型对道岔故障做出判别的响应速度优于工作人员实时观察转辙机工作电流进行故障识别的速度，故障识别的准确率接近100%，不仅节约人力资源，而且降低了错误识别的风险。

　　参考文献：

　　[1]唐维华，李德敏.铁路道岔故障诊断及显示系统的设计与实现[J].计算机应用与软件，2019(9)：37-40.

　　[2]程宇佳.基于核方法的高速铁路道岔故障诊断[D].北京：北京交通大学，2016：12-13.

　　[3]可婷，葛雪纯，张立东，等.铁路道岔故障的智能诊断[J].电子技术应用，2020(4)：29-33.

　　[4]杨菊花，李旭彤，邢东峰，等.基于DBSCAN/SOM的道岔故障诊断[J].计量科学与技术，2020(12)：5-7.

　　[5]高兵，孙琳，谢彪，等.权重概率主成分分析模型的建立及应用研究[J].中国卫生统计，2018(6)：802-805.

　　推荐阅读：仿生机器人科技论文发表指导

转载请注明来自：http://www.qikan2017.com/lunwen/lig/20374.html

上一篇：物流配送无人化的关键技术分析
下一篇：钢铁企业高技能人才培养措施