基于机器学习的铁路道岔故障识别
来源:核心期刊咨询网时间:12
摘要:摘 要:道岔的正常运转是保证列车正常运行的必备条件,传统的道岔故障检测方法主要来源于人的工作经验,根据电流的非正常变化来判别道岔是否发生故障,消耗较多的人力资源与物力资源。为了提升资源的有效利用率,本文运用概率主成分分析法提取数据的主要特征
摘 要:道岔的正常运转是保证列车正常运行的必备条件,传统的道岔故障检测方法主要来源于人的工作经验,根据电流的非正常变化来判别道岔是否发生故障,消耗较多的人力资源与物力资源。为了提升资源的有效利用率,本文运用概率主成分分析法提取数据的主要特征,分别采用支持向量机模型和[k]近邻模型作为道岔故障分类器,然后使用十折交叉验证法作为模型的评价标准,以达到智能识别铁路道岔故障的目的。
关键词:概率主成分分析;支持向量机;故障识别;[k]近邻法
目前,大部分地區通过微机监控系统采集道岔开闭时的电流值来判断铁路道岔是否发生故障。转辙机正常动作时的电流曲线如图1所示,发生故障时的转辙机动作电流曲线如图2至图6所示。由图像可以看出,除了故障时转辙机动作电流与正常时转辙机动作电流不同外,不同情形下的故障电流也不相同。
随着人工智能行业的发展和完善,人们可以使用机器学习算法进行铁路道岔故障识别,减少人力和物力的浪费,提高铁路道岔故障识别的准确性,减少故障识别的时间成本。唐维华[1]等利用LSTM(Long-Short Term Memory)电流数据的特征,将神经网络算法应用到道岔动作电流曲线分类器中。程宇佳[2]以核方法为基础,研究高速铁路道岔故障诊断方法。可婷等[3]利用主成分法提取道岔工作电流特征的主成分,并利用查准率和查全率构造道岔识别性能指标。杨菊花等[4]利用基于密度的聚类方法提取电流曲线数据的故障敏感特征,并利用PSO-SOM算法作为故障分类器。
1 道岔电流数据特征的提取
1.1 概率主成分分析法
利用高维度的数据来训练道岔故障识别模型时,模型的时间复杂度会较大,同时冗余信息也会影响模型分类的准确性。因此,人们可以通过特征提取技术将数据的主成分提取出来,减少数据特征相关性带来的影响。主成分分析(Principal Component Analysis)是最常用的降维技术,这一技术利用线性变换把高维度的线性相关的向量转化为低维度的线性无关的向量。
概率主成分分析法将概率框架引入主成分分析中,并引入非主成分因子,相较于主成分分析法,概率主成分分析法可以提取同样个数的特征数,其累计贡献率高于经典的主成分分析法[5]。
设[s1,s2,…,sd]为[d]维观测数据,样本数为[N],对于单个样本,人们可以通过隐变量模型得到观测数据[s]与隐变量[x]的关系,即
[s=wx+μ+ε] (1)
式中,[w]为[d×q]因子载荷矩阵;[x]为[q]维隐变量;[μ]为非零均值;[ε]为误差。
设[x?N0,1],[ε?N0,σ2I],人们可以建立模型,表示隐变量[x]条件下观测数据[s]的概率分布情况,即 [p(s|x)=(2πσ2)-d2e-12σ2∥s-Wx-μ∥2] (2)
式中,[W]为变量[x]的系数。
若隐变量模型[x]的先验概率分布为标准的高斯分布[见式(3)],则观测数据[s]的概率分布可以用式(4)表示。
[p(x)=(2π)-q2e-12xTx] (3)
[p(s)=(2π)-d2|C|-12e-12(s-μ)TC-1(s-μ)] (4)
式中,[T]為变量[x]的指数;[C=WWT+σ2I],维数为[d×d]。
基于贝叶斯公式,人们可以计算出隐变量[x]关于观察值[s]的后验概率分布,即
[p(x|s)=(2π)-q2σ2M-12e-12(s-μ)TC-1(s-μ)] (5)
式中,[M=WTW+σ2I],维数为[q×q]。
在此模型下,对数似然函数为:
[Ls=-N2dln2π+lnC+trC-1U] (6)
式中,[U]为观测样本的协方差矩阵。
参数[U]用公式可以表示为:
[U=1Nn=1N(sn-μ)(sn-μ)T] (7)
对参数[μ]和[W]求解后,人们就可以对高维空间中的样本[见式(8)]进行降维,降维后数据的重构形式如式(9)所示。
[xn=WTsn-μ] (8)
[sn=W(WTW)-1xn+μ] (9)
1.2 主成分分析法和概率主成分分析法的实践比较
在Matlab软件中,本研究利用主成分分析法提取铁路道岔电流的主成分,原样本数据维数为960×371,样本数据的协方差矩阵前9个特征值的累计贡献率为0.952 933。利用概率主成分分析法后,人们仍提取9个主成分,累计贡献率达到0.953 001。
2 道岔故障识别模型的建立
2.1 支持向量机故障识别模型
支持向量机(Support Vector Machines,SVM)是一种二分类模型。由图1可以看出,道岔故障有5种不同的情况,将所有道岔故障类的标签记为[yi=-1],将正常状况标签记为[yi=+1],[yi∈+1,-1],然后建立支持向量机模型,即
[ minw,b,η12|a|2+Cs.t. yiaxi+b≥1-ηi, i=1,2,…,p ηi≥0, i=1,2,…,p] (10)
式中,[a]为超平面的法向量;[ηii=1,2,…,p]为松弛变量;[C]为惩罚参数。
通过求解上述优化模型的解[a*]和[b*],人们可以得到相应的分类决策函数,即
[fx=signa*x+b*] (11)
2.2 KNN算法识别模型
[k]近邻法(k-Nearest Neighbor)是一种基本分类与回归的方法,本文利用Matlab中的Statistics and Machine Learning Toolbox,基于概率主成分分析法降维后的数据训练[k]近邻法分类器,距离度量为曼哈顿距离,[k]值取5。
3 模型评价与比较
3.1 10次10折交叉验证法
本试验中,数据量一共有960例,数据量较小,为了充分利用所有数据,其采用十折交叉验证(10-Fold Cross Validation)法。该方法能够在较少数据的情况下充分利用数据训练模型,并且可以得到可靠的模型评价。
3.2 模型比较
如表1所示,SVM模型10折交叉验证的错误率为0.001 2,KNN模型10折交叉验证的错误率为0.004 9,虽然将[k]近邻算法做二分类降低了错误率,但是其仍然不如支持向量机方法。KNN算法能够判断道岔故障类型,减少维修的时间成本。
表1 SVM和KNN模型交叉验证错误率
[序号 模型 错误率 1 SVM 0.001 2 2 KNN 0.004 9 ]
4 结论
本文首先对不同故障类别电流数据进行可视化处理,然后利用概率主成分分析法提取转辙机动作电流的数据特征,在371维的电流数据中提取9个主成分,方差累计贡献率达到95.3%,高于主成分分析法提取9个主成分的方差累计贡献率,支持向量机分类模型的准确率为99.88%,[k]近邻法分类模型的准确率为99.51%,因此支持向量机模型在准确性方面优于[k]近邻法模型。在实践中,训练好的模型对道岔故障做出判别的响应速度优于工作人员实时观察转辙机工作电流进行故障识别的速度,故障识别的准确率接近100%,不仅节约人力资源,而且降低了错误识别的风险。
参考文献:
[1]唐维华,李德敏.铁路道岔故障诊断及显示系统的设计与实现[J].计算机应用与软件,2019(9):37-40.
[2]程宇佳.基于核方法的高速铁路道岔故障诊断[D].北京:北京交通大学,2016:12-13.
[3]可婷,葛雪纯,张立东,等.铁路道岔故障的智能诊断[J].电子技术应用,2020(4):29-33.
[4]杨菊花,李旭彤,邢东峰,等.基于DBSCAN/SOM的道岔故障诊断[J].计量科学与技术,2020(12):5-7.
[5]高兵,孙琳,谢彪,等.权重概率主成分分析模型的建立及应用研究[J].中国卫生统计,2018(6):802-805.
推荐阅读:仿生机器人科技论文发表指导
转载请注明来自:http://www.qikan2017.com/lunwen/lig/20374.html
相关论文阅读
- 2022-11-28不动产测绘特点及测绘技术分析
- 2022-09-28新基建的核心是重构产业基础设施
- 2022-09-19“一带一路”倡议下交通运输业与物流业的联动发展分析
- 2022-09-17地下工程智能施工信息管理系统研发与应用
- 2022-09-17工程师论文发表浅析工程管理中资料的重要性
- 2022-07-19边坡支挡结构岩土荷载的分项系数计算方法
- 2022-07-16建筑智能化技术在建筑给排水工程中的应用
- 2022-07-13日本高校档案馆调查研究职能的特点及启示
- 2022-07-09建筑电气自动化控制技术探讨
- 2022-07-07绿色建筑玻璃幕墙设计方法探析
期刊论文问答区
- 2025-05-13教师职称评审级别及所需学术成果材料
- 2025-04-24英文期刊发表论文几个版面起发
- 2025-01-21论文顺利通过审稿的8个操作
- 2025-01-11管理学类30本期刊(国自然基金委员会认定)
- 2025-01-02电刺激治疗相关文章选题推荐
- 2024-12-17植物学比较热门的论文选题
- 2024-12-03人事管理方面文章选题推荐和发表期刊
- 2024-11-18金融学专业的论文选题方向推荐
- 2024-11-01教育核心期刊有哪些
- 2024-07-12学术论文初审是谁在审?审什么?审多久?
优质科技期刊
- 1核心级《公路工程》
- 2核心级《中外公路》
- 3核心级《遥感技术与应用》
- 4核心级《电子测量技术》
- 5核心级《无线电工程》
- 6核心级《公路交通科技(应用技术版)》
- 7核心级《实验室研究与探索》
- 8核心级《交通运输工程学报》
最新期刊更新
- 《中国政府采购》
- 《中国政府采购》
- 《农业图书情报学刊》
- 《农业技术经济》
- 《水文地质工程地质》
- 《房地产世界》
- 《中央民族大学学报:哲》
- 《广州化学》
- 《物理学报》
- 《东方宝宝》
- 《新能源进展》
- 《热带农业科学》
- 《建筑经济》
- 《中国学校卫生》
精品推荐
- 12022-11-28不动产测绘特点及测绘技术分析
- 22022-09-28新基建的核心是重构产业基础设施
- 32022-09-19“一带一路”倡议下交通运输业与物流业的联动发展分析
- 42022-09-17地下工程智能施工信息管理系统研发与应用
- 52022-09-17工程师论文发表浅析工程管理中资料的重要性
- 62022-07-19边坡支挡结构岩土荷载的分项系数计算方法
- 72022-07-16建筑智能化技术在建筑给排水工程中的应用
- 82022-07-13日本高校档案馆调查研究职能的特点及启示
- 12021-12-30如何做好重大建设项目防造假工作的几点思考
- 22022-02-15菜鸟物流运营模式的改进策略分析
- 32018-08-04铝合金表面黑线成因分析
- 42019-01-23乡村振兴战略与精准脱贫之间的辩证关系
- 52019-01-16中国物流的发展以及优劣势分析
- 62020-06-29一起浪涌保护器引起的变压器烧毁事故原因分析及应对措施
- 72019-12-17纯电动汽车减速器齿轮啮合错位分析
- 82021-10-13我国城市轨道交通车辆技术现状和发展趋势
- 12025-05-13教师职称评审级别及所需学术成果材料
- 22025-05-08人力资源专业论文发ssci
- 32025-05-08评职称著作合著快还是独著快
- 42025-04-24英文期刊发表论文几个版面起发
- 52025-04-24声音与振动杂志JOURNAL OF SOUND AND VIBRATION期刊收稿方向
- 62025-02-12“互联网+”时代的农产品营销与农业经济发展
- 72025-02-12羊肉消费市场调研
- 82025-02-12文创产品营销策略
- 12021-05-24刊号字母G、G0、G1、G2、G3、G4、G8是什么意思
- 22021-05-06论文引用率不能超过多少
- 32018-09-11语法翻译法的运用以及优缺点分析
- 42020-03-08发表在期刊上的论文一般多少字
- 52020-09-21疾控中心工作怎么评职称
- 62020-01-03新北大核心什么时候更新,几年更新一次
- 72020-03-08通讯作者和二作哪个含金量比较高
- 82021-02-23发表的期刊论文见刊的时候可以在知网查到吗