基于长短时记忆网络的旋转机械状态预测研究

作者:赵建鹏;周俊; 刊名:噪声与振动控制 上传者:沈斌

【摘要】作为深度学习算法的一种,长短时记忆网络越来越成为时间序列预测的重要手段,简要阐述长短时记忆网络的基本原理,并将其应用于旋转机械状态监控领域,以轴承数据为样本进行仿真,针对轴承数据的非平稳性,运用经验模态分解方法将其分解为平稳信号,并计算其本征模态分量能量熵作为状态特征,通过计算长短时记忆网络对旋转机械状态单步预测的结果,并与支持向量回归机模型的预测结果进行比较,证明长短时记忆网络在旋转机械状态预测方面可以取得比支持向量回归机更好的效果.

全文阅读

随着现代大型机械装备日益趋于复杂化、高速化、自动化与精密化,部件之间相互耦合的关系越来越强,一旦其中一个关键部件发生故障,往往会引发机械故障的一系列“链式反应”,从而造成工厂的财产损失甚至是人员伤亡。尤其对于旋转机械来说,其所受载荷为动态载荷,更易发生机械故障,故而对于旋转机械的状态监控和预测一直是研究的热点[1]。对机械设备进行故障诊断和预测的方法可以分为三种,分别是基于数据驱动的方法、基于模型的方法和基于经验方法。其中基于数据驱动的方法主要应用神经网络、马尔可夫模型等机器学习方法,随着机器学习在今天生产和生活各个领域的广泛应用而获得巨大发展,成为最主要的故障诊断和预测方法。学界也提出了很多基于机器学习的机械故障预测方法[26]。标准神经网络在应对分类任务时很有效,能够对非线性系统进行良好的拟合,但是由于在神经网络的假设中所取得的数据被视为互相独立的,无法模拟时间序列中的马尔可夫过程,所以提出了递归神经网络(RecurrentNeuralNetwork,RNN)模型,下一时刻的输出状态y(t+1)不仅依赖于下一时刻的输入x(t+1),而且依赖于本时刻的输出状态y(t)。Yam等提出以递归神经网络作为视情维修手段,构建了面向机械状态的智能预测决定支持系统[7]。Wang等提出以动态小波神经网络(DynamicWaveletNeuralNetwork,DWNN)和虚拟传感器作为“测量(measure)”故障增长和预测剩余使用寿命的手段[8]。这些文献表明,递归神经网络在机械状态预测方面的确具有其优越性,能够产生良好的效果,但是RNN也具有一些缺陷,比如难以训练并且无法学习长期依赖关系等,作为其改进版本,长短时记忆(LongShort-TermMemory,LSTM)网络自提出至今尚未被应用于机械状态预测领域。文中提出以LSTM网络作为机械状态监控和预测的方法,分为两步,第一步进行特征提取,对轴承振动数据进行经验模态分解,并以分解得到的IMF能量熵之和作为机械状态特征,第二步设计LSTM网络的结构并进行仿真验证,由于支持向量回归机(SupportVectorRegressionMachine,SVRM)模型近年来在时间序列预测方面取得很多令人振奋的结论,所以将LSTM网络的仿真结果与根据SVRM模型得到的结果进行比较。表明相比于SVRM模型,LSTM网络能够更好地逼近真实值。而且SVRM模型存在参数优化问题,惩罚因子和核函数参数的选取严重影响其预测性能,而LSTM网络则有效避免了参数选取的难题。本研究推广了长短时记忆网络的应用领域,提出了一种旋转机械状态监控和预测的新方法。1LSTM网络简介1.1RNN原理RNN神经元的结构与标准神经元的区别在于其具有递归结构,可以将上一个状态的信息传递到当前状态,如图1所示,当输入为时间序列时,可以将其展开为一系列相互连接的标准神经元。图1递归神经网络神经元结构图设输入序列为X=?(x1,x2,?,xt),隐单元序列H=(h1,h2,?,ht)与输出序列Y=(y1,y2,?,yt)的算法为ht=(Wxhxt+Whhht-1+bh)(1)yt=Whyht+by(2)为非线性激活函数,Wxh、Whh、Why分别为输入到隐单元、隐单元到隐单元、隐单元到输出的权值矩阵,bh、by分别为隐单元和输出的偏置项。1.2LSTM网络原理LSTM网络是一种应用于深度学习领域的RNN,由Hochreiter和Schmidhuber(1997)提出以克服RNN难以训练和梯度消失问题[9],能够学习长期依赖关系,之后被学界不断完善[101

参考文献

引证文献

问答

我要提问