故障诊断中的应用翟永杰,韩璞,王东风,王国鹏(华北电力大学动力工程系,河北保定071003)
尽早识别轻微故障,对提高生产过程设备运行的安全性具有重要意义。为实现对设备轻微故障的正确识别和及时诊断,该文提出了一种基于损失函数的支持向量机(SVM)算法。应用模糊理论的方法对支持向量机分类及最优分类面进行了解释,对可疑分类区列出了模糊隶属度的表达式。针对故障诊断等问题中误判造成的损失不同这一特点,定义了基于损失函数的模糊隶属度,并得出了修正后的最优分类面。SVM算法可以实现对设备轻微故障的准确识别,并可近似地判别故障的严重程度。文中以汽轮机减速箱轴承运行状态诊断为例,对样本数据经K-L变换后进行可视化研究,分类结果表明了该算法的可行性。
关键词:支持向量机;损失函数;模糊理论;故障诊断;轻微故障1引言
支持向量机[1](SupportVectorMachine,简称SVM)是建立在统计学习理论的VC维理论和结构风险最小原理基础上的,根据有限的样本信息在模型的复杂性(即对特定训练样本的学习精度)和学习能力(即无错误地识别任意样本的能力)之间寻求最佳折衷,以期获得最好的推广能力。SVM是一种基于结构风险最小化原理的新的机器学习算法,它比基于经验风险最小化的神经网络学习算法具有更强的理论依据和更好的泛化能力,对线性可分问题的应用充分说明了这一点。另外对非线性问题的处理,SVM也有自己较完整的理论。
从统计模式识别的角度来看,常规SVM算法在分类时是基于误判造成的损失相同这一原则进行的,而与在故障诊断[2,3]、癌细胞识别等模式分类问题中误判造成的损失是不同的,在实际应用中应该考虑这种区别。
生产过程中的设备故障往往经历一个从产生到发展、从轻微到严重的渐变过程[4]。设备轻微故障时的系统状态与正常状态偏差小,征兆不完全,因此,使用常规SVM算法进行判断时,会对轻微故障存在一定程度的误判,且将故障误判为正常与将正常误判为故障的概率是相同的。然而若等到轻微故障转变为典型故障后才得出故障判断,这时对设备造成的损失就会很大。而将正常状态误判为故障的损失相对来说要小,2种误判造成的损失是不同的。
本文引入了风险概念,提出了基于损失函数的模糊隶属度及模糊判断规则,并得出了修正后的最优分类面。改进后的SVM算法合理地增大了故障的判断概率,使对故障的诊断更加敏感,减小了将故障误判为正常的概率,从而能够在故障刚刚萌芽、程度尚轻微时尽早地准确识别故障。
2基于损失函数的SVM算法
2.1支持向量机介绍
支持向量机是统计学习理论中最年轻的内容,也是最实用的部分。其核心内容是在1992至1995年间提出的,目前仍处于不断发展阶段[1]。SVM是从线性可分情况下的最优分类面发展而来的,基本思想可用图1的二维情况说明。图中,实心点和空心点分别代表两类样本,H为分类线,H1、H2分别为过各类中离分类线最近的样本且平行于分类线的直线,它们之间的距离叫做分类间隔(margin)。所谓最优分类线就是要求分类线不但能将两类正确分开(训练错误率为0),而且使分类间隔最大。分类线方程为w×X b=0,进行归一化,使得线性可分的样本集为
此时,分类间隔为2/||ω||,使间隔最大等价于使||ω||2最小。满足条件式(1)且使||ω||2最小的分类面称为最优分类面,H1,H2上的训练样本点称为支持向量。
使分类间隔最大实际上就是对推广能力的控制,这是SVM的核心思想之一。统计学习理论指出:最优分类面具有最好的推广性能,这样,求最优分类面的问题可转化为优化问题。通常分3种情况讨论:线性可分、线性不可分及非线性。线性可分与线性不可分情况在线性函数的基础上,将其转化为一个典型的二次规划(quadraticprogramming,QP)问题,如式(2),且存在唯一的极小点,可用标准的拉格朗日乘子法解得。
目标函数
式中αi为与每个样本对应的Lagrange乘子。
对于非线性问题,可以通过非线性变换转化为某个高维空间中的线性问题,在变换空间求最优分类面,仍可用线性分类器完成分类。目标函数变为
神经网络核函数
2.2SVM的模糊隶属度解释
模糊模式识别的方法大致分为2类:直接法和间接法,直接法按最大隶属原则分类,间接法按择近原则分类[5]。在此,将一个SVM分类问题用模糊模式识别方法中的直接法来解释。
如图1、2,最优分类面H对应方程f(X)=0,支持面H1对应方程f(X)=1,支持面H2对应方程f(X)=-1。对于测试样本,如果存在f(X)≥1或f(X)≤-1,则可给出明确的判断结果:
而在区间-1
2.3风险及损失函数
在模式分类的决策中,使错误率达到最小是重要的。但在实际问题中,如故障诊断、癌细胞识别等,有时需要考虑一个比误判率更为广泛的概念——风险[6]。例如,对于故障诊断,如果把正常状态诊断为故障状态,就可能会进行一些不必要的维修,造成一定的损失;而如果把真正的故障状态诊断为正常状态,则会延误维修工作,可能会造成设备的损坏,带来更大的甚至不可挽回的损失。显然,后者的损失比前者要大得多。因此,在进行故障诊断、癌细胞识别等问题的研究时,就应该考虑到这一点。传统的最小风险Bayes决策就是把各种分类错误而引起的损失考虑进去的决策规则。在将SVM应用到这些问题时也应该将这些因素考虑进去。
在决策论中,把采取的决策或行动称为动作,每个决策或动作都会带来一定的损失,它通常是动作和自然状态的函数。可以用决策表的形式表示出来。表1为两类问题的决策表。损失函数为λ(αi,ωj),简化表达式为
λij=λ(αi,ωj)
通常情况下λ11=λ22=0,即如果正确分类,则不存在损失。
对于故障[1][2][3]下一页