你好,欢迎来到! 设为首页 收藏本站
联系电话
论文范文 当前位置: > 写作指南 > 论文范文 >

决策树在汽轮机故障诊断中的应用

时间:2013-09-04 16:10来源:核心期刊网 作者:核心期刊网 点击:
本文研究了决策树挖掘方法在故障诊断中的应用,根据设备的历史运行记录,对其可能的运行状态进行分类,提取出故障特征。实例证明,利用决策树挖掘技术进行知识提取,有效克服了故障诊断系统知识获取的瓶颈,具有实际的应用价值。 1.引言 汽轮发电机组是电力工业中
  本文研究了决策树挖掘方法在故障诊断中的应用,根据设备的历史运行记录,对其可能的运行状态进行分类,提取出故障特征。实例证明,利用决策树挖掘技术进行知识提取,有效克服了故障诊断系统知识获取的瓶颈,具有实际的应用价值。
 
  1.引言
 
  汽轮发电机组是电力工业中的关键设备,其结构复杂,运行环境特殊,因此故障率较高。随着电厂信息化水平的不断提高,越来越多的数据被DAS系统存储到实时数据库中,这些数据包含了机组运行状态的各种特征。怎样从过去的数据中发现有用的信息,把所获得的知识用于过程监控,提高生产过程自动化水平是值得研究的课题。数据挖掘就是从大量不完全、有噪声、模糊的或者随机的数据中提取出有价值的知识。本文将数据挖掘技术应用于汽轮机的故障诊断,具有实际的意义。
 
  2.数据挖掘概述
 
  2.1数据挖掘技术
 
  数据挖掘,也称为数据库中的知识发现(KDD),是指发掘隐藏在堆积如山的数据中的真知灼见。通过数据挖掘,有价值的知识、规则或高层次的信息就能从数据库的相关集合中抽取出来,并从不同角度显示,从而使大型数据库作为一个丰富可靠的资源为知识归纳服务。
 
  2.2决策树算法
 
  决策树是数据挖掘分类方法的一种。决策树的表现形式类似于流程图的树结构,它的基本组成部分包括决策节点、分支和叶子。决策树中最上面的节点称为根节点,是整个决策树的开始。每个分支是一个新的决策节点。每一个决策节点代表一个问题或决策,通常对应于分类对象的属性。每一个叶节点代表一种可能的分类结果。Qulnlan设计的ID3方法是国际上最有影响和最为典型的决策树学习算法。
 
  设S是数据样本的集合,集合中的样本数用S来表示。假定故障类别具有m个不同值,它们将样本分为m个类,用Mi(i=1,2,……m)来表示,Mi表示类Mi中的样本数。则任意一个样本属于Mi的概率为pi=Mi/S,一个给定样本分类的平均信息熵为E(S)=?-∑mi=1?pilog2pi。
 
  设属性A具有n个不同的值,它们将样本划分为n个子集,每个子集Sk中的样本在A上的取值相同。设Sik是子集Sk中类Mi的样本数。则由A划分的决策树分类的条件熵为:?E(S/A)=∑nk=1pk[-∑mi=1piklog2pik]?,其中,pk=SkS,pik=SikSk表示Sk中的样本属于类Mi的概率。熵的变化量称为属性A对分类的信息增益Gain(A),则Gain(A)=E(S)-E(S/A)
 
  具体的操作是:
 
  (1)计算每一个属性的信息增益,选择信息增益最大的属性A作为根结点;
 
  (2)属性A的不同取值将全体样本分成若干个样本子集,按照前面的方法在每一个新的样本集合中选择信息增益最大的属性作为这一级的结点;
 
  (3)重复上面的步骤,直至所有的子集都属于同一个类别。
 
  3.实例分析
 
  3.1数据准备与预处理
 
  本文在现场调研和查阅文献的基础上收集整理了一个汽轮机振动故障数据库,该数据库包含21组故障数据,五种典型故障。我们定义几个在故障诊断中常用的频段作为测试属性:
 
  A10.01-0.49fA20.5fA30.51-0.99fA41f
 
  A52fA63-5fA7>5f
 
  3.2构造决策树
 
  根据上一节介绍的构造决策树的方法,计算表3?1中每一个测试属性的信息增益如表3?2所示。
 
  表3?2属性对应的信息增益
 
  属性信息增益属性信息增益
 
  A?10.24A?50.80
 
  A?20.95A?60.19
 
  A?30.19A?70.36
 
  A?41.88
 
  从表3?2可以看出,属性A4的信息增益最高,因此以A4为根结点构造决策树。对于根结点以下的各级子集按照同样的方法计算信息增益。最后形成的决策树如图3?2所示。
 
  图3?2汽轮机故障决策树
 
  3.3结果评价
 
  为了检验规则的正确性,我们用五组实际的故障数据进行验证。诊断出来的结果如表3?4所示。
 
  表3?4检验样本实际故障与诊断结果的比较
 
  检验样本实际故障诊出故障
 
  1油膜振荡油膜振荡
 
  2不对中+不平衡不对中
 
  3不平衡+碰摩碰摩
 
  4不对中+碰摩碰摩
 
  5气流激振气流激振
 
  从上面的结果可以看出:使用一个数量有限的故障样本集得到的诊断规则还是令人满意的。对于单一故障都够能诊断出来,对于混合故障也能够诊断出其中的一种故障,说明规则的正确率还是很高的。
 
  4.结束语
 
  决策树方法是从样本中学习规则,所以样本集对决策树的形成是至关重要的,但决策树始终在寻找信息增益最大的属性作为当前节点的测试属性,所以具有一定的抗噪声能力,而且对于由噪声产生的分枝,已经有一些树剪枝的方法,以提高决策树独立于测试数据正确分类的能力。通过训练所得出的规则可用于故障诊断,具有一定的实用价值。
 


  核心期刊网(www.hexinqk.com)秉承“诚以为基,信以为本”的宗旨,为广大学者老师提供投稿辅导、写作指导、核心期刊推荐等服务。
  核心期刊网专业期刊发表机构,为学术研究工作者解决北大核心CSSCI核心统计源核心EI核心等投稿辅导咨询与写作指导的问题。

  投稿辅导咨询电话:18915033935
  投稿辅导客服QQ: 论文投稿1002080872 论文投稿1003158336
  投稿辅导投稿邮箱:1003158336@qq.com
------分隔线----------------------------
栏目列表  
推荐论文  
热点论文  
 
QQ在线咨询
投稿辅导热线:
189-1503-3935
微信号咨询:
18915033935
网站简介 核刊总览 普刊专栏 期刊验证 学术答疑 服务流程 写作指南 支付方式 信用说明 联系我们
CopyRight © 2013 All Rights Reserved.
免责声明:本站提供投稿辅导 论文投稿 投稿辅导 核心期刊检索 核心投稿辅导等服务,本站刊载文章仅代表作者观点
并不意味着本站认同,部分作品系转载,版权归原作者或相应的机构;若某篇作品侵犯您的权利,请来信告知:1003158336@qq.com