数据驱动技术对间歇生产过程实时状态监测的研究
姓名:曲爱妍申请学位级别:硕士专业:精密仪器及机械指导教师:陈前20040101
南京航空航天大学硕士学位论文摘要本文主要研究了运用多向主元分析法和核函数法概率密度估计相结合的多元统计过程监控技术对间歇生产过程进行实时的状态监测与故障诊断。用核函数法概率密度估计对间歇生产过程进行实时状态监测的主要优点是它属于非参数法概率密度估计的-,co,不需要数据总体的任何先验知识或是假设而直接基于实测数据样本求出总体的概率分布密度函数,摆脱了对不可靠的先验知识的依赖。本文从这~背景出发,重点是对用核函数法概率估计对间歇生产过程实时状态监测的方法进行较广泛、深入的研究。在传统的实时监测方法中缺乏合适的统计量能够反映间歇生产过程中主元空剧的实时变化。针对这一缺点,本文首次提出用KDE提取主元的概率密度函数用作为实时状态监测图,应用于对间歇生产过程主元空间实时状态监测的问题上。另外,本文也尝试用主元PDF对间歇生产过程的故障批次迸行检测,取得了较好的效果,从而为今后间歇生产过程批次检测的问题提供了一个新的选择。关键词:间歇生产过程,主元分析,多向主元分析,核函数概率密度估计,状态监测数据驱动技术对间歇生产过程实时状态监测的研究AbstractThispaperinvestigatestheapplicationofthemultivariatestatisticalprocessmonitoringandcontroltechnology,whichemploysbothMultiwayPrincipalComponentAnalysis(MPCA)andKernelDensityEstimation(KDE),torealtimeandfaultdiagnosisofbatchproductionprocesses.KDEisastatusmonitoringnon-parametricmethodwhichoniscapableofextractingthepopulation’SProbabilityDensityFunction(PDF)basedsampleonlywithoutanyInadatapdorknowledgeaboutthestatisticpropertiesofthedataregimeKDEthisthesis,itisconductedtheimplementationoftheformonitoringtheperformanceofbatchproductionprocesses.Theconventionalreal・・timemonitoringmethoddoesoftheprincipalcomponents,whicharenotusethenon・-parametricalPDFcapableofindicatingthereal-timechangesofbatchtOproductionprocesses.Toimprovethemonitoringsensitivity,itisforthefirsttimeproposetheutilizationofthePDFoftheprincipalcomponentsinreal・timetomonitorbatchproductionprocess.Besidestheabove-mentionedefforts,thisthesisalsoappliesthePDFoftheprincipalcomponentstodetectthefaultybatchesofthebatchprocesswhichprovidesaandtheresultisencouraging,newoptionforprocessinspection.KeyWords:Batchprocess,Multi-wayprincipalcomponentanalysis,Kerneldensityestimation,Processconditionmonitoring南京航空航天大学硕士学位论文第一章绪论随着社会的进步,科学技术及经济的飞速发展,航空、宇航等各种高科技产品应运而生。这些高科技产品的产生不但表明了人们对自然界领域探索的拓展,而且对系统本身的自动化水平要求越来越高,复杂程度及其所必需的投资也愈来愈大。然而,对于投资如此巨大的复杂系统来说,一旦出现故障,其后果往往是灾难性的。这也是“勇气”号火星探测器故障牵动着全世界亿万人民的目光的一个重要原因。因此对于此类系统来说,其可靠性、可维修性和有效性显得越来越重要。特别是一些特殊的领域,如航空、航天、航海、核工业和化学工业等,由于其特定的工作环境,原则上只许成功,不许失败,对系统的安全性、可靠性及有效性提出了更为严格的要求。我们对于1986年的“切尔诺贝利”核电站事故的历史悲剧还是记忆犹新的[11。这起事故共造成30人死亡,其中28人死于过量的辐射照射,另外2人死于爆炸。然而,这起事故的影响不仅仅至此,由核污染造成的遗传效应更为可怕。在爆炸发生后的卜年内,该地区儿童甲状腺癌发生率还是逐步增加,而且直到1989年这些地方的自然环境力慢慢开始恢复。虽然“切尔诺贝利”核电站事故的直接原因并不能归咎于监控系统,但是可以设想如果有可靠的、有效的监控系统对其进行实时状态监控,遵循严格、科学的管理制度,这场灾难或许可以减少或者完全避免。2003年“神五载人飞船”的成功发射是中国乃至世界航天史上的一件大事,从此中国迈向“太空文明”的新时代。对我国人民来讲,“神五”的成功不但具有重大的经济利益,而且具有深远的政治意义。此次飞船成功的发射与其本身完备的实时监控与故障检测系统是分不开的。在飞船的发射过程中,火箭的待发段和上升段,不管出现什么问题,火箭的故障检测系统都能自检测、自诊断,并且会自动发出信息。所有这些都使我们清楚的认识到在大型复杂系统中引入实时状态监测与故障诊断的重要性。因此,如何提高系统的可靠性及对故障的预警性显得越来越重要。而系统的故障监测与诊断技术则为提高系统的可靠性、可维修性和有效性开辟了一条新的途径f21。此外,对于许多工厂或工业设备尤其是一些特殊行业,虽然出现事故后不一定造成严重的破坏性后果,但若是运行状态不稳定或是一旦发生故障产生的经济影响、社会影响却也十分广泛。对于工业生产过程来说,为避免某些生产过程发生故障而引起整个生产过程瘫痪,造成巨大的经济损失和物质损失,必须在故障发生伊始迅速予以报警,这离不开对系统的状态监测。只有通过对系统的状态监测,才能及时地、全面地掌握系统的运行状态,才能为进一步决策提供依据,从而保证生产过程安全可靠地进行,尽量避免或减少故障的发生及其带来的负面影响。对于设备来说,设备在运行数据驱动技术对间歇生产过程实时状态监测的研究中会发生故障。这些故障会降低生产效率和生产的一致性,导致设备损坏、生产停滞,甚至会危及操作人员的生命。及时、准确地检测并诊断出系统故障是非常重要的。系统实时状态监测己成为一个重要的研究领域,并得到刁;同领域研究人员的关注。凶此建立完备的系统状态监测技术无论是对于工业还是军事、航空、航天等特殊领域都具有非常重要的作用[3,4]。1.2状态监测技术概述状态监测技术是当前国内外迅速发展的一项关于系统管理方面的新技术。这一新技术的主要优点是:可以在系统运行中或基本不拆卸全部系统设备的情况下,掌握系统的运行状态,判定产生故障的部位和原因,并预测、预报将来可能发生的问题。因此,它是防止意外事故,避免计划外停机,实现预知维修的有效措施。同时也是提高维修质量和效率、确保系统设备完好有效的重要手段。由此可见,这项新技术的推』。与实施,有利于克服以往在维修工作中长期存在的“过剩维修”和“维修不足”的现象,从而达到了降低设备寿命周期费用及提高设备综合效率的目的。系统状态监测主要应用于系统设备运行过程中对实时运行状态初步的以别。其主要功能是在系统运行中,对系统的各种状态变量及其信息进行检测,同时需要埘得到的信息进行及时的分析、判断,并结合系统现有特性及其历史正常过程对系统的实时工作状态作出评价的过程。系统状态监测为进一步的故障诊断作必要的信息及数掘准备,是故障诊断系统运作的前提及实现自动化测试、诊断的基础[2]。1.3状态监测技术的意义及应用对系统进行及时的状态监测将有助于分析系统各组成部分运行状态的好蚓:,预测可能存在的事故隐患及不安全因素,合理地进行设备维护与检修决策,实现按设备的状态进行检修,从而降低运行维护成本,增加运行效益,对提高系统运行的安全性、可靠性有着十分重要的意义。系统状态监测的应用范围及其发展前景都非常广,可以广泛适用于各种工矿企业、航空、航天等高科技产业以及用于电力冶金、化工、石油及其机械行业。1.4状态监测技术所面临的挑战在状态监测技术的研究和开发已经取得令人瞩目的进展的同时,~些尚待解决和完善的研究也摆在了我们面前:2南京航空航天大学硕士学位论文目前已经研究出很多状态监测方法,根据系统采用的特征描述的差异形成了不同的状态监测方法类型,可以大致分为两类:基于参数估计的状态监测方法与基于经验知识的状态监测方法。Iserman(1984年)对基于参数估计的状态监测方法作出了完整的描述[5]。这种方法的主要思路是:由机理分析确定系统的模型参数和物理元器件参数之间的关系方程0=,(P),由实时辨识求得系统的实际模型参数百,由0=f(P)和0求解实际的物理元器件参数P,将JD和P的标称值比较从而确定系统足否出现故障及其故障的程度。这种方法的机理都是基于下列假设:故障会引起过程的物理参数发生变化,从而导致模型参数或模型状态发生变化,通过监测模型参数或模型状态,能够检测并珍断出过程中的故障。当采用这类方法对生产过程进行状态监测uJ,人仃j必须知道过程故障与模型参数或状态间的关系。然而对于复杂过程来说,详细的理论模型往往很难得到,即使能够得到,也需要花很大的代价。这限制了基于模型的状态监测方法的应用。现今,随着信息产业技术的飞速发展,工业生产过程的自动化水平不断得到提高和普及。企业在生产过程中能够收集到大量的生产数据。这些数据中蕴含着大量丰富的有价值的信息,如何利用好这些数据,从中提取出有价值的信息是基于经验知识的状态监测方法的研究目标。这种方法的主要思路是:将生产过程中已有的数据信息利用统计方法进行抽象处理,建立起符合生产要求的较为理想的数学统计模型。然后用实时采集的过程数据与用历史数据建立的统计模型相拟合,从而实现在线的实时状态监测,达到监视系统状态的目标。这种方法的好处是:不需要知道系统详细的理论模型。因此,相对于基于参数估计的状态监测方法来说简单的多,是今后状态监测技术发展的趋势。但是,如今现代化的工业系统中包含着大量相互之间极为相关的子系统。各子系统之间既有自己独立的功能,叉相互之间进行紧密耦合。如果对各予系统进行独立监测,可能将相邻子系统的正常反作用误作故障信息而经常性发出错误警报,也可能因为故障信息被耦合作用掩盖了而漏报非正常运行状态。为了能够对整个系统进行实时、准确的状态监测,客观上需要一个能够“包罗万象”的一体化监测系统。多元统计过程监控(MultivariateStatisticProcessContr01)技术在一定程度上正是由于市场的这种需求而发展壮大起来的。多元统计过程监控技术能够对复杂大系统的运行状态给出总体指导意义的信息。多元统计过程监控技术主要由主元分析法(PrincipalComponentAnalysis,PCA)、偏最小二乘法(PartialDensityLeastSquares,PLS)、多向主元分析法(Multi-PrincipalComponentAnalysis,MPCA)和核函数法概率密度估计(KernelEstimation,KDE)等多元统计学中的各种方法组成。这些统计方法最初应用在社会学和经济学领域内,七十年代末,Kowalski等人首次将多元统计监控技术应用于化工领域[151。其后,多元统计过程监控技术得到了迅猛的发展,成为当今世界状态数据驱动技术对间歇生产过程实时状态监测的研究监测与故障诊断方法研究的主流。本文主要研究多元统计过程监控技术之~多向主元分析法对间歇生产过程进行实时状态监测的方法。1.5间歇生产过程及其特点现代化的工业生产过程根据工艺流程的特点及产品的输出方式可分为连续生产过程、间歇生产过程和离散生产过程。连续生产过程的主要流程是:物料从原料输入口进入反应炉后,经过反应、换热、分离、流体输送等各类连续的化工环节,直至生成最后的产品。它的主要特征表现为原料经过各个专用设备后转化为连续的产品,且每个工艺流程都运行在稳定的工作j状态,典型的化学生产过程如合成氨、炼油等。离散生产过程的产品是分批制造的,各部件的制造都相对独立,如机械、电子、汽车工业等工艺的生产流程。f司歇生产过程相对来说比较复杂,依据其自身具体的工艺流程特点又可划分为两大类:一类是典型的间歇生产过程:主要特征是物料进入某个釜式反应器后,按一定的工艺条件,并经历一定的时间(在这段时I到内往往没有物料流出)达到某种要求的指标后,再排出物料进行后续加工过程。它的主要特点是分批装料和卸料。因此其操作时间由两部分组成,一是进行反应所需要的时间,另一是辅助操作时间,包括装料、灭菌、卸料、清洗等所需时间之总和。这一类的生产过程通常是按一定批量,有间断的、有周期的进行,故又称为批量生产过程。间歇生产过程应用十分广泛,主要涉及到农药、染料、涂料、颜料、粘合剂、试剂和高纯物、食品和饲料添加剂、化学药品(原料药)和日用化学品、功能高分子材料、生物化工等多类化工行业。另一类是连续生产过程与间歇生产过程相结合的过程,也常被称为半间歇半连续生产过程。半间歇半连续生产过程是指在反应进行的过程中,或是反应物连续加入,而产物则一次性排出的过程:或是反应物一次加入,而产物则连续不断排出的过程。它兼有连续生产过程与间歇生产过程两种生产过程的特点,并紧密结合。如连续流加的混合搅拌反应釜fCSTR)、煤造气炉、煤焦炉制气与联产甲醇等工艺的生产过程。相对于连续生产过程与离散生产过程,间歇生产过程主要有如下特点:・生产操作是按配方规定的顺序进行的;・设备的柔性连接好即生产装置容易组合;・产品是批量输出的;●工艺条件的变化比较显著,某些参数的控制要求高;・现场开关量相对较多,许多生产操作需靠人工干预来完成。由于间歇生产过程的对象特性复杂,精确机理建模十分困难,且信息处理方式复杂,数据量及计算量都非常大,而且存在大量不确定的因素,因此能够圆满解决怕j歇4南京航空航天大学硕士学位论文生产过程的控制与决策问题通常会遇到很大的困难和风险,这对间歇生产过程性能监视和故障诊断方面提出了严峻的考验。1.6本文的工作本文的工作主要有如下几个方面:l,基于多向主元分析法对间歇生产过程建立起来的数学模型,研究对间歇生产过程实时状态监测的问题。2.用工业生产过程中间歇生产过程的实际模型对参数法概率密度估计和非参数法概率密度估计的实时监控技术进行对比实验,从而进一步验证了非参数法概率密度估计应用于间歇生产过程实时状态监测的可靠性。3.针对非参数法概率密度估计中缺乏相应的统计量监测间歇生产过程主元空间内实时状态变化的特点.首次提出将主元PDF图戍用于间歇牛产过稗的实时峪控,并且用实例对此统计量的引入进行了验证。此外,本文也对间歇生产过程批次检测问题增加了一个新的统计量PDF用于监测主元空间内的变化,从而为间歇生产过程检测批次时提供了一个新的选择。4,本文的工作既为间歇生产过程的实时监测提供了更可靠的系统运行状态信息,又为基于系统状态的维护提供决策参考。对间歇生产过程的实时状态监测技术有较大的实用价值。1.7本文的组织第一章是全文的绪论。第二章重点介绍了多元统计监控技术及其相关理论。第三章着重阐述了概率密度估计的两种方法及其相关的实现方法。第四章主要阐述了用KDE对间歇生产过程进行实时状态监测的相关技术及方法。第五章是仿真实验。第六章着重介绍了DETeC监测软件系统开发的一些内容。第七章是本文的总结与展望。数据驱动技术对间歇生产过程实时状态监测的研究第二章多元统计过程监控技术及其相关理论2.1多元统计过程监控技术概述多元统计过程监控技术是首先在社会学、经济学和化工领域研究应用的一类数据驱动技术[16,17]。七十年代末,首次被Kowalski等应用于化工领域。随后,多元统计过程监控技术逐渐延伸至其他的工业过程中。由于在工业大系统中,各个变量与此系统中的其它变量都有直接或间接的关系。因此,我们对大系统进行状态监测时要处理很多的多重相关的检测变量信息。在此处理过程中,多元统计过程监控技术的模型降阶压缩技术逐步显示出其独有的优点,并得到越来越多的关注。在多元统计监控过程中,取得能够反映整个过程情况的数据十分重要,它直接关系到多元统计监控过程的好坏。我们既需要得到关于过程输入、输出、产品质量情况的数据,也需要得到反映过程运行状态情况的数据。多元统计过程监控技术正是通过对系统过程历史数据的统计分析结果与实时得到的过程数据进行分析比较,以发现过程的变化,并追寻引起这种变化的主要原因[14]。因此,应用多元统计过程监控技术的一个重要前提是需要大量的系统过程的历史数据。现代化的工业过程大都配备了计算机辅助数据采集系统,高速发展的计算机系统和数据库系统为多元统计过程监控技术提供了越来越丰富的数据资源。但隐藏在这些数据资源中的大量有用信息还没有充分地开发出来。只有有效地应用多元统计过程监控技术,才能将隐藏在过程数据中的大量有用信息开发出来并将其变成财富。为了充分利用这些已有的数据资源以监测生产过程的运行状态和产品质量,多元统计过程监控技术被用来对大量过程变量和产品质量数据等进行处理,建立系统的数学模型,从而提取能反映生产过程内在本质变化的特征参数用于过程监控f18,19]。用这种技术对生产过程的历史数据进行分析、监控的主要目的是把丰富的数据资源的转化为可提高产品质量、降低成本的有用信息[20]。另外,还应该指出的是:多元统计过程监控技术分析的结果需要用过程操作人员的经验、知识进行解释,需要根据过程的机理去理解、运用。因此数据的采集、统计分析计算、图表只是统计过程监控技术的一部分,更重要的是需要有管理、生产人员的参与。多元统计过程监控技术是用来促进和保持企业健康生产的有效工具,但并不是医治生产中所有弊病的万能药。它只是可以帮助人们认识和了解工业过程中存在的问题,认识生产过程的内在特性、变化规律及寻找生产过程发生异常的原因【21.22]。6南京航空航天大学硕士学位论文2.2多元统计过程监控技术的主要内容多元统计过程监控技术主要由主元分析法、偏最小二乘法和其它多元统计学中的各种方法组成[4]。由于本文主要研究的是间歇生产过程的实时监控问题,考虑到间歇生产过程本身数据特点的特殊性,对其采用多元统计过程监控技术进行数学建模时只涉及到应用多向主元分析法。但是主元分析法又是多向主元分析法的基础。因此,下文仅对主元分析法和多向主元分析法进行详细的介绍。对于多元统过程监控技术中所包括的其它各种多元统计方法请读者参考其它相关文献。2.2.1主元分析法主元分析法最早由Pearson于1901年提出的,Hotelling于1933年对主元分析法进行了改进,使其成为目前被广泛应用的方法[141。该方法主要应用丁连续生r’过程的状态监测与故障诊断,它是用来研究如何将多指标的问题转化为较少的互不相关的综合指标的一种重要方法。这些较少的综合指标为原来多指标的线性组合,且能够提供原有指标的绝大部分信息。这样就将高维空间的问题转化到低维空间去解决,从而使问题变的更为简单、直观。因此它是一种数据压缩和信息抽取的多元统计分析技术[23]。主元分析的主要目的是实现数据的简化、压缩、建模、奇异值检测、主元的选择、分类和预报。假设已知测量数据矩阵为x…,其中m代表采样的次数,胛代表测量变量的个数。在对测量矩阵进行主元分析法之前,首先要对测量矩阵的协方差矩阵进行谱分解。因为主元分析法的数据压缩过程实质上是数据矩阵x协方差矩阵的谱分解过程[24,25]。cov(X):—Xr—Xcov(X)p.=A,P,i=1,2,3,”f1)其中,eov(X)代表测量矩阵X的协方差矩阵;P,代表协方差矩阵的标准正交特征向量:A,代表协方差矩阵的特征值,则矩阵X的特征值为^=√石。将矩阵X的所有特征值按从大到小的顺序进行排列,分别为五。,A:,也…・~,且a>五:>五>……>五。。各特征值所对应的特征向量也依次排列为v.,v:,7∥…・~∥7数据驱动技术对间歇生产过程实时状态监测的研究墨娶对应于特征值五,,^:,^……^的特征向量依次为u,,u:,u,……u。。令,竹一lu=【Ul,U:,113・・…・U。]∈R删”,S=diagal,0"2,・・・q,)∈R”埔,V=[Vl,V2,V3--…-V。】∈R”…’,则根据矩阵的奇异值分解的相应定理可知,矩阵X可分解为:X=USV。f31其中,S矩阵对角元素的值就是矩阵X的奇异值,所以S矩阵又称为奇异值矩阵。若令T=U×S,P=V,则X可表示为:X=TP。=tlPf4-t2P;+…+triP:(4)式中,T为得分矩阵,P为负荷矩阵。各个得分向量t.∈R……,和各个负荷向量P.∈R“1之间都是正交的,且2范数为1。其数学表达式为:It,t,=0ht,=li≠Jf-JIp,p,=olp,p,=1i≠J扛J式中,t,主要提取采样数据间的关联信息;P:主要提取变量间的关联信息。x的第一个主元t。表征数据块中最大方差变化的信息,x的第二个主元t2表征数据块中第二大方差变化的信息,依此类推,x的第f个主元t,表征数据块中第i个方向方差变化的信息。若(4)式两侧同乘以P,,则Xp,--t,,这说明了得分向量t,实际上是数据矩阵x在它所对应的负荷向量P.方向上的投影。pl代表x变化最大的方向,p2与Pl垂直且代表x变化的第二大方向,依此类推。由于工业生产过程中的变量之间几乎都存在着不同程度的关联,所以数据矩阵x的变量间一定存在着不同程度的线性相关性。主元分析法的数据压缩过程就是在主元空间中,选择前面几个最大的特征值作为系统的主元,用柬解释数掘巾绝大部分信息的变化[26,27】。与此相对应,X的变化也主要体现在能够解释大多数数据变化的最前面的几个负荷向量的方向上。假设前,个主元能解释数据中大部分的变化,则数据矩阵X可以表示为:X=tlP:+t2Pi+…+trP:+Er≤rain{m,门}(5)式中,E为误差矩阵,表示X在pr+l到P。负荷向量方向上的主要由测量噪声引起的次要变化。它主要解释的是x中随机噪声和模型中的误差信息,并且希望在二乘意义上要尽量小。从上式可以看出,测量矩阵X经主元分析可以分解为两部分,一部分主要由前r个主元线性表出的主元空间,即:8南京航空航天大学硕士学位论文(6)后一部分主要由后0一r)个主元线性表出的误差空间,即E_∑t,Pji=r+l(7)上述又可以理解为:X的一部分信息投影到主元子空间中(又称为PCA空间),用x来表示,能解释测量矩阵X中的绝大部分信息;另一部分投影到残差空间中,用E来表示,能解释测量矩阵x中的次要信息的变化。如果系统中存在着大量的冗余,那么前,个主元确定的主元空间就能抽取测量矩阵x中的绝大部分信息[28]。所以x又可以表示为:X=X+Ef8、由上述分析可以看出,在信息的抽取过程中,主元个数,的确定起着至关莺要的作用。它的选择直接影响到模型的精度和鲁棒性。若选择的r较大,模型可能被噪声分量污染;若选择的r太小,模型精度低,漏报率和误报率随之增加。因此,我们必须根据实际情况选择出尽可能最佳的主元个数r。确定模型中主元个数的方法很多,如平均根法、方差阈值法、裂棒法等[29]。其中,在实际过程中最常用的主要有两种方法:一种是经验法:主元个数的选择主要依据主元空间中前,个主元所概括测量变量信息的大小(r≤min(m,"))。前,个主元所概括测量矩阵x信息的大小可由前,r}J个主元的方差贡献率矾=∑^/∑^来表示,.,为∑中非零元素的个数,则我们确定主元个数,可根据方差贡献率巩的大小来大概估计[24]。当然,经验法中由于具有很多人为因素,因此不可避免的产生许多人为误差。为了尽可能的减少人为误差,要求估计人员必须具有相当强的工程实际经验和熟练的故障诊断经验。另一种是交叉校正法:主要方法是将一组数据分成两部分,一部分用来作为训练数据,另一部分用来作为试验数据。对于训练数据样本,一次残留一个或几个样本,然后用其它的样本去训练模型。这种方法一直重复进行直至每一个样本都要被残留过一次,然后计算出每一个因子的实验误差。最小实验误差和的位置与我们所需的最优主元个数相对应[30~33]。总而言之,利用主元分析法对工业生产过程的历史数据建模的主要过程如下:9数据驱动技术对间歇生产过程实时状态监测的研究1.首先要对原始数据矩阵x进行标准化处理,将其化为均值为0,方差为1的数据矩阵,其数学表达式为:x’=丽X-E(X)√妇r(x)X=U×SXV7:TP7(9)~其中,E(X)为X矩阵的均值,Var(X)为X矩阵的方差。为了简化起见,我们下面仍用X来表示标准化后的测量矩阵。2.其次,要对标准化后的数据矩阵x进行奇异值分解,求出得分矩阵T与负载矩阵P:3.确定主元的个数r,使测量矩阵x与选用,个主元对其的估计文之间的残差矩阵E达到二乘意义上的最小,整个过程的数学表达式为:X=X+E=tlPf+t2P:+・・・+trp:+E,≤min(m,肝)综上所述,借助于主元分析法能够使测量数据变量的维数得到大幅度的降低,从而能够在大量的相关的随机过程数据中提取少数几个信息密度很高的主元来描述系统的特性,成功的解决了原始数据空间维数过大,变量间自相关严重,干扰未知,信噪比低等问题。主元分析可以通过非线性迭代部分最小二乘算法fNon.1inearIterativePartialLeastSquares,简记为NIPALS算法)[16】来计算。NIPALS算法分别计算矩阵的各个主元。它首先计算第一个得分向量tt和第一个负荷向量Pl,然后将它们的外积从矩阵x中减掉,得到一个误差矩阵El。再从误差矩阵EI中计算x的第二个得分向量t2和第二个负荷向量P二,即:El=X—ttPfE2=El—ttP:这种计算一直持续下去,直到矩阵x的所有主元都被计算出来为止。NIPALS算法可以总结为:①从X中任选一列x,,并记为tI,即tl=x,;②计算Pl:Pi=trx/trt.;③将Pl的长度I)j--4L:Pi=Pi/lip。忆④计算tl:tl=Xpl/prpl;10南京航空航天大学硕士学位论文⑤将步骤②中的tl与步骤④中的tl做比较,如果它们一样,则算法已收敛,计算停止,如果它们不一样,回到步骤②。上述算法只是对计算第一个主元而言的。对于计算其他主元,算法是一样的,只要将上面算法中的x矩阵变换为相应的误差矩阵即可[14】。为了深入地考察过程变量的统计特性,常用到两个重要的统计量统计量和9统计量。它们的定义如下:T2=>-'trt,=(文P,)7(虹)=r文’虹flI(10)Q=∑tit,=∑eje,=(x一文)7(x一文)』一I,=l(11)r2为保留的前,个主元所对应的得分向量的标准平方和.表示了每个采样在变化幅值上偏离x的程度,它表征了主元模型内部变化的一种测度。Q为其余的∽一r)个主元所对应的得分向量的标准平方和,也可以认为是残差矩阵E中每行的平方和,表示了每次采样在变化趋势上与x模型的误差,它表征了模型外部变化的一种测度[34,35]。利用主元分析法对工业过程数据多元统计分析过程中所提取的r2和Q统计量,可以实现以下两个统计量的在线监测:・712统计量在置信限内的变化趋势;・Q统计量在置信限内的变化趋势,即SPE统计图。2.2.2多向主元分析法多向主元分析法最早由w01d于1987年提出的[28],主要应用于间歇生产过程的状态监测与故障诊断。与主元分析法相似,用它同样是研究将多指标的的问题转化为较少的互不相关的综合指标的一种重要方法。唯一不同的是,处理数据的结构不同。与连续过程相比,每个间歇生产过程都有一个确定的操作周期,而在每一个操作周期内,间歇生产过程都是按顺序重复操作的[361。每个间歇生产过程的数据集合构成了一族测量变量的时间轨迹,多个间歇生产过程的时间轨迹的集合就构成了描述间歇生产过程的数据集合。间歇生产过程除了必须反映每一过程的采样次数和过程变量的个数外,还必须反映每一历史过程的批次。因此间歇生产过程的样本数据具有三维数据的特点。多向主元分析法正是用来处理这种具有三维立体数据特点的生产过程的状态监测与故障诊断,它正是从分析两维数据矩阵的主元分析法延伸来处理三维数据矩阵的。同样,它也是一种数据压缩和信息抽取的多元统计过程监控技术。11数据驱动技术对间歇生产过程实时状态监测的研究多向主元分析法的主要思路是首先将能反映间歇生产过程运行情况的三维数据矩阵按照某种方式进行切割、排列,形成一个降维后的新的二维数据矩阵。然后对这个维数大为增加的降维后的二维数据矩阵进行主元分析,从而得出能够反映间歇生产过程运行情况的统计特性。最后,分析间歇生产过程运行情况的统计特性,从而实现对间歇生产过程的状态监测与故障诊断。假设已知间歇生产过程时间轨迹的数据集合用三维数据矩阵墨。,。。来表示,其中:』表示间歇生产过程的个数也称之为批次,,表示每个间歇生产过程测量的变量数,K表示每个间歇生产过程的数据样本点数,如图1.所示。数据块的每个水平切片J×K表示特定的间歇生产过程中所有的变量在不同时刻的测量值所构成的矩阵,每个垂直切片,×,表示特定时刻不同间歇生产过程(批次)ee不同变量的测量值所构成的矩阵。由于在对间歇生产过程的数据矩阵进行x=∑t,of=1p,+里(12)式中,t,为得分向量,第i个元素表示第f个间歇生产过程,并概括了这个过程中的总体变化,它表征了整个间歇生产过程中不同批次过程之间相互关联的信息。p,为载荷向量,各个元素表示对应变量在对应采样时刻的权重,它总结了过程变量在它们的平均轨迹附近的变化。从式中可以看出,多向主元分析法与主元分析法一样,将数据按最优形式分成两个部分:∑t,@p,为系统部分,代表间歇生产程的主要变f。I化信息,与批量、过程变量和时间有关。E为系统的噪声和误差部分,代表间歇生产过程数据中的次要变化,同样要求在最小二乘意义上尽可能小。,为保留的主元个数,12南京航空航天大学硕士学位论文与主元分析法相同,它大小的选择同样可以采取经验法、交叉效正法等来决定。(算法如图2所示[37])。凸PcA分衅—7、,77/x/l,一7/-/,’、{P//|77『【E!7、鹳何It1/#≯?Jp+{£㈠l图2.MPCA的算法/,,l㈠/7I7.IfMPCA方法简化了多维数据结构的分析,同时又解决了间歇生产过程统计控制的特殊性问题。经验证明,它是一种可靠的、实用的、线性建模的方式。MPCA的NIPALAS算法如下:第一步,数据预处理。将每列的均值去掉并除以每列的标准差。x0=(x舭-Xjk)/再式中:叉。为k时刻,变量的均值:Vm为k时刻J变量的方差[19]。(13)第二步,任选圣中的一列做为t。第三步,①垦=墨②P=E7t③P=P/IIPIl④t=垦P将步骤②中的t与步骤④中的t做比较,如果它们一样,则算法已收敛,进入⑤:否则回到①:⑤一E=垦一toP数据驱动技术对间歇生产过程实时状态监测的研究第四步,回到第一步计算下一个主元。上述算法中的矩阵运算如下:垦7(/,i,t)=垦(f√,女),P=量7t斗P(k,,)=∑曼7(f,,,七)t(f)i=l雁扣棚2,rt=一EP斗t(f)=∑∑垦(f,/,k)P(k,_,)JcIk=l—X=t0P一翼(j,J,七)=t(i)P(j,k)(14)多向主元分析法可以用来解释过程变量在它们的平均轨迹附近的变化。将平均轨迹从每个过程变量中去掉(算法第一步),起到了消除过程数据中的主要非线性关系的作用[24】。用多向主元分析法对间歇生产过程进行数学建模以后,就可以用多元统计过程监控图,如丁2统计图[38]、预估误差SPE统计图及B统计图等来显示出间歇生产过程运行的情况,并根据已有经验做出相应的判断。为了深入地考察用MPCA分析间歇生产过程数据的统计特性,常用到三个重要的统计量,它f1"]的定义如下:1.主元模型在第i个批次的HotellingT2统计量可以定义为:笮=(T,S-1)妈,S-1)。(15)它主要通过主元模型的主元向量模的波动来反映多个过程变量的变化情况。其中,T。表示第i个批次保留,个主元的得分矩阵,s为前,个主元对应的特征值组成的对角阵。与PCA相类似,r2统计量同样也是由得分向量的标准平方和计算得到的,也就是说,丁2统计图表征了MPCA内部变化的一种测度。与PCA唯一不吲的是,它表征了每个批次在变化幅值上偏离MPCA数学模型的程度。2.主元模型在第f个批次的预估误差.孓PE,可以定义为:跚=∑E(i,,)2.旦I=1(16)它主要刻画了第i个批次的测量值对主元模型的偏离程度。SPE统计图实际上是Q统计量在置信区内的变化,它由展开后的残差矩阵E每行的平方和计算得到的,表示了每个采样批次在变化趋势上与MPCA模型的误差。也就是说,卯E统计图表征了MPCA模型外数据变化的一种测度。14南京航空航天大学硕士学位论文3.除了丁2统计图、SPE统计图之外,还可以用取统计量来表征测量值从物理空间到主元空间的Mahalanobis距离。主元模型在第f个批次的n统计量可以定义为:D。=Ti.,S“一1、,,/(,一1)2(17)它主要刻画了第i个批次的测量值从物理空间到r个保留主元所张的空问的Mahalanobis距离[39-411。综上所述,利用多向主元分析法对间歇生产过程数据进行多元统计分析过程中所提取的T2、9和n统计量,可以实现以下三个统计量的在线监测:・7’2统计量在置信限内的变化趋势,即7’2统计图;・Q统计量在置信限内的变化趋势,即SPE统计图;・a统计量在置信限内的变化趋势,即坟统计图。2.3多元统计过程监控图的置信限多元统计过程监控图是监视生产过程统计量变化趋势的有效工具,并且是判断系统运行状态的有力武器。但是,如何察觉系统运行异常及判断的依据是什么则是本小节所讨论的问题。上面我们一直提到对过程数据经主元分析法或多向主元分析法处理后在线监测的是统计量在置信限内的变化趋势。那么究竟置信限是如何得到的呢?多元统计过程监控图的置信限是作为正常过程与故障过程的分界线存在的。它是根据现有的已知为正常的生产过程的历史数据估算出来的。以现有的已知为正常的生产过程的历史数据作为训练数据,用PCA或MPCA分析处理后,建立起此生产过程的数学模型,并计算出其相应的训练数据的统计量。根据这些正常过程的统计量,我们就可以估算出正常过程统计量的95%和99%控制限作为系统正常运行的95%和99%的嚣信限。如果新的生产过程的统计量的值超出了置信限,我们就可以认为在此过程中出现了一些异常变化或某类故障[361。但是,并不是新的生产过程的统计量的值只要超出了置信限,系统就一定会出现故障。我们这里主要应用了统计学原理,从统计学的角度进行判断。如果新的生产过程数据的统计量越出95%的置信限,那么我们仅有95%的把握认为此时系统发生异常,也就是说在统计学上还有5%的可能性过程还处于正常运行情况。同样,如果新的生产过程的统计量超过99%的置信限,我们仅有99%的把握认为此时系统发生异常,同样,也就是说在统计学上还有1%的可能性过程还处于正常运行情况[241。因此,如果系统的统计量超出了置信限,并不能盲目地认为系统一定出现故障。在实际应用中,要将分析结果与故障诊断工具相结合,同时结合过程的实际情况才能做出较为正确的判断。数据驱动技术对间歇生产过程实时状态监测的研究2.4多元统计过程监控技术的故障诊断原理既然我们想用多元统计过程监控技术实现对过程的故障渗断,那么用该技术进行故障诊断的原理又是什么呢?也就是说,怎么用多元统计过程监控技术实现对过程的故障诊断。经过归纳,以下图来显示多元统计过程监控技术的原理:图3.多元统计过程监控技术的故障诊断原理上图中,模型系统主要是用多元统计过程监控技术的统计方法对过程的历史数据建立的主元模型,把它做为整个系统状态的参考。实际系统是测量数据投影到模型系统中主元空间部分,为了增加可比性,需要采用与模型系统相同的正规化方法和投影方式。将模型系统和实际系统相比产生的残差做为我们故障检测的对象,最后结合系统本身特性及一定的方法(如:阈值逻辑法、人工神经网络法、贝叶斯决策函数法、专家系统法等1实现系统故障的分离定位。2.5多元统计过程监控技术的发展方向及其所面临的挑战随着检测技术和计算机技术的飞速发展,生产过程中能够被测量和处理的过程变量越来越多。同时消费者对产品质量的要求也会越来越高,关于产品质量的各种定量和定性的性能指标也会越来越多。这决定了今后多元统计过程监控技术在工业生产过程中的应用将越来越广泛、普遍。多元统计分析方法可以帮助人们从大量的数据中找出反应过程运行情况的关键信息,从而能及时地检测出过程运行中出现的各种问题。对多元统计分析的结果进行解释离不开过程知识,只有将统计分析结果与过程运行知识要结合,才能及时有效地诊断出过程中存在的问题。因此多元统计过程监控技术的一个发展方向是智能多元统计过程监控,即将多元统计过程监控技术与人工智能的一些方法如专家系统、模糊系统、神经元网络等相结合。这样就可以将多元统计过程监控技术的威力更充分地发挥出来。多元统计过程监控技术的另一个发展方向是自适应多元统计过程监控技术。在理想情况下,一个过程的正常操作情况应该是平稳的,即过程的均值和协方差结构是不变的。但在很多实际过程中,过程变量的均值和协方差结构在正常的运行情况下也会16南京航空航天大学硕士学位论文随时间漂移,这通常是由于设备的磨损和老化、原材料的变化和传感器的偏移所引起的。同过程故障相比,这种偏移是缓慢的,并属于过程正常运行情况,但这种偏移会随时间累积而引起误诊断等。对于这类正常过程漂移,需要调整过程变量均值和协方差结构。Wise等(1999)得用指数加权移动均值和指数加权移动方差来进行主元分析,但指出如何适当地处理过程偏移尚需进一步研究[421。随着经济水平和消费水平的提高,人们对产品的需求越来越趋向于多样化,这就要求企业必须从过去的单一化大批量生产转向多样化的小批量快捷生产,以适应市场需要。单一化大批量生产往往以连续过程生产方式进行,连续过程生产方式的优点是可以进行大批量生产,缺点是产品转向比较慢。连续生产过程生产的产品,其单位附加值一般较低。小批量快捷生产往往以间歇生产方式进行,它的优点是产品转向快,产品单位附加值高。随着市场需求的多样化和多变性,间歇生产过程将会在上业生产中占有重要地位,因而对适应于间歇或半间歇生产过程的控制方法将是多元统计过程监控技术发展的另一方向。多向主元分析、三线性分解、平行因素分析等方法应用于f司歇生产过程的监控,但这些方法本身还有待于进一步完善[24,42,431。2.6本章小结本章主要介绍了将多元统计过程监控技术用于过程故障诊断的一些相关知识和方法。多元统计过程监控技术用于过程故障诊断的方法很多,为了本论文研究的需要,我们仅介绍了适用于间歇生产过程数据建模的方法一多向主元分析法。由于多向主元分析法是从主元分析法演变过来的,所以也简单介绍了主元分析法。另外,为了实现多元统计过程监控技术对过程的故障状态的判断依据,我们详细介绍了有关正常过程置信限的确定。同时,讨论了多元统计过程监控技术的发展方向及所面临的挑战,为今后的研究指明了方向。17数据驱动技术对间歇生产过程实时状态监测的研究第三章概率密度估计法3.1参数法概率密度估计的概述参数法{{}}翠罾反估计是在假定样本总体的分布己知的情况F,推导出统计特征量的概率密度分布,从而根据其统计特征量的概率密度分布能够求得它们相对应的统计量的置信限。例如:若令矿=my7W~Y,Y—Nd(o,∑),W~%沏,∑),即Y服从d维的正态分布,而W服从d维的Wishart分布,那么由统计学定义可知:掣一r/2~F(d,撒一d+1)。X.一Ⅳ。(∥,∑),运用上面的原理,假设测量数据矩阵X(mx月)有m个采样点分别为fx,Xz…x。^而x,为将要观测的采样点。上述Xl,x2,…,X。,x,均是拥有n个变量的采样向量。如果:贝0:叉~N。(“,2/m)(,n—1)S~体0(,”一l,z),从而得知:x,一又~Ⅳ。(o,(!!生)∑)√熹(卜-)~iv(o,z)。如果定义:r/2=(三鲁)(x,一-)7S一’(x,一蜀,删+l。。那么可知:—(m-—n).善≮~,慨脚一1一栉+1),力(m—1)这样就使得:罴.=鲁(x,一叉)rs一。(x刚m—llm+1。(XfX)rS-,(Xf--) ̄岩F∽㈣)。’’r一.)~F(n,rtq-iq),上ilii就是用参数法摧导出多元统计的统计量r2的概率密度分布。从推导过程可以看出,假设数据样本总体服从正态分布,贝?T2统计量是服从的F分布。南京航空航天大学硕士学位论文同理,我们可以计算出统计量Q~竺坐口(n/2,(州一n一1)/2),e统计量是服从mBeta分布的。这样我们就可以根据统计量的分布情况,计算出他们各自的置信限[44,45】。综上所述,参数法概率密度估计主要是基于样本本身总体分布假设的基础上,进行分析以推断出统计量分布情况来得到它们各自置信限的过程。3.2核函数法概率密度估计—-KDE的概述核函数法密度估计最早是由Fix提出来[46],是目前应用最广泛、数学研究最多的非参数法概率密度估计法之--[47】。核函数法概率密度估计与传统的参数法概率密度估计不同,它实质上是直接对已知的数据样本进行统计分析从而得到样本总体的经验概率密度分布。核函数法概率密度估计是利用直方图作为求取样本的经验概率密度分布的近似方法[24],其具体作法如下:假设数据样本为一维的,n个数据样本的样本值分别为xl、x2、…、“。1)找出数据样本的最大值与最小值,并且求取它们的极差R=max[x,卜min[x,12)按样本值的大小把"个数据样本等分为珊组,根据组数m和极差决定组距h。组距:h=R/m:式中m的大小没有硬性规定。一般来说,主要是根据经验来确定的。当样本容量胛较小时,川应小些;反之,/.N应取大些。这样,就以组距h的大小,将数据样本均分为m个小区间。3)若把样本值落入每个区间的个数记为v,(i=1,2,…,m),则可以计算出样本值落入各小区间的频率厂。:/:=V,/n(i=1,2,…,州)。由于数据样本的抽取是独立的,由概率的统计学定义可知,当样本容量n足够大且每个小区间足够小时,f,近似等于随机变量x落入小区间[r。一f。】的概率,即,zP{tJ-I<x≤f.)(f_1,2,…,m),其It,,f』_1]为任一小区间。4)画直方图。在xy平面上,以小区间【,f-t。]的长度为底,以÷为高作矩,f,一l卜j19数据驱动技术对间歇生产过程实时状态监测的研究形,则得到直方图。图4.样本直方图在每个小矩形尽量小,且点数足够多的情况下,小矩形的面积近似等于样本值落入小区间的概率,即:——L(r。一,,_I)=,zP(tH<xs,,),t,一,,一I由上可知,直方图大致地描述了数据样本的概率密度曲线,而又因为样本与总体是同分布的,因而直方图就大致的描述了该样本所代表的数据总体的概率密度分布。当样本容量月足够大,而且等分的小区间也非常小时,这种描述更接近x的概率密度值。由此,我们可以得到最简单的概率密度估计公式:““7;,、l(落在同一区间内的点数)H一(该条格的宽度)根据上述原理,我们设随机变量为X,则可以用样本点落在x的±h邻域内的样本点数占样本容量月的比例作为该随机变量在X处概率密度的估计值,即:夕(x)2l蜘去P(x-h<X<x+h)口于是,我们可以用落在z的6邻域内的样本点占样本总数的比例作为该随机变量在x处的概率密度的估计值,即:夕(x)=÷[落在区间@一h,x+h)gS的样本点的个数】。Zrlrl为了更加直观地对样本总体进行概率密度估计,定义了一个加权函数w为:fw(x)=1/2—1<z<11w(x)=0则:其他20南京航空航天大学硕士学位论文衲=i1刍"百1w(竿)(18)其中”为样本点总数,X,为随机变量的第i个样本。这就是核函数概率密度估计的雏形了,Silverman称之为naiveestimator。naiveestimator虽然简译,但足还是不能够完全满足对概率密度估计的要求【46】,需要做进一步的改进。在实际应用中,一般都采用适当的核函数板x)来取替naiveestimator中的加权函数w,从而得到了一维的核函数密度估计表达式。夕㈤=三nh喜足(竿)=向(19)、。式中,h被称为窗口宽度或平滑因子。将单变量的核函数概率密度函数估计公式进行直接推广,可得到多变量核函数联合概率分布密度函数估计的公式为:缸)。南善删弋x-X,))(20)其中,X=(■,而,一j%J是m个变量组成的向量。H为m×Ⅲ的平滑因子矩阵[48】。实践表明,核函数板x)的形式对/(x)的拟合精度基本没有影响,可根据需要进行选择。为了简化选择平滑因子计算的方便,一般选取对称的连续的概率密度函数。平滑因子H的计算是KDE的关键【47】。一种解决方案是“单样本轮换法”(Leave.one.out)。平滑因子由基于单样本轮换的交叉校正法来决定的。当选取的核函数是对称连续的函数时,平滑因子矩阵噍.H=啊:心:啊。h2,%。h。lh。2…%。是一个Ⅲ×”的实对称矩阵,因此,式中需要计算re(m+1)/2个不同的因子。确定多个因子,计算工作量十分繁杂,实用上不现实。实验证明,将数据进行球化规范以后,用单参数的平滑因子矩阵可以满足一般的应用要求:即H=h2I。计算平滑因子矩阵的关键是根据数据特点选择合适的代价函数。在实际应用中,典型的代价函数为积分均方差交叉校正法(MeanIntegralSquaredError,MISE),即:MISE{fC,H))=efE?(x,I-I)一厂(x)]2dxr21、若以N(x,盯)为核函数,则此“单样本轮换法”的代价函数可以写为:21数据驱动技术对间歇生产过程实时状态监测的研究MISE{fC,A))一斋旨∑N(X.一Xn(n—lJ暑‘J,h2)+』二LyN(X,一X.,2h2)+—LN(0,2h2)‘”一l式中x。,x,是样本集,Do-{XhX2,.,Xn}中的第i和第,个观测数据点的向量。最小化该代价函数,就可求得平滑因子h。由核函数法概率密度估计公式(20)便可得到m维空间任意一点x的联合概率密度函数[4]。如果数据分布较均匀时,用此方法可得到较好的平滑因子。但是实际应用中,不同的系统数据往往具有不同的复杂特征,因此需要根据不同的情况选取不同的代价函数。若系统数据的分布特征有边缘分布拖尾、多离散聚集区、小方差密集等现象,在这些情况下,若仍以积分均方差交叉校正法来做为代价函数,计算出平滑因子的值往往比较小,使得由KDE计算出来的PDF产生许多尖锐的高峰,从而使得PDF的几何形状失真,影响了基于PDF置信区的统计推断精度。为了解决这个问题,出现了几种形式稍有不同的代价函数,以适应复杂的数据特征。自适应法代价函数可做为边缘分布拖尾数据的平滑因子代价函数,该方法使用平滑因子局部加权的办法来平衡边缘低密度地区数据的贡献,能获得合理的PDF值。而在离散聚集区情况下,可采用有偏的MISE法,放弃少许精度以换取更小的总体误差。另外,还有其它的方法,详细情况可见参考资料[48]。此外,为了简便起见,在很多情况下我们直接用经验公式五‰∽而蝴揣(22)来计算平滑因子也能得到很好的结果。在核函数法概率密度估计中使用此方法确定平滑因子可以节省大量的计算时间,这正是我们对过程进行实时监测所需要的。因此,本文在做实时监测实验中确定平滑因子所采用的就是此方法。值得注意的是:KDE仅适用于变量维数较低的样本,当样本的变量维数较高时,即使数据的样本点很多,散落在高维数据空间中仍显得非常稀疏。因此我们应用KDE对工业生产过程的数据进行分析或实时状态监测时,一定要在采用PCA、PLS或MPCA对系统数据降维后的低维数据空间(一般是1~5维)中才能得到较好的应用[26]。南京航空航天大学硕士学位论文3.3参数法概率密度估计与KDE的比较本文所讨论的概率密度估计的方法不管是参数法概率密度估计还是KDE都是基于经验知识的状态监测方法。将这两种方法应用于系统过程的状态监测,它们各有其本身所固有的优缺点。基于参数法概率密度估计的状态监测方法存在的问题有:参数法概率估计的状态监测方法必须预知样本总体的分布,它对系统的状态监测与故障诊断都是建立在样本总体服从某种分布的假设的基础上的。如果样本总体偏离了这种假设,故障诊断的结果极有可能产生很大的误差,误报或是不报的情况时有发生。因为参数法概率密度估计是利用样本总体的分布假设反推多元过程统计量的分布情况。而对于一个实际系统来说,了解系统数据样本的概率密度分布情况是极为困难的甚至是不可能的。当系统发生故障时,不仅引起模型参数的变化,而且还可能引起模型结构的变化。这样,就可能导致数据样本总体分布的变化。而且,系统故障发生的时刻,系统故障引起系统模型结构和参数变化的形式是不确定的,而对不确定时变、变结构的问题,目前的参数法概率密度估计仍难以胜任。KDE对系统的状态监测方法是直接基于数据样本求出样本的概率密度分布情况,不需要预知数据样本总体的分布情况,不需要对数据样本总体分布情况做假设,因而,用它对系统进行状态监测与故障诊断的结果更为准确。但是,在实际应用过程中,由于需要对大量的历史数据进行分析、处理,而且需要及时、准确的预报系统的实时状态,对计算机的性能要求比较高。随着科学技术的飞速发展,这些问题将逐步得到改善。另外,KDE对于变量维数较多的样本仍有很多的不足,需要做进一步的研究、完善。3.4本章小结本章主要介绍了参数法概率密度估计和非参数法概率密度估计一KDE的工作原理及其具体实现的步骤。在理论上,对采用两种方法分别进行故障渗断的优缺点进行了较为详实的比较,得出了初步的结论:KDE由于不需要对数据样本总体分布情况进行假设,因而用此方法对间歇生产过程进行实时状态监测的可靠-陛要比非参数法概率密度估计好,而且误报或不报现象不易发生。k,)(数据驱动技术对间歇生产过程实时状态监测的研究第四章用KDE对间歇生产过程进行实时状态监测4.1间歇生产过程实时状态监测的具体实现近年来,间歇生产过程实时状态监测的问题引起了越来越多研究者的关注。因为在实际生产过程中,有些间歇生产过程的生产周期较长,如果等整个间歇生产过程完成以后才检测出系统发生异常,往往已经造成了较大的经济损失。所以及时检测并诊断出系统故障是非常重要的。但是在间歇生产过程进行中,从当前时刻到该批次结束之间变量的信息是不完全的,随着生产过程的进行才慢慢充实起来,只有在此批次结束后,才能得到完全的变量信息。可是,我们应用MPCA对间歇生产过程的数据进行分析时,需要知道各个过程变量的全部信息。因此,对间歇生产过程进行实时状态监测时,必须对除终点时刻以外的任何一个采样时刻变量的不完全信息进行预估【27]。Nomikos和Macgregor于1995年提出了三种处理间歇生产过程进行中不完全信息的方法[49]:・第一种方法,假设间歇生产过程将来的未知的测量值与已知训练数掘的甲均轨线保持一致。由于训练数据已经进行过正规化,也就是晚用数值“零”来添补所有的未知测量值。・第二种方法,假设间歇生产过程将来的未知的测量值偏离平均轨线的值与间歇生产过程当前时刻的偏离值保持一致。也就是说用间歇生产过程的“当前值”来添补所有的未知测量值。・第三种方法,将间歇生产过程未知时刻的测量值按缺省值处理,然后对己知时刻的测量值运用最小二乘法原理,使模型在此时刻的预估误差取最小,求其得分向量。但是值得注意的是,用这种方法对未知的测量值进行预估时,如果知道的变量信息太少,按最小二乘法计算出来的得分向量非常大,使系统出现不能解释的假报。因此,~般要求在间歇生产过程至少进行了大约lO%周期以后,知道的变量信息较多时,这动处理未知信息的方法才能得到较好的应用与推广[501。由于上述方法处理间歇生产过程未知信息各有优缺点,因此在实际生产过程中,可以采取优势互补的方法,根据过程数据的特点采取两种或三种相结合的方式来处理间歇生产过程的未知测量值。本文将间歇生产过程当前时刻未知的,而又需要添补或按缺省值处理的测量值称为预置测量值。对预置测量值采取上述第一种或第二种方法进行处理后,则得到间歇生产过程任一k时刻的得分向量为:t2rX。。P,2324南京航空航天大学硕士学位论文式中:X~为1XJK维批次数据经预置且重排后的新的测量数据向量:P,为JKXr维保留r个主元模型的载荷矩阵。采取上述第三种方法对预置测量值进行处理的过程中,对预置测量值的求解采用了最小二乘法原理进行处理。其主要的推演过程如下:首先我们假设一个代价函数,令:I,=去(x…,々一t:,^P咄)7(x….★一t:,女P¨);然后使,对各个时刻的得分向量t:。求偏导,即令要=0;优,o艨骼懒懒髓舭黼t。=簪;那么就对预置测量值采取按缺省值进行处理后,则k时刻的得分向量为:t“=((P似T■,★)‘1P“Tx…,^)7(24)式中:X。k为截止到k时刻的测量数据,P。为k时刻保留,个主元的载衙矩阵[50]。我们对预置测量值进行处理的目的就是要得到间歇生产过程进行中的实时统计量,通过对这些统计量的信息进行分析,就可以判断系统此时的实时状态。通过以上三种方法对预置测量值进行处理后就可以计算出间歇生产过程k时刻的实时误差向量为:e女2X。。一乞ti,^p¨’1(25)在间歇生产过程的实时运行中,常用的统计量主要有:1)k时刻的预估误差定义为:SPEk=∑e女(,)2:2)k时刻的物理空间到主元空间的Mahalanobis距离n统计量定义为:E=tj.^S。1tr,kI(I-r)/R(12-1)。为了利用已建立好的主元模型对间歇生产过程进行实时的状态监测,需要利用已知正常运行的间歇生产过程的批次数据确定过程正常运行的控制限。这包括确定主元模型SPE统计量的控制限和n统计量的控制限。当主元模型的SPE或D,统计量超出它们的控制限时,就可以认为过程中出现了不正常情况。求控制限的传统方法就是采用参数法概率密度估计。如前所述,参数法概率密度估计是建立在对数据样本总体分布做一定假设的基础上的。若我们假设经过标准化后的数据样本服从正态分布,那数据驱动技术对间歇生产过程实时状态监测的研究么经过推导计算后得到的统计量SPE是服从,分布的,而皿统计量则是服从F分布的。根据SPE统计量和取统计量的分布情况,我们就可以确定相关的置信限:1)SPE的置信限:即E。=(y/2u)z2一。。,方差:口为置信度:式ep:“为样本均值;v为样本2)D;统计量的置信限:砬。:f,I-rr(,2—1)/(,(,一r))。由上可知,参数法概率密度估计确定控制限的方法要有一个重要的前提,样本总体必须服从假定的分布。如果数据样本偏离了假定的分布,那么就会使状态监测的结果产生不能解释的畸变[36】。但是在实际生产过程中,大多数系统由于各种各样随机因素的影响,产生的数据样本不可能完全满足己定分布的假设。因而用这种在样本数据总体分布进行假设的基础上计算出来的控制限对生产过程进行实时状态监测时很容易引起误报或不报。为了克服参数法概率密度估计的缺点,LarsGrcgersen丁1997年提出了采用非参数法概率密度估计一KDE来确定间歇生产过程统计量的控制限[51]。与参数法概率密度估计相比,KDE的突出优点是不需要数据样本总体的任何先验知识或假定样本总体服从正态分布而直接基于实测数据求出样本总体的概率密度分布(ProbableDensityFunction,PDF)。因此,与参数法概率密度估计相比,将KDE用于状态监测与故障诊断方面能在很大程度上能减少误报,使生产过程的实时状态监测与故障渗断的结果更为准确、可靠。在此基础上,我们做了进一步的研究。4.2主元PDF的实时监测在研究前面介绍的间歇生产过程实时状态监测的统计量,我们可以发现:玖统计量计算的是从数据的物理空间到主元空间的Mahalanobis距离,表明它主要反映的是数据点到主元空间投影点数据本身距离的变化。而SPE统计量则计算的是测量数据与已建立好的过程数据模型的预估误差,表明它主要反映的是数据模型中残差空间内的变化。由此可见,这两个统计量都没有反映主元空间内本身的变化。MacGregor在文章[18,52]中介绍了一种参数法反映主元空间内的变化。它的主要原理是:在实时的系统中,主元的得分向量是随着时间的变化而变化的。如果假设数据总体上服从正态分布,可以推导出第,个主元的实时得分向量是服从如下分布的(JohnsohWichem1988)【53,54,55]:and±(S(r,r)B…_2_…2,a(I一1)2/川“其中,,表示批次的个数;S表示的是系统主元的特征值,S(,,,)是s中第,个特征值;口1.f,一2一1)/2。表示服从自由度分别为1,∞2-1)/2和a的Beta分布。26南京航空航天大学硕士学位论文但是在实际系统监视的过程中,我们发现当系统故障较小的情况下,随着时间的变化单个主元得分向量几乎没有什么大的变化。用故障批次的数据所得到的得分向量与建模所用正常批次的训练数据计算出来的得分向量几乎相差无几,且珍断结果很不稳定,容易出现误报。另外,此方法也比较复杂。当系统保留r个主元时,就需耍而r张实时监测图。且在大多数时间内,故障批次只可能在其中的一张或几张主元监测图中有反映,对于小故障在主元监测图上基本上反映不出来。这样,就增加了我们判断的复杂性。再加上参数法概率密度本身固有的缺点,更增加了监测主元的难度。为了能够观察主元得分向量随时间的变化,我们又希望改进现有的方法,用非参数法概率密度估计一KDE来实现对主元得分向量的状态监测。我们将用KDE得到的实时主元得分向量的概率密度称之为“主元PDF”。利用主元PDF对间歇生产过程进行状念监测是本人研究工作的主要贡献。在本文中,主元PDF的监测分为两部分。一是在同一间歇生产过程中,对主元PDF的实时状态监测。这主要反映的是间歇生产过程实时主元空间内的变化。另一是用主元PDF对间歇生产过程进行批次检测。这是因为在实际系统中,我们不仅要在间歇生产过程运行过程中进行状态监测,而且也需要在间歇生产过程运行完成后对此间歇生产过程的状态进行进一步的批次检测。用主元PDF对问歇生产过程批次的检测可以与现有的712检测图进行状态互补,体现了信息融合技术的优势。当前,对系统的状态监测与故障诊断趋向于采用多种方法,多种手段来联合完成。这样的好处是,在一个系统中,此种方法对系统状态比较敏感;在另一个系统中,可能是另一种方法的监测结果更加的理想一些。这种多种方法、多种手段的信息融合方式能够使系统的状态结果更加稳定,极大的避免了系统故障的误报。下文详细介绍了间歇生产过程主元PDF的状态监测问题的实现过程。4.2.1间歇生产过程实时主元PDF状态监测的实现首先,我们介绍了间歇生产过程主元PDF的实时状态监测问题。实时的主元PDF是在前文介绍的Nomikos和Macgregor所提出的三种补点方式得到间歇生产过程实时主元得分向量的基础上,通过KDE计算得到的。我们总结出用KDE确定间歇牛产过程实时统计量主元PDF及其确定相应控制限的方法与步骤。用KDE确定间歇生产过程实时统计量主元PDF的主要计算步骤归纳如下:1)从间歇生产过程历史数据中,选取,个已知为正常的间歇生产过程的批次数据,作为我们模型的训练数据。因为间歇生产过程具有周期性的特点,所以该训练数据具有三维立体的数据结构。按MPCA方法对间歇生产过程数据进行建模的步骤,首先将间歇生产过程训练数据矩阵沿时间轴方向降维展开成二维的数据矩阵。数据展开降维后,对此数据矩阵的数据进行预处理:沿批次方向,将二维数据矩阵进行正规化。正规化的目的主要是将数据矩阵每列27数据驱动技术对间歇生产过程实时状态监测的研究化为均值为0、方差为1的归一化矩阵。这样做是为了消除过程中的主要非线性关系,便于提取过程的重要信息。2)对降维后的训练数据矩阵正规化后,就需要确定系统保留主元的个数r。确定系统保留主元个数的方法主要有两种:经验法和交叉效正法。由于交叉效『E法需要将一组数据分成两部分,然后用其它的样本去训练模型。这种确定主元个数的方法对矩阵列向量是时间的连续过程是很有效的,但是对于批次不是很多且数据结构长宽比例非常悬殊的间歇生产过程数据来说,此方法艉定的结果不是很理想。所以,我们一般用经验法来确定间歇生产过程的主元。3)确定好系统保留主元的个数后,就可以运用MPCA建立起系统的主元模型,分别求出系统主元模型的主元得分矩阵和残差矩阵,将系统数据分为两部分:一部分是由,个主元线性表出的主元空间,另一部分是残差空间。由于间歇生产过程的训练数据是已知,不存在补点问题,所以间歇系统主元模型就可以直接分解为:X=T,Pj+E。41训练数据的主元得分矩阵T,的数据结构如下,l,lt1.2t2,2“f2,T-=tz,1将主元得分矩阵沿批次方向将每个批次保留r个主元的行向量‰^扣.,,,r],运用多元核函数法概率密度估计,就能够计算出其训练数据矩阵中各个批次的概率密度,吼%=魄.,厂T,:,^,,…,^】7。其中,^.表示训练数据矩阵中第f个批次的得分向量运用核函数法概率密度估计所得到的此批次的概率密度值,Vi∈[1,,]。上步中,核函数法概率密度估计中最重要的一步是平滑因子的选择。平滑因子选择的好坏直接关系到系统状态监测的结果。因此需要根据系统数据的特点,选择合适的代价函数,最小化该代价函数,计算出系统的平滑因子,从而得到系统的平滑因子矩阵(方法在上章中已经介绍过了,这里不再重复)。5)确定系统状态的置信限。运用KDE计算出』个批次训练数据得分向量的概率密度值,即B,。然后用常规的方法估算出IN歇生产过程正常运行的95%平n99%的控制限,这就是我们对过程进行实时状态监测时判断系统故障的主要依据。至此,我们完成了对间歇生产过程进行实时主元PDF状态监测的前期28南京航空航天大学硕士学位论文准备工作一系统建模过程。下面主要介绍的是对过程运行中的实时主元PDF的状态监测问题。6】对过程进行实时状态监测就要在过程运行中实时采集过程的状态数据。我们将实时采集的过程数据作为测试数据。在这里强调的是测试数据要与训练数据进行同样的重新排列与正规化,这样做的主要目的是便于训练数据与测试数据之间的比较。7)由于本文讨论的是实时系统,所以要求必须及时、有效的处理已知的数据信息。一般情况下在系统运行过程中实时采集到的批次数据信息都不完整,因此我们要对其预置测量值采取上述的三种补点方法的一种或几种。补点后对测试数据矩阵采用MPCA投影到已建立好的主元空间内。之后,采用相应的计算公式(23或24)计算出实时运行的得分向量t,。,t“表示的是对预置测量值补点后k时刻保留r个主元的得分向量。8)用多元核函数法概率密度估计计算出实时的得分向量t,。k时刻的联合概率密度值,也就是间歇生产过程k时刻的主元PDF值/h。9)画主元PDF实时的状态监测图。根据系统主元PDF随时间的变化情况,画出间歇生产过程的实时主元PDF状态监测图。纵坐标是实时得分向量的概率密度值,为了简便起见,我们称之为主元PDF。横坐标是时间轴。1o)分析实时监测图。以训练数据估算的概率密度95%,99%置信限为依据,观察测试数据估算的概率密度是否超出置信限,以此为依据来判断系统是否出现异常。如果测试数据的概率密度在某时段越出95%的置信限,那么我们就有95%的把握认为此时系统发生异常。也就是说在统计上还有5%的可能性过程还处于正常运行情况。同样,如果测试数据的概率密度超过99%的控制限,我们就有99%的把握认为此时系统发生异常。通过对实时监测图的分析,并将分析结果与故障诊断工具相结合,能够比较容易地找出引起过程变化的原因。由上述可知,实时的主元PDF监测图是指过程运行中实时计算出来的主元得分向量按多元核函数法概率密度估计计算出来的随时间变化的联合概率密度。因此,它主要反映了主元得分向量随时间变化的特点,也即主元空间内的变化。采用主元PDF,不但可以简化主元空间内监测图的数目,而且由于它观测的是r个主元联合的概率密度估计,因此可以更加清楚的反映出主元空间的变化。实验证明,采用主元PDF监测图比用参数法概率密度估计所采用的单个主元的实时监测图对系统故障的诊断结果具有更加准确,更加稳定的特点。至此,我们完成了过程实时主元PDF的监测步骤,实现了用KDE反映间歇生产过程主元空间内统计量的变化情况。作为能够反映过程实时状态情况的另外两个统计29数据驱动技术对间歇生产过程实时状态监测的研究量:以和SPE,它的建模过程与主元PDF的极为类似。在这里本人也简单介绍一下。这两个统计量的MPCA建模过程与主元PDF的相同,不同的是从上面第4步以后。为了简便,相同的步骤不再赘述。以下仅简单介绍其不同的过程:用MPCA法完成了对系统历史训练数据的建模后,就可以利用系统的主元得分矩阵Tr和残差矩阵E计算其相应实时的B和印E统计量。1)由系统训练数据的主元得分矩阵T,可计算出,间歇生产过程训练数据矩阵的n统计量为:皿,=T』,S“一T.,,/(,一1)2,以。为任一批次的训『练数据矩阵的n统计量。则D,,=[D。D'2,n,…D。,]7为,个批次的iJll练数据矩阵计‘算出来的n统计量的集台。2)由系统的残差矩阵E可计算出,间歇生产过程训练数据矩阵的SPE统计量为:SPE,I=。¨×e“T。e¨为第i个批次在第k个采样时刻的残差向量,sPE陆为任一批次的训练数据矩阵在k时刻的预估误差。则SPEl,SPE?=SPE2.:●SPEI.2SPEI.fSPE2.rSPE2.2sPE}?SPE,,SPE,rSPEz为,个批次的训练数据矩阵计算出来的肼氇统计量的集合,其中列向量表示的是批次方向的统计量,横向量表示的是时间方向的统计量。3)运用KDE,计算出,个批次训练数据的功统计量、各时刻预估误差即E的概率密度函数。,0。,向量表示的是KDE估算出的每个批次n统计量的概率密度值。,个批次的各时刻预估误差矩阵,品B表示的是KDE估算出其各个时刻各个批次的SPE统计量。4)依据KDE计算出的各个批次的概率密度fTD。,和,品岛,可以估算出间歇生产过程正常运行的95%和99%的置信限,这就是我们对过程统计量实时监测时判断系统故障的主要依据。5)同样,根据实时采集数据统计量的联合概率密度值随时间的变化情况,可以画出间歇生产过程B和SPE统计量的实时状态监测图。纵坐标描述的是n、SPE统计量的概率密度值随时间变化的值,横坐标是时间轴。6)分析实时监测图,以便对系统运行状态做出恰当、正确的判断。30南京航空航天大学硕士学位论文值得注意的是:运用KDE对实时过程进行状态监测与故障诊断也有它本身所固有的缺点。用KDE对控制限的选择需要的已知正常批次的训练数据较多,而且己知正常批次训练数据的数目越多,估算出来的置信限越准确。但是在实际过程生产中保存下来的正常批次的数据毕竟有限。虽然采用“自举再采样法”来产生所需的样小,可适当弥补这一问题。关于“白举再采样法”的详情可参见[57】。但是,对那些一个过程需要运行很长时间的间歇生产过程来说,大量的数据样本仍然存在很大的难度。这也是今后我们需要解决的问题[581。4.2.2间歇生产过程PDF批次检测的实现本小节我们详细介绍一下用KDE实现间歇生产过程批次的检测问题。与间歇生产过程实时状态监测一样,对间歇生产过程进行批次的检测是对该批次产品合格的有利保障,也是对间歇生产过程实时状态监测效果的有利的补充。传统的多元统计过程监控技术对间歇生产过程批次的检测是建立在一定的假设的基础上,剀而其诊断结粜的误报率较高。我们用KDE对间歇生产过程的批次检测进行改进,特别体现在批次的主元PDF的检测上。为了与实时主元PDF进行区别,批次的主元PDF我们称之谓“PDF”。原则上对间歇生产过程批次的检测是在过程已经进行完,所有过程状态信息已经完整的基础上进行的。因此它比对间歇生产过程进行实时状态监测的过程要简单的多,最主要是体现在批次检测不存在对预置测量值进行补点的问题上。用KDE对间歇生产过程PDF检测的步骤如下:1)系统建模的过程。对间歇生产过程的历史数据建立MPCA数学模型,得到主元模型的得分向量矩阵:of2rT/=2)对间歇生产过程主元得分向量矩阵沿批次方向按行向量阻1t啦…t。】进行核函数法概率密度估计。得到各批次主元得分的概率密度值,即写,=[^,矗,…^],‘表示的是i个批次的PDF值,ViC[1,I]。3)根据各批次主元得分向量的概率密度值,利用KDE估算出其关于批次的95%和99%的置信限,以作为批次检测时的依据。4)将间歇生产过程,个批次的测试数据正规化后,投影在已建立好的主元空间内,从而得到测试数据的主元得分矩阵:数据驱动技术对间歇生产过程实时状态监测的研究“,l21:,=f2l,2.25)运用KDE对测试数据主元得分L按行的方向进行概牢密度估计,可以得到测试批次主元的PDF值,即f;,=[/T,/T1,…/T,]。6)画间歇生产过程批次检测的PDF图。在PDF批次检测图中,纵坐标是对应批次主元的概率密度值,横坐标是批次。也可以理解为批次的PDF值随批次的不同而不同。为了更加直接对正常批次与测试批次PDF值的对比,我们一般将PDF批次检测图分为左、右两部分。左边显示的是训练批次的PDF值,右边显示的是测试批次的PDF值,中间用明显的标志隔开。7)分析间歇生产过程的批次检测图。以训练批次估算PDF的95%,99%置信限为依据,观察测试批次的PDF是否超出控制限,以此为依据来判断此批次的产品是正常还是故障。值的注意的是,当测试批次的PDF超出了95%可信度置信限时,可以有95%的把握确信过程中出现了不正常情况。也就是况在统计上有5%的可能性过程还处于正常运行情况。当测试批次的PDF超出了99%可信度控制限时,可以有99%的把握确信过程中出现了不正常情况。通过以上的分析,我们就比较清楚的了解了主元PDF图在间歇生产过程中的重要作用和具体的实现过程。从而为我们今后对间歇生产过程不管是进行实时的状态监测与故障诊断还是批次的检测提供了一个新的工具、新的方法和新的选择。4.3本章小结本章是本人研究工作的重点,研究了对间歇生产过程运行状态的实时监测问题。本文在LarsGregersen将KDE引入到间歇生产过程实时状态监测问题的基础上进行深入研究,着重探讨了用KDE实现间歇生产过程系统建模后主元空问内随时I'BJ的变化。对间歇生产过程实时运行状态的监测引入了新的统计量一实时的主元PDF。另一方面,本章又将PDF统计量引入到对间歇生产过程批次检测的问题上来,从而可以与同为测量批次主元空间内变化的r2统计量相互补充。用多个统计量同时对系统进行状态监测,可以提高系统故障诊断的可靠性,也可以使它们所提供的信息互相补充校核。32南京航空航天大学硕士学位论文第五章仿真实验5.1青霉素生产过程仿真模型的介绍本文的仿真实验所采用的数据是青霉素生产过程的过程模拟仿真数据。青霉素的生产过程是典型的间歇生产过程,具有间歇生产过程的一般特点。间歇生产过程的一般流程如下图所示:原料产品图5.间歇生产过程的生产流程首先,原料要经过一定的预处理。原材料的预处理过程主要包括原材料的选择、必要的物理与化学方法加工、培养基的配制和灭菌等。此外,还需要对生物催化剂进行制备。这包括菌种的选择、扩大培养和接种、酶催化反应中酶的纯化、酶的固定化等。然后,将原料及生物催化剂按一定的比例投入到生化反应器进行相应的化学反应。生化反应器是原料进行生化反应的核心设备,也是整个间歇反应过程中最重要的步骤。它为细胞或酶提供适宜的反应环境以达到促进细胞生长和进行反应的目的。反应器的结构、操作方式和操作条件对反应原料的转化率、产品的质量和生产成品有着密切的关系。同时反应参数的检测与控制对生化反应过程的顺利进行也是十分重要的,因此合理的对生化反应器进行监控是现代化监控技术发展的方向,也是对间歇生产过程进行监控的重点和难点。最后一步,是对反应后的物质进行必要的分离及精制。其目的是用适当的方法和手段将含量甚少的目的产物从反应液中提取出来并加以精制以达到规定的质量要求。另外,为了提高原料的利用率,节约成本,可以将未反应完全的物料重新进入循环,与一定比例的原料混合重新投入到生化反应器中进行新一轮的生化反应。这样,我们就完成了一整个的间歇生产过程。下一个间歇生产过程又得重新开始,加入物料重新进行生化反应。所以,我们说间歇生产过程是在一定的周期内按配方重复进行的。根据上述分析我们可以看出,整个间歇生产过程可以以生化反应器为核心,分别把反应前与反应后称为上游加工和下游加工。上游加工主要完成原料的配制及催化剂的制备;下游加工主要完成产品的分离及精制。由于~些实验条件及实验设备的限制,本文的实验所采用的是青霉素反应过程的数学模拟,它是由美国Illinois技术学院AliCinar教授提供的。工业过程的数学模拟是二十世纪六十年代发展起来的一种新的实验方法。这主要由于用过程的数学模拟来31数据驱动技术对间歇生产过程实时状态监测的研究作试验研究可省略大量的装各及物料,比起用实际生产过程或中间试验模型作研究来说,不论人力还是物力都要节省得多。另外,在实际系统上,有些输入参数不能随意变更,或者由于计量困难不易测得准确;但是在数学模型上改变或增加参变量很方便,所以最便于寻求最佳化的方案。因此,生产过程的数学模拟对我们的实验有很大的好处,特别是在我们应用多元统计过程监控技术需要的历史正常过程的数据量较大时,而且又需要对其引入故障时有它独有的优势。在实际生产过程中,青霉素反应过程的主要过程流程图如下图所示:图6,青霉素反应过程流程图在青霉素生产过程中,原料的预处理主要包括酸、基料和培养基的制各过程。青霉素的反应过程主要是在反应罐中进行的。因为青霉素的发酵过程对反应温度、酸度等反应条件要求非常严格。因此,对反应罐中反应环境的合理控制直接关系到产品的质量。其中,反应罐中的温度是通过从冷水罐或从热水罐加入冷水或热水来维持的,以确保达到适合反应的最佳温度。为了增加反应物的接触面积,提高反应物的利用率,还需要在物质反应的过程中不时的进行搅拌。按配方达到一定的反应时间,反应基本完全后,就可以对反应后的物质进行分离和精制,以提取目的产物青霉素。对整个青霉素反应过程进行分析后,发现在整个反应过程中,主要的变量有如下几个:反应生物的增长率、青霉素的生长率、葡萄糖的使用率、耗氧率、二氧化碳的生产率和反应34南京航空航天大学硕士学位论文物体积的变化率等。由此,根据工业过程数据模拟的建立原理,抽象出来的反应过程的动力学方程式如下表所示:表1.青霉素反应过程的动力学方程式f生物增1j长率dX『at=趟一tX/V)dV/dtaP/dt2蚌}rx—K_P一婶阶a妒}斑S9),。’1砭l・rC,7(x)青霉素的生长率(P)葡萄糖s・+s3/KIK叩X。+C?的使用率(S)耗氧率(CL)二氧化碳的生产率(c02)ds/dt-一pxiYxll一p—x/Y,l|一mlx+Fsr/z一(s/v)az/dtdCI/dr=一ux/Y.~一t.zM,x/r,~一moX+芷h(cI。一c‘)一(cz/v3蠢z/atK。一n瓯婿。阶。dCO】肛c—relax/at+吒X+码反应物体积的dZ/dt;F’F。m—Fb。变化率fv)根据表中的反应动力学方程式,建立起青霉素生产过程数据模拟的数学模型。该模型可以对青霉素生产过程的输入参数如酸的流量、培养基的流量、PH值等条件在一定范围内进行选择,也可以对一些外部参数如通风量、搅拌率和反应酶的供应率等条件进行设定。另外,此模型为了保持反应罐中的温度恒定,还特别设定了对反应罐可以选择进行或不进行PID控制。此外,在此模型中还可以对系统引入预定故障,产生故障批次的数据。这正是我们采用多元统计过程监控技术对工业生产过程进行实时状态监测与故障诊断所非常需要的。此模型中所有这些方面的条件都很好的满足了我们的实验要求。经过多次的实验表明,用此数学模型产生的数据与实际工业过程的数据极为相近,为可靠的工业过程的仿真数据。本文仿真实验所采用的仿真数据不管是训练数据还是测试数据均为本模型所提供,且得到预期研究结果。1S数据驱动技术对间歇生产过程实时状态监测的研究5.2用多元统计过程监控技术对青霉素反应过程的状态监测青霉素的生产过程是典型的间歇反应过程,具有间歇反应过程的一般特点,如:分批操作,原料成分不易控制,反应机理复杂等。此反应过程也主要包括四个组成部分:①原料预处理过程,即底物(酶催化反应中的作用物)或培养基(发酵过程中的底物及营养物,也称营养基质)的制备过程:②催化剂的制备过程;③反应物的反应发酵;④产品的分离与精制过程。其中,原料的预处理过程中的主要变量有1.热水的流量,2.酸的流量,3.培养基的流量,4一冷水的流量;催化剂制备过程中的主要变量有5.通风量,6.搅拌的功率,7.反应酶的供应率,8.反应热;发酵过程中的主要变量有9-PH值,10.温度;产品分离过程中的主要变量有ll一培养基的浓度、12.D0%饱和度、13.生物量、14一青霉素的浓度、15.培养基的液位、16-C02的浓度。由此可知,此青霉素反应过程的数学模拟中,我们可以测量使用的是16个变量。为了叙述的方便,我们分别对这16个变量进行了如上所示相应的编号。多元统计过程监控技术的核心都是对己知正常过程的历史数据进行统计分析,从而对工业过程进行数字建模。由于在间歇生产过程中存在大量的多重相关的检测变量,一个变量与其它变量之间都存在着直接或间接的关系。因此多元统计过程监控技术的模型降阶压缩技术能够得到很好的应用。由此可知,选择间歇反应过程已知为『F常过程的历史数据作为统计分析的对象是整个监控过程的基础,也是其中最重要的一步。为了得到较好的实验效果,我们对青霉素生产过程的数学模拟进行仿真实验,并选取了其中已知为正常的400个批次作为训练数据集。这个训练数据集是一个三维数据矩阵,分别由400个批次、16个变量和100个采样点所组成。16个变量分别与上面的16个变量相对应。由于此反应一般需要进行400个小时,如果采样时间间隔小一些的话,虽然可以得到较好的效果,但是所涉及到的计算量太大,计算速度较慢。而我们对过程进行实时状态监控时对计算的速度要求很严格,要求能够及时、准确的反映出过程的运行状态。因此,只能牺牲一点精度来满足实时系统速度的要求。大量的实验表明,以精度换取速度对整个系统的状态监测与故障诊断的影响不是很大,同样可以得较好的效果。训练数据集选取好了以后,将其按时间方向展开,降维成二维的数据矩阵,此数据矩阵的维数为400×1600。对降维后的数据矩阵进行正规化,这样做的主要目的是消除过程中的主要非线性关系。运用多向主元分析法的工作原理,建立起青霉素反应过程的MPCA参考数学模型。在建立MPCA模型的过程中,最重要的一点是必须合理的确定主元个数。经计算,当MPCA模型保留4个主元时,主元方差的贡献率为6l%。虽然当模型保留4个主元时,主元方差的贡献率只有百分之六十几,但是当我们考虑到我们使用交叉校验法选取主元个数是对展开后的训练数据矩阵,它的160036南京航空航天大学硕士学位论文个列向量都作为系统的变量,而且这些变量是间歇生产过程历史数据按时间方向展开的,彼此之间相关性极强。因此,主元方差的贡献率达到61%已能满足我们的要求。本文主要研究的是对青霉素反应过程实时状态监测的问题。由上面的介绍可知,青霉素反应过程如同大部分间歇生产过程一样,生产的周期很长。如果我们等一个生产周期结束后才检测出系统故障,往往已经造成了不可挽回的经济损失和人力损失等。因此,对间歇生产过程及时发现异常,及时作出处理,是现代化市场竞争的必然结果,也是现代化多元统计监控技术努力发展的方向。这正是我们必须对间歇生产过程进行实时状态监测的原因。但是由于过程进行当中,此批次的数据没有测量完令,因此需要对预置测量值进行添补。针对过程数据不完全的问题,MacGregor提出了i种预置测量值的补点方法,并且建议最好在实际实验过程中根据采样数据本身的特点,采用两种或三种组合的方式对预置测量值进行补点。在本文中,我们充分考虑了他的建议,在反应过程前10%周期内可以有选择的采用第一种方法或第二种方法对预置测量值进行添补;在反应过程进行了10%周期之后,我们知道的变量信息较多时,用第三种方法对预置测量值进行处理,即对预置测量按缺省值处理,使其误差在最小二乘意义上达到最小。这样,我们就完成了用多元统计过程监控技术对间歇生产过程进行状态监测与故障诊断的准备工作。如下部分就是对我的研究工作进行检验的重点。5.2.1参数法概率密度估计与KDE的对比实验我们实验的目的之一是为了了解参数法概率密度估计与KDE对间歇生产过程故障的敏感程度及准确度。因此,首先我们采用两种方法对间歇生产过程的实时状态监测与故障诊断效果进行了对比实验。我们分别仿真产生了三组故障数据,每组都仿真了五个故障批次。同时在这三组数据中,我们分别对仿真过程中第5、6、7三个不同的控制变量在采样点37.50期间引入大小不同程度的故障。然后,对这三组故障批次分别采用参数法概率密度估计和KDE进行实时状态监测。为了便于比较,我们将两种方法对每组数据中的多元过程统计量即E和n检测出故障批次的个数列于下表:37数据驱动技术对间歇生产过程实时状态监测的研究表2.故障批次检测率的对比表故障组l组SPEDssPEDs42组3253组324故障检测率66.7%40%93.3%533%参数法概率密度估计253核函数法概率密度估计32从表中可以看出,对于卵E统计量,采用参数法概率密度估计对三组故障批次分别检测出来的数目为:4,3,3;而采用KDE对三组故障批次分别检测出来的数目为:4,5,4;它们的故障批次的检测率分别为:66.7%,93.3%。由此可以看出,采用KDE对此过程进行状态监测的故障检测率明显优于参数法概率密度估计。本文将故障批次的检测率定义为检测出的故障批次占总故障批次的比率。由于SPE统计量对此间歇生产过程的故障很敏感,所以两种方法检测出故障的概率都比较高,特别是用KDE,把故障批次基本上全都检测出来。对于n统计量,采用参数法概率密度估计对三组故障批次分别检测出来的数目为:2,2,2:而采用KDE对三组故障批次分别检测出来的数目为:3,3,2。它们的故障批次的检测率分别为:40%,533%。对于n统计量,采用KDE对此过程进行状态监测的故障检测率也同样比参数法概率密度估计要好一些,但没有明显的优势。这主要由于该系统的变化主要体现在残差空间内,而对于主要体现从物理空间到主元空间Mahalanobis距离的n统计量来说变化不大。从总体上来说,采用KDE对间歇生产过程进行状态监测与故障诊断的故障检测率比采用参数法概率密度估计要好一些。由此可以证明,由于参数法概率密度估计是在对数据样本总体分布假设的基础上进行的,因此它对系统故障状态的诊断不如直接对数据样本操作的非参数法概率密度估计—KDE敏感、有效。下面简要的对此实验中一些实时的监测图进行分析。为了检验两种方法对青霉素反应过程状态监测的可靠性,我们分别用参数法概率密度估计和KDE对同一个已知为正常的批次数据进行实时的状态监测,且此正常批次数据不包括在建模的训练数据中。后一点是很重要的,因为如果此正常批次数据包括在建模数据中,采取这样的方式对系统进行实时状态监测就毫无意义。38南京航空航天大学硕士学位论文105‘___●I_。100,,j。旧.,..∞∞蚰l晶踊7。∞%‘Ⅲ图7.参数法概概率密度估计(左)与KDE(右)对同一正常批次SPE和Ds的实时监测图上面的监测图中,所有的实线均表示用多元统计过程监控技术对训练数据建模时已经确定出的99%置信限,图中所有的虚线均表示95%置信限,小圆点表示青霉素反应过程对应时刻采样点的实时状态。以下所有的监测图的设置情况都是相同的。上图中,左图显示的是参数法概率密度估计的SPE、n统计量的实时监测图,右图显示的是KDE的SPE、历统计量的实时监测图。从上图可以看出,此正常批次的数据不管采用参数法概率密度估计还是采用KDE对其进行状态监测,其统计量卵E和D,均没有超过其已设置好的99%和95%的置信限。且经过仔细检验,此正常过程的最终产品质量合格。由此我们可以得知,采用两种方法对正常过程的批次数据的检验都是真实、可靠的。下面主要选择一组故障批次,分别用参数洁概率密度估计与KDE对其进行状态监测。为了体现KDE对系统状态监测的优越性,我们选择的故障批次是用参数法概率密度估计对它进行状态监测时故障表现不是很明显,但是用KDE对其进行状态监测时故障就能很好的监测出来,且具有较强的预警性。此故障批次是对比实验中第二组第五个批次,该批次是在第37个采样点至第50个采样点在第七个变量一反应酶的供应率引入故障的,则用两种方法分别对系统的状态监测图对比结果如下图所示:39数据驱动技术对间歇生产过程实时状态监测的研究-_.,一-o10......∞舶加l晶6D7口即帅1∞图8.参数法概率密度估计(左)与KDE(右)对同一故障批次印E和风的实时监测图上图是对故障批次的实时状态监测图,左图为采用参数法概率密度估计的SPE、D;统计量的实时监测图,右图为采用KDE的SPE、协统计量的实时监测图。从左图可以看出,采用参数法概率密度估计的实时状态监测图不管是断堰统计量还是协统计量在整个生产过程进行中都始终未能检测出此故障批次。在采用参数法概率密度估计SPE统计量的实时监测图中,只有在第46到50个采样点超过95%置信限,并且有一点要超过99%置信限的趋势,但最终没有超过99%置信限,在第51个采样点以后又渐渐回到正常范围内。整个监测过程中,SPE统计量的实时监测图没有出现报警。从右图可以看出,采用KDE的SPE统计量的实时状态监测图在第39个采样点时就检测出系统故障,仅滞后我们引入故障时刻2个采样点。所以说采用KDE的SPE统计量基本上能及时的检测出系统故障。从此可以看出,与参数法概率密度估计相比,KDE在用于间歇生产过程实时状态监测的问题上具有更大的优势,更高的准确度和灵敏度。通过观察上图还可以看出,对于n统计量,无论是采用参数法概率密度估计的实时状态监测图还是KDE的实时状态监测图都未能有效的检澳0出系统故障。这主要由于基于MPCA模型,在第七个变量引入故障的主要表现为模型残差的增大,而皿统计量对此故障弗不很敏感。此时在第七个变量引入的故障不足以使物理空间到主元空间的Mahalanobis距离的改变超出正常范围,所以只有当系统故障较大时,D。统计量才能较明显的反映出来。但是我们从图中可以看出n统计量对故障有一些变化,从45个采样点开始有一点上升的趋势。在右图KDE的实时监测图中,n统计量在第49个采样点超出95%的置信限。参数法概率密度估计及统计量的实时状态监测图虽然也有一点变化但并是不明显,各采样点的协统计量始终在95%置信限范围内。南京航空航天大学硕士学位论文5.2.2青霉素反应过程主元PDF的实时监测在上一小节中,我们主要介绍了用参数法概率密度估计和KDE分别对青霉素反应过程的皿和SPE统计量进行实时状态监测。前面已经介绍了n统计量主要体现的是系统从物理空间投影到主元空间的Mahalanobis距离,而即£统计量主要体现的是系统测量数据对主元模型的偏离程度,反映的是残差空f.J内的变化。由此可见,这两个统计量都没有反映出间歇生产过程主元空间内的变化。参数法概率密度估计对间歇生产过程主元得分的实时状态监测可以采用观察主元得分向量随时间的变化。由于每一采样时刻主元得分向量都是1×,维的,因此要对主元得分进行整个过程主元得分向量进行实时的状态监测,必须对保留的每个主元都画一幅实时监测图。也就是说,如果系统保留r个主元,采用参数法概率密度估计实现对系统主元空间的实时状态监测必须要有r张主元实时监测图。下图是采用参数法概率密度估计对间歇生产过程主元得分向量的实时监测,监测的批次数据来自于与上节对比实验中第二组故障批次的第5个批次。为了便于比较,本节特选择的正常批次和故障批次都与上节实时监测图中监测的批次一致。∞0卯口1020304050607QB09010口加0如0102口3口405口印70B口901口口加0加候州牛f撒憾讲牛¨嘏岷州七…撒D102D3040卯6口7D日口9010口扣0扣恨州牛圜嘏0102Q3Q4Q506n70eO9010口时f可图9.参数法概率密度估计的主元得分向量对故障批次的实时监测图41数据驱动技术对间歇生产过程实时状态监测的研究从图中可以看出,用参数法概率密度估计对此故障批次进行实时状态监测的过程中,系统单个主元的实时状态监测结果根本就反映不出系统的故障状态,而且自始而终各个主元得分随时间变化的幅值非常小,基本上看不出它本身的变化。而用KDE对间歇生产过程进行实时状态监测中,目前没有统计量能反映出主元空问内的变化。为了能体现间歇生产过程主元空间内实时状态的变化,我们引入了新的统计量主元PDF,并成功的实现对间歇生产过程主元空间的观测。这充分体现了现在“数据融合技术”的发展趋势.希望用多种方法、多种手段对系统进行综合的故障诊断。最重要的一点是,实时的主元PDF是用随时间变化的主元得分向量。经多元核函数法概率密度估计估算出来的实时主元的联合概率密度。我们是根据主元得分向量的实时联合概率密度值随时间的变化情况画出了主元PDF的实时监测图。因此,主元PDF的实时监测图反映的是主元得分向量各个主元的联合概率密度值随时间的变化情况,而不是单独反映一个主元的变化。这种实时状态监测图将多个主元的变化信息反映在一幅图上,大大减少了我们进行故障诊断的复杂性和快速性,提高了诊断效率。所以说,主元PDF的实时监测图能够反映间歇生产过程运行过程中主元空间内的实时变化。简而言之就是,主元PDF是由实时的得分向量经KDE得到的,因而它能反映出间歇生产过程主元空间内的实时变化。满足了我们想用KDE来实现观测间歇生产过程主元空间内变化的愿望。为了检测用主元PDF的实时监测图监测间歇生产过程运行状态变化的效果,首先,我们用主元PDF来监测己知正常的过程。经过实验计算我们得到的结果如下图所示:奎孀1口0...、,:。”。、一、。_.~一~~’’~j、、、一..~一,/~一、、、一~~~~、~j。、 ̄.一.-~一-....””40l孝铬””。””。图10.用KDE对正常批次的主元PDF实时监测图从上图可以看出,从过程开始至过程结束,主元PDF的实时状态均低于95%的置信限。特别是在间歇生产过程10%周期以后,所有的观测点都远远低于置信限。在42南京航空航天大学硕士学位论文前10%周期之内,低于置信限的效果不如后10%周期的好。这主要与系统在10%周期之前采用经验补点有关。上图说明了用主元PDF对此正常批次进行实时状态监测的结果是可靠、有效的,而且此图更直观的反映了『F常批次实时得分向量联合概率密度值随时间的变化。另外,我们也同样将以上介绍的与第二组第5个批次相同的青霉素反应过程批次数据采用主元PDF进行实时的状态监测,其结果如下图所示:jj.’..,一、一一、、。、. ̄..、~、~~-套强付~,.—.,。1 ̄‘…‘一图11.用KDE对故障批次的主元PDF实时监测图从图中可以看出,主元PDF的实时监测图在前42%的周期内各测量点一直位于过程置信限以下,但在第43个采样点时,主元PDF值超出系统95%的置信限,在第45个采样点主元PDF值超出系统99%的置信限,并且在此之后主元PDF值始终偏离置信限很远,一直到第70个采样点之后才稍有回落。此过程说明了虽然之前主元PDF监测图出现了一些故障预兆,但是主元PDF监测图在第45个采样点才出现了真正的故障报警。表明主元PDF值对间歇生产过程故障批次的实时状态监测与故障跨断是有效的,且能够达到故障报警的目的。在用主元PDF对间歇生产过程进行状态监测的过程中,主元PDF值在系统检测出故障后远远偏离置信限的问题主要是由于实时主元得分‘本身固有的特点所决定的。尽管主元PDF实时状态监测图能够有效的监测出系统故障,但是与同样采用KDE方法的SPE统计量相比仍有6个时间点的延迟报警的现象,因此对此过程主元PDF的监测效果没有SPE统计量及时、有效。这种现象主要是由于在青霉素反应过程中,此类故障批次的数据主要体现在残差空间内,而主元空间对此故障并不敏感。SPE统计量主要反映的是残差空间内的变化,而主元PDF主要反映的是主元空间的变化。因此在这类故障情况下,用主元PDF的实时状态监测图状态监测的结果不如SPE统计量的实时状态监测图及时、灵敏、有效。若对于故障主要体现在主元空间内变化的系统来说,主元PDF的实时状态监测的效果肯定会比SPE统计量监测的效果43数据驱动技术对间歇生产过程实时状态监测的研究要好。由于条件及本人能力所隈,作者目前暂未找到合适的此类闯歇反应过程系统模型,综上所述,采用KDE对间歇生产过程进行实时状态监测的效果,无论可靠性还是对异常状态的敏感程度都要比采用参数法概率密度估计优越。而针对采用KDE缺乏监测间歇生产过程主元空间内变化的统计量的缺点,本文首次引入了用主元PDF来对间歇生产过程进行实时状态监测,成功的实现了对间歇生产过程主元空间内变化的实时状态监测的缺点。同时,对间歇生产过程的状态监测引入主元PDF的实时状态监测图,符合当今世界实时状态监测与故障诊断方法的数据驱动技术发展大趋势。此方法的采用有利于与其他实时状态监测图联合起来使用,以便通过数据融合技术提高整个系统故障诊断的准确率。而且各统计量提供的信息可能有冗余度,这样采用多个统计量同时进行状态监测可以达到互相补充校核的目的。5.2.3青霉素反应过程的PDF批次检测图在间歇生产过程中,我们除了要对过程进行中进行实时的状态监测以外,还需要在过程进行完以后对批次进行检测,以便发现过程状态监测没有发现的故障批次。对间歇生产过程批次的检验同样也有参数法概率密度估计与非参数法概率密度估计一KDE两种方法。为了简便起见,我们只简要的介绍KDE对批次的检测情况,对批次检测的其他内容请参考相关的参考文献[s91,下图为采用KDE对青霉素反应过程关于批次的即E、取、7_2统计量的批次检测图。。。。。知2陵纂藜器紊赢050108150200250300名付匿鳖釜型翌夔口5010015口200250300350}‘.1jiI40035口400托E扶图12.用KDE的批次检测图南京航空航天大学硕士学位论文此图中,为了便于观察比较,我们将建模时所采用的400个批次的训练数据也显示在图中。上图中,竖直点划线的左侧为建模时所采用的正常批次的数据,竖点划线的右侧为我们所要检测的故障批次的数据。横实线和横虚线分别表示为检验批次的99%和95%的置信限,同时用此置信限对我们对比实验中的第二组5个故障批次进行故障检验。从上图可以看出,批次图中的SPE统计量检测出全部5个故障批次。D,统计量只有第2个故障批次没检测出来,r2统计量第2个和第4个故障批次没检测出来。考虑到此过程的故障主要体现在残差空间内的变化,又考虑到统计学概率的原理,这个批次检验的结果基本上是可以接受的。PDF能够实现对连续过程的状态监测,这部分内容详见参考文献[4.29,341。在此基础上,我们设想用PDF来检测故障批次。PDF与主元PDF的计算过程基本相同,都是从得分向量经KDE得到的。只不过PDF检测的是间歇生产过程批次的主元空间内的变化,而主元PDF监测的是间歇生产过程实时过程中主元空间内的变化。因此,PDF也主要观测的是间歇生产过程批次主元空间内的变化。用PDF对对比实验中第二组5个故障批次的检测结果如下图所示:1口口裂≥蠢簿羹≤泓::‘.o.:之’0I5D100j_..j_..≥:;::1≯≮‘l20025030015D350,400扦b毛赶图13.用KDE估计的PDF批次图从图中可以看出,采用PDF统计量也把这五个故障批次都检测出来了。而与同样检测批次主元空间内变化的r2统计量相比,712统计量有第2和第4个故障批次没有检测出来。这个结果说明了,对同是检测批次主元空间内变化的丁2统计量和PbF统计量,PDF统计量明显比丁2有优势,且更加敏感、有效。这样的研究结果基本上达到了我们预期研究的目的,实现了我们最初的设想。综上所述,采用即E、n、丁2和PDF联合对间歇生产过程批次进行检测,可以通过对多个统计量的批次图进行信息融合分析,克服它们各自本身提供信息的冗余45数据驱动技术对间歇生产过程实时状态监测的研究度。采用多种方法、多种技术手段共同来提高对故障批次诊断的可靠性,实现更完整地解决间歇生产过程故障批次检测的目的。5.3本章小结本章是本人研究工作的~项重要内容。它进一步完善了非参数法概率密度估计对间歇生产过程的实时状态监测与故障诊断问题,是多元统计过程监控技术的一个实际应用。针对间歇生产过程实时状态监测引入的主元PDF实时状态监测图,添补了用KDE没有恰当有效的统计量监测主元空间内实时状态变化的空白。在用PDF埘连续过程监测的基础上,设想将PDF应用于间歇生产过程批次检测方面,并且用仿真实例进行了检验,证明是可靠、有效的。本章首先通过一个对比实验,充分体现了KDE对间歇生产过程进行实时状态监测与故障诊断的优越性,也符合现代“数据融合技术”发展的潮流。接着对引入的主元PDF实时状态监测图进行分析,使之成为用KDE对间歇生产过程的实时状念监测中具有较大的实践意义的补充。最后介绍了用PDF实现对故障批次的检测,为间歇生产过程批次检测的方法和手段提供了新的选择。本章的工作在一个方面改善了多元统计过程监控技术在过程状态监测与故障诊断方面的应用,提供了更可靠的系统运行状态信息,为基于系统状态的维护提供决策参考,有~定的实用价值[15]但是,本章的工作也仅仅是完成了初步的模型实验的研究。由于实验条件的限制,缺少实践工作的检验。今后,在实际应用中还需作进一步的完善。南京航空航天大学硕士学位论文第六章面向对象的DETeC监测软件系统的开发6.1面向对象的DETeC监测软件系统软件开发技术的概述20世纪70年代末至80年代初,结构化程序设计(structuredprogramming)的方法结束了以前软件开发的混乱状态,从而引入了工程思想和结构化思想,大型软件的丌发和编程都得到了极大的改善。但是,随着用户需求功能的增多,软件变得越来越庞大、复杂,程序的维护、修改成为整个软件开发过程中非常繁杂的工作,传统的结构化程序设计方法受到了严峻的考验,面向对象(objectoriented)的程序设计方法则越来越发挥其优势,并逐渐成为主流[601。面向对象的设计方法提供了一种有目的地把软件系统分解成模块的策略。这有利于大型系统软件的开发者之间相互合作,相互协调,共同完成开发任务。对于我们的DETeC监测软件系统的开发来说,这种面向对象的设计方法也是非常适用的。从总体而言,我们的DETeC监测软件系统分成了四个大模块,分别为:数据采集模块,数据存储模块,数据处理模块和用户界面模块。数据采集模块的主要功能是:控制实验仿真设备的运行,并采集设备上传感器所测量的数据;数据存储模块的主要功能是:存储数据。其存储的数据主要有数据采集模块所采集到的仿真设备的原始数据、设备数据的统计量以及数据分析处理后的结果:数据处理模块是整个DETeC监测软件系统的核心部分,它的主要功能是:对数据模块存储的设备数据运用多元统计过程控制技术进行分析处理,其处理的方法主要可以分为PCA,PLS,MPCA以及KDE:用户界面模块是系统与用户相互交互的接口。模块的功能是通过类来实现的,因此类构成了面向对象系统软件开发的基础。对于复杂的程序来说,在进行软件开发之前,必须做一个完全的分析,并充分了解蒯题的各项细节,然后分类,抽象出描述的对象。在对DETeC监测软件系统进行开发的由于DETeC监测软件系统是一个大型的工业过程的状态监测与故障诊断系统软故命名为DETeC监测软件系统。本文简单介绍了软件的总体结构,.目的是表明本人工作在软件中的作用以及与其他模块之间的相互关系。在此基础上详细地介绍了本人的工作。欲全面了解DETeC软件的的情况请参照课题组技术文档和使用手册。47过程中,我们遵循以下的开发步骤:1.找出类;2.描述类和类之间的联系;3.用类来定义程序结构。件,它由数个人分工合作完成。由于此系统的主要功能是对工业大系统进行状态监测,数据驱动技术对间歇生产过程实时状态监测的研究6.2DETeC监测软件系统的编程语言及其操作系统的选择6.2.1开发语言的选择DETeC监测软件系统是用C+十语言进行开发的。因为相比较而言,c++语言的特点最适合开发DETeC监测软件系统。首先,DETeC监测软件系统是一个大型、复杂的系统软件,工作量大,需要多人相互合作完成。c++语言是面向对象的开发语言,类的定义为这种多人合作开发提供了可能。其次,c++语言的编程思想使程序见有很好的封装性、扩展性和可维护性,并且使代码更加的简洁、易懂。此外,DETeC监测软件系统由于要对工业过程的数据进行大量的分析计算,而且在它的数据采集模块中需要直接对设备进行控制操作。C++是从C语言的直接扩展,保留了C语言便于操作硬件的优点,同时改进了C的不足,支持面向对象的程序设计,在改进的同时保持了C的简洁性和高效性的特点。6.2.2DETeC监测软件系统的操作系统及其运行环境DETeC监测软件系统是在Windows系统上进行的。主要考虑目前我国大多数用户的计算机使用的是Windows系统,使用此系统方便于用户。因此,DETeC监测软件系统建议在Windows操作系统下,计算机CPU主频在1,7G以上,内存256M。6.3DETeC监测软件系统的设计及实现DETeC监测软件系统结构的设计6.3.1DETeC监测软件系统按照功能可咀分为四个大的模块,它们分别是:数据采集模块,数据存储模块,数据处理模块和用户界面模块。各模块之间的关系如下:南京航空航天大学硕士学位论文图14.DETeC监测软件系统模块之间的关系由于多元统计过程监控技术根据工业生产过程及其数据结构的不同,有不同的多元统计数据处理方法。如连续生产过程的数据分析方法有:PCA、PLS:间歇生产过程的数据分析方法有:MPCA:而既可用于分析连续生产过程的数据又可用于分析间歇生产过程的数据分析方法有KDE等。因此,数据处理模块又可分为四大模块:PCA模块、PLS模块、MPCA模块和KDE模块。鎏的C++语言中的便于扩展的特性。6.3.2}由图15.数据处理模块的组成49随着多元统计过程监控技术的发展,处理各种工业过程数据的多元统计方法将越来越多。因此,本软件系统将数据处理模块按多元统计方法的不同细分为小模块的设想,便于今后对此模块进行扩展,添加新的子数据处理模块。这正是运用了面向对象DETeC监测软件系统的实现DETeC监测软件系统按功能划分,用不同的对象类实现不同的模块功能。其主要的类实现如下:1.数据采集模块主要是由类CguardianDoc()来实现的。该类包括两种数据采集方式:一种是通过数据采集卡实时的对设备上传感器的数据进行采集。这部分的功能数据驱动技术对间歇生产过程实时状态监测的研究主要是通过函数DataCollector0来实现的。另~种是工业过程已有历史数据的读入。这部分的功能主要是通过函数OnOpenDocumemO来实现的。2.数据存储模块主要是由类CData0来实现的。数据读入系统中后,在数据存储模块进行存储,将数据转化成我们希望的矩阵类。3.数据处理模块采用的是多元统计监控技术,是本软件的核心,也是本人研究工作的一个重点实现,将在下一节做具体的介绍。本模块按照数据处理方式的不同,分别由不同的函数类来实现。CPca0类主要实现主元分析法部分,CPIsO类主要实现偏最小二乘法部分,CMPcaO类主要实现多向主元分析法部分,CKdeO类主要实现核函数法概率密度估计部分。本人主要负责实现对CPca0类、CMPca0类两个函数类相应功能。4.用户界面模块用户界面模块是系统与用户之间的相互交流的接口,它主要由数据显示、用户交互和处理结果信息显示与存储几大部分组成,相应的功能我们用几个相关的函数类来实现:・数据显示部分主要由三个从视图类来实现,分别是显示数据图表信息的函数类CmyVicw0、显示数据变量信息的函数类cvarView()和显示数据值信息的函数类CinfoView()。它们之间通过文档进行互相通信。・用户交互部分是由视图类派生的两个函数类来实现,分别是进行变量选择的函数类CVarselView()¥【l与用户对话的函数类CdiaglogView()。・处理结果信息显示与存储部分是由一个从对话框类派生的函数类CgraphDlgO来实现的。它主要将数据处理模块完成的分析结果及相应的信息反馈给用户,以便用户对系统实时状态信息进行了解,方便为系统故障时作出及时的相应的处理。此外,本系统还有两个辅助类,一个是用于相应的矩阵运算的矩阵类CMatrix0,另一个是将矩阵或文档中的数据转化为相应的直观图表的函数类CGraph0。这两个函数类作为系统的基本函数类自始至终起着重要的作用。6.3.3DETeC监测软件系统中数据处理模块的继承关系多元统计过程监控技术的思想主要体现在数据处理模块中,根据处理过程数据方法的不同,分别封装在函数类CPca()、CPls()、CMPca()¥DCKde()中。而函数类MspcWorker()主E要起到组织协调这些类的作用(CPIs0、CKdeO类和MspcWorker0类的详细设计及实现过程请参阅相关文献及手册)。数据处理模块中各函数类的继承关系如下图所示:50南京航空航天大学硕士学位论文图16.数据处理模块中各函数类的继承关系6.3.4数据处理模块主要函数类的设计——仅涉及到笔者参与设计部分,其它部分请参照相关文献1,基类CMspc()PCA、PLS、MPCA和KDE都是多元统计过程监控技术中的一种。这几种方法对工业过程数据的分析处理过程有很多相似之处。它们具有完全相同的数据正规化过程,且具有相似的建模过程和监测过程。因此,我们抽象出CMspcO作为数据处理模块的基类。该类主要设置了对过程数据的正规化函数Normalize()。同时,还考虑到以CMspc0为基类的子类的特性设置了一些纯虚函数,如交叉校正法的实现函数CrossValidate0、数据建模函数Modeling()、数据监测函数Monitor()、模型参数保存函数SaveModel()以及模型参数调用函数LoadModelO等。这些纯虚函数没有函数体,数据驱动技术对间歇生产过程实时状态监测的研究只是一个说明,它告诉编译器它的实现在该基类的派生类中去定义。这样设计的主要怍用是将有关的类组织在一个继承层次结构中,由它来为它们提供一个公共的根,相关的子类是从这个根派生出来的。这样的设置充分考虑了c++语高1的多态性问题,使程序代码更加简洁、明了。它的主要实现如下:CMspc()SetMeanStd()Normalize()LoadModel()SaveModelOCrossValidate()求数据矩阵的均值和方差对数据矩阵进行正规化加载模型参数存储模型参数交叉校正法选主元系统建模函数系统监测函数求联合分布置信限的函数。竺:篓::Modeling()Monitor()Contour()Map2Curves()画概率密度的等高线函数2.类CPca()CPcaO类是基类CMspcO的派生类。它可以继承类CMspcO除构造函数和析构函数之外的所有成员,同时还能够改造它的成员,添加新的成员。类CPca0主要完成对过程数据进行主元分析的实现部分。主元分析的过程主要涉及到用交叉效正法选模型主元的过程,用历史数据建模的过程及测量数据进行监测的过程。因此,我们的软件设计也按照这个步骤进行实现,该类的软件流程图如下图所不:南京航空航天大学硕士学位论文图17.PCA方法的软件流程图该类主要分为两部分:一部分是对过程数据建模部分,另一部分是对测试数据进行监测部分。历史数据的建模过程和测量数据的监测过程分别是基类相对应的虚函数Modeling()、Monitor()的实现。在数据建模之前,首先需要对建模数据进行正规化,同时将其均值和方差传递给测试数据的正规化部分,用此均值和方差对测试数据进行正规化。在此软件中,对均值和方差的传递过程用两个公有的CMatrixO类柬实现。建模数据在CMspcO类中进行正规化时将均值和方差分别保留在Mean()年llStdvO矩阵类中,在测试数据正规化的过程中对其进行调用。用公有函数实现基类与子类之间信息的传递。在建模数据用PCA建模的过程与测试数据的投影过程需要对得分矩阵T进行传递,因为系统的建模与监测都是在CPca0类中完成的,所以我们在此类中用私有的矩阵类TtrainretO进行信息的传递。但为了使私有的矩阵类与外界有一个接口,我们增设了内联函数TtrmnO来返回训练矩阵的得分矩阵。与此相类似,CPca0类还有其他信息需要在函数之间进行传递,这里不再赘述。另外,交叉校正选主元部分、模型参数的保存部分以及模型参数的调用部分分别用CrossValidate0、SaveModel0和LoadModel0来实现,这部分同样是基类相对应的虚51数据驱动技术对间歇生产过程实时状态监测的研究函数的实现。此外,数据经过主元分析后,需要对一些统计量进行输出。针对这方面的内容,我们设置了一系列的CPca0类成员函数作为与外界交换信息的接口。如T2test()和Qtest0是向外输出产和Q统计量的值。而这两个统计量分别对应的置信限我们用两个vector类来实现,!§nTLimit0和QLimit0。用vector类来存储置信限的信息的好处是,可以随个人意愿添加相应的置信限,如95%、99%等。类CPca()各主要成员函数的实现如下:3.类CKde()CKde0类也是基类CMspcO的派生类。它主要是用来对经PCA或PLS等分析法降维后的数据进行KDE分析,计算出相应主元的联合概率密度函数。它是一种非参数法概率密度估计进行故障诊断的方法。本人量未参与本类的实现,但由于所设计的CMPca0类对此类有大量的调用及改造。所以,这里仅简单的介绍一下该类各成员函数的接口。此类具体内容的实现请参看其他论文。54南京航空航天大学硕士学位论文CKdeOSetCvMethod()Adapt()Asdpi0选择交叉校正方法的函数求KDE平滑因子所采用的不同方法BCv2()Mise()Modeling()SaveModelOLoadModel0Monitor(1EvalPdf0SetPdfLmtMthd0Contour()PdfO对降维后的数据用KDE建模的函数保存建模参数调用建模参数监测函数用KDE求概率密度雨数选择求置信限方法的函数求联合分布置信限的函数输出概率密度分布的函数4.类CMPca()由于在多元统计过程监控技术中,MPCA是直接从PCA演变过来的,“J』『j所以,在设计中我们将类CMPca0从Cpca0类派生,作为它公有继承的派生类。J一处理间歇生产过程数据的多元统计分析方法,因此,MPCA与PCA有很多相似之处。CMPcaO类与CPcaO类处理过程的相似之处是:CMpca[)类对于完整批次数据降维处理方法与CPcaO类相同。因此,在本软件系统中,这部分功能就直接从类CPcaO中咀公有继承的方式继承下来。。CMPca0类与CPc《)类处理过程的不同之处是:CMPca()是实现问歇生产过程状态监测的函数类。因此,此类需要完成对间歇生产过程进行实时状态监测的功能。而在间歇生产过程进行中,批次数据是不完整的,所以需要对不完整的批次数据进行相应的补点,然后才能进行建模,进行实时的状态监测。批次数据的补点是在OnlineModelingOqu实现的。CMPcaO类的软件流程如下图所示:55数据驱动技术对间歇生产过程实时状态监测的研究实时过程状态监图18.MPCA方法的软件流程图该类主要是间歇生产过程实时状态监测的实现类。前面已经介绍了间歇生产过程的数据具有三维数据结构的特点,所以需要对数据进行重排以后再进行正规化。数据重排主要是由该类的成员函数AdjustModel0来实现的,而正规化过程是由该类的父类CMspcO实现的。数据正规化以后就可以对其采用MPCA进行数据建模了。由于本软件对间歇生产过程实时过程的建模有两种方式:参数法概率密度估计和非参数法概率密度估计一KDE,所以在该类中设置了两个成员函数OnlineModeling()和OnlineKDEModelin90实现间歇生产过程的实时建模,并且在OnlineModelingOeO对0nlineKDEModelin90进行调用,实现了建模的统一。针对实时建模的不同方法需要两个成员函数来实现过程的状态监测,按不同的建模方法,用不同的函数OnlineMonitor0和OnlineKDEMonitorO来实现其功能,并且在OnlineMonitor0中对OnlineKDEMonitor0进行调用,实现了间歇生产过程实时监测的统一。由于每个间歇生产过程结束后,都需要对此过程进行批次检测,其检测方法的实现与PCA方法的56南京航空航天大学硕士学位论文建模、监测基本雷同,所以我们直接调用CPca()中的公有继承函数Modeling()进行批次建模。由上面介绍已知,每个间歇生产过程都有一个确定的生产周期,而且在过程周期内一直需要重复的实现实时状态监测。而且当批次结束时,就需要对过程进行批次检测,所以我们在此类的实现过程中设置了检测批次结束的判断语句。当批次结束,我们就调用Cpca0中的公有继承函数Monito式)对批次进行检测。至此,完成对一个间歇生产过程的监测工作。如果需要监测下一个间歇生产过程,只要将上述步骤进行重复就可以了。另外,为了方便与软件系统其他模块相互之间的调用,此类还设置了一些统计量的接口函数。这些统计量的接口主要是对间歇生产过程实时状态监测时得到的,对批次检测的统计量可以从CPca0类中直接继承过来。此类的统计量接口以内联矩阵类实现,主要有:实时皿统计量DtO函数、实时印E统计量spet()函数以及实时主元PDF统计量Pdfiest0函数等。这些统计量对应的置信限用vector类来传递,主要有:DLimitO、SpetLimitO和PdtLimitO。类CMPca0各主要成员函数的接口如下:CMPc“)AdjustModel()CrossValidate()OnlineModeling()OnlineMonitorOOnlineKDEModelin90OnlineKDEMonitor0SaveModel()LoadModelO!EvalPdfO…对数据矩阵进行重新排列交叉效正选主元对间歇生产过程数据进行实时建模函数对间歇生产过程数据进行实时监测函数对间歇生产过程数据进行实时KDE建模函数对间歇生产过程数据的KDE建模Dr0DLimitOSpet0SpetLimit():Pdftest0PdtLimit();l;…,.……间歇生产过程中的实时n统计量实时珐统计量的置信区间间歇生产过程中的实时SPE统计量实时SPE统计量的置信区间间歇生产过程中的实时PDF统计量实时PDF统计量的置信区间l……:………一i57数据驱动技术对间歇生产过程实时状态监测的研究6.4本章小结本章首先简单介绍了DETeC监测软件系统的组成部分,这部分的主要功能是明确本人所做工作在此系统的位置及其作用。接着,详细地介绍了一部分功能具体的开发过程和设计思想,集中体现在数据处理模块中主元分析法和多向主元分析法的具体方法及实现上。另外,本章也对将KDE用于间歇生产过程的实时状态监测与故障珍断和批次的检测问题做了具体的实现及简明的阐述,使之成为DETeC监测软件系统的一部分.增加了软件的适用范围及实用性、复杂性。此外,本软件系统所有这些功能的实现都采用了面向对象的编程技术,而且各主要功能也均采用了模块设计的理念。这样做的目的是便于日后对系统功能进行深入地扩展。本章的内容是本人研究生工作的一个重要组成部分。它是我们第四章研究内容的重要软件实现部分。58南京航空航天大学硕士学位论文第七章总结与展望7.1总结本人的研究工作之一是对将KDE与MPCA相结合的多元统计过程监控技术应用于间歇生产过程的状态监测问题进行研究。在对间歇生产过程的实时状态监测方面,总结了前人用KDE代替参数法概率密度估计的方法步骤,进一步验证了其方法的可行性。在此基础上,针对KDE对过程进行实时状态监测时缺乏观测主元空间内实时变化的统计量这一缺点,将主元PDF实时监测图应用于对间歇生产过程的实时状态监测上。此方法的引入简化了参数法概率密度估计监测系统主元空间内变化的复杂性。同时,它的引入又可以作为用KDE监测间歇生产过程主元空问内实时变化的一个有益的补充。主元PDF实时监测图将多个主元的信息同时显示在一张图上,符合当前系统状态监测与故障诊断“融合技术”发展的潮流。另外,在间歇生产过程批次检测方面,本人对其采用PDF进行检测,取得了较为满意的结果,为间歇生产过程批次提供了一个新的方法。本人的另一个研究工作是将所研究的状态监测与故障诊断的方法用c++语言实现,然后整合31rJDETeC监测软件系统中。由于时间较短和本人的水平所限,文中难免存在许多不足之处,恳请各位老师和同学批评指正。7.2展望在企业竞争全球化的今天,先进的状态监测与故障诊断及其相关的过程控制系统给企业带来的经济效益是无法低估的。状态监测系统可以全面地、实时地监控设备的运行状态,及早发现设备隐患以便管理者采取相应的对策将企业的经济损失降低到最小程度,从而提高了企业的经济效益和市场竞争力。本文所采用的多元统计过程监控技术是目前状态监铡与故障诊断的发展方向。它为使用者提供了对整个大系统运行状态的一个“包罗万象”的一体化监测系统,从而使系统中任何的异常变化都能检测到。多元统计过程监控技术充分考虑了系统中所有测量变量的相关性,因此基于多元统计过程监控技术建立的模型和统计参数对大系统的各子系统物理变化的敏感性大大增加,从而提高了早期发现故障的可能性。这也是多元统计过程监控技术日益得到广泛重视的原因。从总的来说,多元统计过程监控技术为太系统的综合运行状态监测与故障诊断提供的状态信息具有总的指导意义,若再通过物理过程变量的预估残差分析,有可能将59数据驱动技术对间歇生产过程实时状态监测的研究故障范围缩小。但是,由于物理过程变量的多重相关性,对故障的分离存在一定的难度,还需要辅助以其他故障分离的方法手段(如:人工神经网络、专家系统等)。尽管本文多元统计过程监控技术是围绕工业过程提出来的,但它对于其他领域内的多元统计方法的应用,同样具有十分积极的借鉴作用。南京航空航天大学硕+学位论文致谢本文是在南京航空航天大学博士生导师陈前教授的悉心指导和帮助下完成的。陈前老师洲博的知识,严谨的治学态度和平易近人的学者风范使我在学术、专业技术方面受益匪浅。正是由于陈老师对研究重点进行了精心的指导,爿‘使本人的研究工作得以顺利完成。值此沦文完成之际,谨埘导师两年多束的辛勤培养干¨恶心火’际是1j皮,“门,出【蜊!其次,我要感谢课题组的其他『司仁们,感谢他们JI.,qx米的真蛾判j助用1鼓励.f1.找的研究过程中始终有着他们辛勤的痕迹。最后,我要感谢我的父母在我成长过程中给我的启发、引导和教育。他们的鼓励和支持是我完成学业的动力。数据驱动技术对间歇生产过程实时状态监测的研究攻读硕士学位期间发表的主要论文[1]曲爱妍,陈前:用核函数概率密度估计改进间歇生产过程的实时状态精测子与信息学报》《电62南京航空航天大学硕士学位论文参考文献[1].胡遵素;切尔诺贝利事故及其影响与教训;辐射防护;第14卷第5期G(1994.9)【2].胡昌华,许化龙:控制系统故障诊断与容错控制的分析和设计:北京:国防工业出版社,2001【3】.Brisk,M.L.;Processcontrol:TheoriesandProfitsIFACCongress,Perth.Australia.;1993[4].陈前;关于工程大系统的状态监测与故障诊断;振动、测试与诊断;2002,V01.22,No.3[5].Isermarm.R;ProcessFaultDetectionBasedonModelingandEstimationMethods—Asurrey;Automatic;l984,V01.20,pp387-404[6]Moor,R.L.,M.A.Kramer;Expertsystemsinon—lineprocesscontrol;ChemicalProcessControlIII,Asilomer,USA,1986,pp839—867Robe,s,J.E.Ellis;Faultdiagnosisofa.mixingprocessbasedonqualitativerepresentationofphysicalbehaviours;JournalofIntelligentandRoboticSystems;1990,V013,No,2,ppl03—115J.E.Ellis;Aself-learningfaultdiagnosissystem;TransactionsoftheInstituteofMeasurementandControl;1991.V0113,No.1,pp29-35faultdiagnosiswithdiagnosticrulesbasedstructuraldecomposition;JournalofProcessControl;1991,l,pp259—269Venkatasubramanian,V.andK.Chan;Aneuralnetworkmethodologyforprocessfaultdiagnosis;AIChEJ.1989,35,ppl993—2002Watanabe,K.,I.Matsura,M.Abe,M.Kubota,andD.M.Himmelblau;Incipientfaultdiagnosisofchemicalprocessviaartificialneuralnetworks;AIChEJ..1989.35.ppl803-1812Zhang,J.andP.D.Robe,s;Processfaultdiagnosiswithdiagnosticrulesbasedstructuraldecomposition;JournalofProcessControl;1991,1,pp259—269Zhang,J.andA.J.Morris;On—lineprocessfaultdiagnosisusingfuzzyneuralnetworks;IntelligentSystemsEngineering;1994,3,Pp37:47张杰,阳宪惠:多变量统计过程控制;化学工业出版社;ISBN7-5025.2881.4;2000KowalskiB.,GerlachR.,WoldH.,etal;ChemicalSystemsunderIndirectObservation;1982,North-Holland,AmSterdam,ppl91.209WoldH.Researchpapersinstatistics;DavidFEds,NewYork;Wiley,1966[7】.Zhang,J.,RD【8】Zhang,J.,ED.Robe,s,and(9】.Zhang,J.,P.D.Robe.s;Process[10].[1I】【12].【13].(14】.[15】.[161.数据驱动技术对间歇生产过程实时状态监测的研究[17]WoldPress,1966H.Multivariateanalysis;KrishnaiahPEds;NewYork;Academic[18]MacGregor,J.F:Kourti,T;StatisticalProcessControlofMultivariateProcessesControlEngineeringPrac.;1995,V01.3,No.3,pp403—414[19]MorudprocessTE.Multivariatestatisticalprocesscontrol;examplefromthechemicaindustry;JournalofChemometrics;1996,V01.10,pp669-675[20】[21]杜元虎,陈迪,黄文虎:系统状态监测的人工智能方法,东北林业大学学报1998,V01.26No.6,pp49—52KourtiT,MacGregorJF.;Processanalysis,monitoringanddiagnosisusingmultivariateprojectionmethods;ChemometricsandIntelligentLaboratorySystems;1995.V01.28.pp3・21【22】.WiseBM,GallagherNB,MacGregorJF.Theprocesschemometricsapproachtoprocessmonitoringandfaultdetection.Newcastle:PreprintsoftheIFAConWorkshopOn—lineFaultDetectionandSupervisionintheChemicalProcessIndustries,1995Jackson,J.E.;PrincipalComponentsandFactorAnalysis:Part1,Principal[23].Analysis;JQualTechn01.12,1980,pp201一pp2137-118-01678.0[24]任若恩,王惠文;多元统计数据分析,国防工业出版社,ISBN1997[25】[26】方开泰;实用多元统计分析,华东师范大学出版社,1989项静恬,史久恩:非线性系统中数据处理的统计方法;科学出版社;ISBN7.03.005640一X:1987[27][28][29].常宾宝,王树青;分批生产过程的监测与评价;自动化与仪表:2002(3)pp29-31.Wold.S,K.Esbensen,P,Geladi;Principalcomponentanalysis;ChemometricsFangL.G,ChenQ.,YangJ.,etal;ApplicationofprincipalcomponentandIntelligentLaboratorySystems;1987,2(1~3):pp37一pp52analysisandkerneldensityestimationonstructuraldamagedetection;ProceedingsofCOMADEM,Birmingham,UK,2002[30】SvanteWold;Cross—ValidatoryEstimationoftheNumberofComponentsinFactorandPrincipalComponentsModels;1978,V01.20,No,4,pp397-pp405【31】[32]W.J.Krzanowski;Cross-ValidationinPrincipalComponentAnalysis;1987,Brometrics43,pp575一pp584成成,黄道;IPCA在故障检测与分离中的应用,化东理工大学学报,V01.26No.5,2000,pp502—505[33].王纲,赵立杰,辛小宁;基于多方向主元分析方法的间歇生产过程性能监视64和故障诊断;沈阳化工学报:1999,V01.13,No.3,ppl90-196南京航空航天大学硕十学位论文Chen[341.Q,wynneR,SandoztoDJ;AppiicationofPrincipalComponentAnalysisandKernelDensityEstimationEnhanceProcessMonitoring;ControlEngineeringPractise;2002,8(5),pp531-543【35]冯雄峰,阳宪惠,徐用懋:多元统计过程监控方示的平方预测误差分析:清华大学学报;1999,V01.52,No.6,pp471-475赵立杰,王纲等;非线性PCA方法在f司歇生产过程性能监视和故障珍断中的应用:沈阳化工学院学报;2000;V01.14,No.1,pp62.68[36][37]【38]tOBarryM.Wise,NealB.Gallagher;TheProcessChemometricsApproachtoProcessMonitoringandFaultDetection;J.ProcCant,.1996,Vol&No.6。pp329一pp348RobertL“Mason,Youn.MinChou,JohnC.Young;ApplyingBatchProcesses;JournalHotelling严Statistic4.pp466.479ofQualityTechnology;2001,嗝1.33,No[39】MacGregor,J,F.,Nomikos。p二MonitoringBatchProcesses,inBatchProcessingSystemsEngineering:CurrentStatusandFutureDirections(NATOASISeriesF),edsReklaitis,Rippin,Hortacso,andSunol,Heidelberg:Springer-Verlag[40]Marsh,C.E.,Tucker,T.W.;ApplicationofTransactions,1991,V01.30,pp39—47SPCTechniquestoBatchUnits:ISA[41】MacGregor,J.F,C.Jaeckle,C.Kiparissides,andM.Houtoudi;ProcessmonitoringanddiagnosisbymultiblockPLSmethods;AIChEJ.1994,40:pp826一pp838[42]Wise,B.M.,N.B.Gallagher,S.W.Buler,etal;Acomparisonofprincipalcomponentanalysis,multiwayprincipalcomponentanalysis,trilineardecompositionandparallelfactoranalysisforfaultdetectioninasemiconductoretchprocess;JournalofChemometric;1999,13(3-4),pp379—396[43].Louwerse,D,J.andA.K.Smilde;Multivariatestatisticalprocesscontrolofbatchprocessesbasedthree・waymodels;ChemicalEngineeringScience;2000,V01.55,PPl225—1235[44J.Tracy,N.D.,Young,J.C,Mason,R.L.;MultivariateIndividualObservations;JournalControlChartsforofQualityTechnology;1992,V01.24;pp88—95[45][46][47]【48]Seber,G.A.F;MultivariateObservations;JohnWiley&Sons;NewYork,NY,1984B.W.Silverman;DensityEstimation,Chapman&HallLtd.1986DavidW.Scott;MultivariateDensityEstimation-theory,practiceandvisualization,JohnWiley&Sons,Inc.1992PeterHall,SimonJ.Sheather,etc.;OnOptimalData-BasedBandwidthSelectioninKernelDensityEstimation;1991,V01.78,No.2,pp263-pp269[49]PaulNomikos,JohnF.MaeGregor;MultivariateSPCChartsforMonitoringBatchProcesses;Techinometrics;1995;v01.37,No.1,pp41—5965数据驱动技术对间歇生产过程实时状态监测的研究Data【50l,PhilipR。C.Nelson,PauIA.Taylor,JohnF.MacGregor;MissingMethodsinPCAandPLS:ScoreCalculationswithIncompleteObservations;ChemometricsandIntelligentLaboratorySystems35,1996,pp45-pp65【51】.LarsGregersen,StenBayJorgensen;Supervisionoffed—batchfermentations;ChemicalEngineeringJournal75;1999;pp69—76[52].PaulNomikos,JohnF.MacGregor;MonitoringBatchProcessesUsingMultiwayPrincipalComponentAnalysis;1994,V01.40,No8,ppl361-ppl375[53].Johnson,R.A,andWichem,D.W;AppliedMultivariateChew,V.;SimultaneousStatisticalAnalysis;EnglewoodCliffs;NJ:Prentice・Hall;1988[54].PredictionIntervals;Technometrics;1968、V01.10.pp323・330[551,Hahn,G.J,andCockrum,M.B.;AdaptingControlAChemicalChartstoMeetPracticalNeeds:ProcessingApplication;JournalofAppliedStatistics;1987,VoI14,pp35—52【56].Martin,EB,Morris,AJ;Non-parametricconfidenceboundsforprocessperformancemonitoringcharts;JournalofProcessComrol;1996,Vol143,No2,ppl32一144[S7],JulianJ.Faraway,MyoungshicJhun;BootstrapChoiceofBandwidthforDensityEstimation;JournaloftheAmericanStatisticalAssociation;1990,V01.85,No412,pplll9-ppl122[58].MacGregor,J.F;UsingOn—LineProcessDatatoImproveQuality:ChallengesforStatisticians;International[591.StatisticalReview;1997,V01.65,No.3,pp309—323S。DahiandMichaelJ.Piovoso:ImprovedKarleneA.Kosanovich,KennethProcessUnderstandingUsingMultiwayPrincipalComponentAnalysis;Ind.Eng,Chem.Res;1996,V01.35,ppl38-146[60]李春葆:c++程序设计导学:清华大学出版社;ISBN7-302.05l120021.9/TP.2991:
因篇幅问题不能全部显示,请点此查看更多更全内容