测量数据误差的ARIMA模型估计
作者:徐希宝 段方振
来源:《科学导报·学术》2018年第06期
摘 要: 在动态的测量环境下,测量设备对目标进行测量时,其获取的测量数据存在随机误差、系统误差,并且是一组动态的时间序列。为增强测量设备跟踪目标的能力、提高测量数据处理的精度,我们需要对测量数据进行统计分析。文章首先给出了ARIMA时间序列的模型,然后引入了ARIMA模型建模时常用的方法和测量数据的拟合,最后引入了ARIMA模型在测量数据中的应用。
关键词: ARIMA ;模型识别;自相关函数
【中图分类号】 U293.1 【文献标识码】 A 【文章编号】 2236-1879(2018)06-0133-01 1.引言
测量设备在海上对目标飞行器进行测量时是一个动态的变化过程,从而测量设备获取的测量数据不可避免的存在测量误差。海上测量的目标之一就是在规定的测控弧段内获取高精度的测量数据,尤其是获取高精度的外测数据。海上的测量环境是动态变化的过程,为获取高精度的测量数据,人员需要对测量数据进行实时处理、事后处理,计算测量设备的随机误差和系统误差,以进一步获取测量目标的真实值。文章首先介绍了ARIMA时间序列模型,然后分析了数据拟合的方法,最后提出了测量数据误差的ARIMA模型建模方法。 2.ARIMA时间序列
测量设备获取的目标外测测量数据,从时间上来看,是一组动态的时间序列。ARIMA时间序列是一种特殊的自回归滑动平均时间序列,是一种非平稳的时间序列。对于一组时间序列数据,通常情况下对其建模的第一步是进行平稳性的检验,平稳时间序列是时间序列分析的理论基础。
2.1平稳性检验。
对于服从ARIMA模型中的时间序列,通过d步差分的方法可以将其转化为平稳的ARMA模型,并且对于d的取值一般取为1或2。对于一组时间序列,可以直接进行平稳性检,若该序列是不平稳的,则对差分后的时间序列进行平稳性检验。通过假设检验的方法,利用自相关函数和偏自相关函数可以判断出时间序列的拖尾性。对于ARMA(p,q)时间序列,其p、q的选择可以通过扩展的自相关法给出p、q大致的取值范围。 2.2 模型定阶的信息准则。
龙源期刊网 http://www.qikan.com.cn
对于一组给定的差分值d、自回归阶数p、滑动平均阶数q,利用参数估计的方法就可得出对应时间序列的系数、残差估计值。在模型阶数的确定时,利用模型的适用性准则,可以得出一组信息值。模型的适应性准则,通常有白噪声检验准则、参数和Akaike信息检验准则等。Akaike信息检验准则一般有FPE准则、AIC准则和BIC准则等,对应给定的阶数k、j和差分d得出对应的信息准则。 2.3 参数估计。
对于一组测量数据的随机序列,若已经识别该组时间序列符合ARIMA模型,则可利用各种估计方法对模型的参数进行估计。对既定模型的参数估计的方法有很多种,在理论上可以分为自回归逼近法、矩估计法、最大似然估计法和最小二乘估计法等。在实际应用中,在模型的阶数、差分d确定的情况下,可以使用Matlab工程软件、以及专用的R统计分析软件、SAS统计分析软件等数据统计分析软件进行参数估计。 3.测量数据最小二乘拟合
由于测量设备获取的外测测量数据存在明显的趋势项,从而在对测量数据进行时间序列拟合之前,需要剔除测量数据的趋势项。在实际应用上,根据不同类型的测量数据分别使用两种方法进行验证,在得出模型的基础上,通过给定的准则判定适用的逼近方法,下面分别介绍适用的两种逼近方法。
数据拟合的最小二乘法,就是根据已知的互不相同的点处的函数值,建立的多项式插值函数。在函数逼近时,没有必要要求逼近函数通过所有的点,而是根据给定数据的变化情况确定一个函数类。
前文最小二乘法拟合的多项式为最小二乘逼近多项式,它是通过最小二乘原则得出的,在局部上可能存在较大的误差。为了防止出现较大的误差情形,可以使用最大最小函数逼近法。 4.模型应用
测量设备获取的目标外测测量数据(角度、距离),在时间上是一组动态变化的测量序列,也就是一组时间序列。下面是ARIMA模型的建模、参数估计算法,主要是平稳性、模型识别和参数估计。 (1)平稳化。
对非平稳的时间序列进行平稳化时,一般是通过直接剔除法和趋势项提取法两种。利用散点图的方法,可以直观、简洁的看出序列随时间变化的规律。在此基础上,初步确定该时间序列是否平稳。在差分计算时,根据ARIMA特性,最多取2阶差分。 (2)数据拟合。
龙源期刊网 http://www.qikan.com.cn
对测量数据d步差分后的时间序列,进行最小二乘数据拟合。根据不同目标的飞行轨道特性,通过历史数据进行统计分析,确定数据的最小二乘拟合法或最大最小函数逼近法。 (3)模型识别及参数估计。
在对模型识别时,这里利用样本的自相关函数和偏自相关函数法,对其进行初步的拖尾性检验。根据自回归模型、滑动平均模型和自回归滑动平均模型的特性,可以得出序列的自相关函数值、偏自相关函数可以初步识别模型。
根据时间序列特性,AR(p)序列自相关函数在p步拖尾,MA(q)序列在q歩拖尾,ARMA(p,q)序列在p、q歩均不拖尾,由此可初步判定序列模型、模型的阶数。对固定阶数的模型使用前文提出的方法进行参数估计,从而识别出时间序列模型。 (4)模型确定。
通过第三个步骤,可以得出p、q的一个初步范围。利用前面4个步骤,可以得出一组ARMA(k,d,j)模型的信息准则值。根据差分d、p、q的值的范围,从对应的信息准则值中选取一组信息准则值最小的模型,进而得出模型的阶数、参数估计值。 5.结术语
测量设备获取的测量数据是一个动态的变化过程,测量数据存在一定的随机误差、系统误差,在时间上测量数据就是一组附有误差的时间序列。为更好的提高数据处理的精度、确定测量数据的误差,文章对测量数据的序列提出了ARIMA时间序列建模。在 模型的识别时,分别用到了散点图法、自相关函数、偏自相关函数、函数逼近和信息准则等理论。根据ARIMA模型的特性及测量数据的特点,在方法上提出了测量数据模型的应用技术,为测量数据的统计分析提出了新的方法。 参考文献
[1] 潘德惠 关颖男.统计数值分析,沈阳:辽宁人民出版社,1981 【2】 费业泰.误差理论与数据处理,北京:机械工业出版社,2004
【3】 赵肖肖.基于ARIMA模型的时间序列建模算法和实证分析,桂林电子科技大学学报,2012
因篇幅问题不能全部显示,请点此查看更多更全内容