+ All Categories
Home > Documents > Una nueva prueba Portmanteau para modelos ARMA en …En particular el diagnostico del modelo es una...

Una nueva prueba Portmanteau para modelos ARMA en …En particular el diagnostico del modelo es una...

Date post: 10-Mar-2020
Category:
Upload: others
View: 3 times
Download: 0 times
Share this document with a friend
23
Facultad de Estad´ ıstica Diciembre 2017, Trabajo de Grado, pp. 1–23 Una nueva prueba Portmanteau para modelos ARMA en series de tiempo A new Portmanteau test for ARMA models in time series Rafael Eduardo D´ ıaz Bonilla a Autor Hanwen Zhang b Director Resumen Uno de los supuestos que se debe validar en todo modelamiento de series de tiempo es que los residuales sean aproximadamente incorrelacionados. Las pruebas existentes utilizan en su mayor´ ıa las correlaciones muestrales, mientras que la prueba de Monti utiliza las correlaciones parciales. En este estudio se pro- pone una nueva prueba que utilice tanto las correlaciones muestrales como las correlaciones parciales, a partir de la familia de estad´ ısticas para analizar la independencia entre los residuales descrita por Box y Jenkins en 1976. La estad´ ıstica propuesta se comportan de manera asint´ otica como una combinaci´ on lineal de variables aleatorias chi-cuadrado y su distribuci´ on asint´ otica se puede aproximar mediante una distribuci´ on gamma. Para mirar el ajuste emp´ ırico de la distribuci´ on y estudiar su potencia frente a otras pruebas de uso com´ un, se realiz´ o un ejercicio de simulaci´ on con 15 modelos ARMA(2,2) con p,q 6 2 es- tacionario e invertible para datos peque˜ nos medianos y grandes, con longitud de la serie de 50, 200 y 500 respectivamente. La potencia se calcul´ o para las cuatro pruebas con rezagos fijos de h = 5, 10, 15 y 20. Posteriormente se realizo un peque˜ no ejercicio con los datos reales de la variaci´ on del consumo personal en EE.UU, para los a˜ nos 1970 a 2010. Como principal resultado se encontr´ o que el m´ etodo propuesto se comporta de mejor manera que las pruebas cl´ asicas y muestra ser m´ as potente que las pruebas de Box-Pierce, Ljung-Box y Monti. Palabras clave : Pruebas Portmanteau, autocorrelaci´ on muestral, autocorrelaci´ on parcial, Potencia, mo- delos ARIMA.. Abstract One of the assumptions that must be validated in all time series modeling is that the residuals are approximately incorrect. Existing tests use mostly sample correlations, while Monti’s test uses partial correlations. In this study we propose a new test that uses both the sample correlations and the partial correlations, from the family of statistics to analyze the independence between the residuals described by Box and Jenkins in 1976. The proposed statistics behave asymptotically a linear combination of random chi-square variables and their asymptotic distribution can be approximated by a gamma distribution. To look at the empirical adjustment of the distribution and study its power against other commonly used tests, a simulation exercise was carried out with 15 models ARMA (2,2) with p,q 6 2 stationary and invertible for medium and large small data, with length of the series of 50, 200 and 500 respectively. Power was calculated for the four tests with fixed lags of h = 5, 10, 15 and 20. Subsequently, a small exercise was performed with the real data of the variation of personal consumption in the US, for the 1970s. 2010. As a main result, it was found that the proposed method behaves in a better way than the classic tests and it shows to be more powerful than the Box-Pierce, Ljung-Box and Monti tests. Keywords : Pruebas Portmanteau, autocorrelaci´ on muestral, autocorrelaci´ on parcial, Potencia, modelos ARIMA.. a Estudiante de estad´ ıstica. E-mail: [email protected] b Decana. E-mail: [email protected] 1
Transcript

Facultad de EstadısticaDiciembre 2017, Trabajo de Grado, pp. 1–23

Una nueva prueba Portmanteau para modelos ARMA en seriesde tiempo

A new Portmanteau test for ARMA models in time series

Rafael Eduardo Dıaz Bonillaa

AutorHanwen Zhangb

Director

Resumen

Uno de los supuestos que se debe validar en todo modelamiento de series de tiempo es que los residualessean aproximadamente incorrelacionados. Las pruebas existentes utilizan en su mayorıa las correlacionesmuestrales, mientras que la prueba de Monti utiliza las correlaciones parciales. En este estudio se pro-pone una nueva prueba que utilice tanto las correlaciones muestrales como las correlaciones parciales, apartir de la familia de estadısticas para analizar la independencia entre los residuales descrita por Boxy Jenkins en 1976. La estadıstica propuesta se comportan de manera asintotica como una combinacionlineal de variables aleatorias chi-cuadrado y su distribucion asintotica se puede aproximar mediante unadistribucion gamma. Para mirar el ajuste empırico de la distribucion y estudiar su potencia frente a otraspruebas de uso comun, se realizo un ejercicio de simulacion con 15 modelos ARMA(2,2) con p,q 6 2 es-tacionario e invertible para datos pequenos medianos y grandes, con longitud de la serie de 50, 200 y 500respectivamente. La potencia se calculo para las cuatro pruebas con rezagos fijos de h = 5, 10, 15 y 20.Posteriormente se realizo un pequeno ejercicio con los datos reales de la variacion del consumo personalen EE.UU, para los anos 1970 a 2010. Como principal resultado se encontro que el metodo propuestose comporta de mejor manera que las pruebas clasicas y muestra ser mas potente que las pruebas deBox-Pierce, Ljung-Box y Monti.

Palabras clave: Pruebas Portmanteau, autocorrelacion muestral, autocorrelacion parcial, Potencia, mo-delos ARIMA..

Abstract

One of the assumptions that must be validated in all time series modeling is that the residuals areapproximately incorrect. Existing tests use mostly sample correlations, while Monti’s test uses partialcorrelations. In this study we propose a new test that uses both the sample correlations and the partialcorrelations, from the family of statistics to analyze the independence between the residuals described byBox and Jenkins in 1976. The proposed statistics behave asymptotically a linear combination of randomchi-square variables and their asymptotic distribution can be approximated by a gamma distribution. Tolook at the empirical adjustment of the distribution and study its power against other commonly usedtests, a simulation exercise was carried out with 15 models ARMA (2,2) with p,q 6 2 stationary andinvertible for medium and large small data, with length of the series of 50, 200 and 500 respectively.Power was calculated for the four tests with fixed lags of h = 5, 10, 15 and 20. Subsequently, a smallexercise was performed with the real data of the variation of personal consumption in the US, for the1970s. 2010. As a main result, it was found that the proposed method behaves in a better way than theclassic tests and it shows to be more powerful than the Box-Pierce, Ljung-Box and Monti tests.

Keywords: Pruebas Portmanteau, autocorrelacion muestral, autocorrelacion parcial, Potencia, modelosARIMA..

aEstudiante de estadıstica. E-mail: [email protected]. E-mail: [email protected]

1

2 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

1. Introduccion

En analisis de series temporales, la construccion de un modelo consta de tres etapas (identificacion, es-timacion y verificacion de supuestos) segun la metodologıa desarrollada por Box & Jenkins (1976). Laprimera etapa, consiste en identificar y seleccionar el modelo adecuado, si es necesario realizar transfor-maciones para que la serie sea estacionaria e identificar el componente estacional si lo hay, para finalmenteelegir el modelo ARIMA, que mejor se ajuste. En la segunda etapa se estiman los parametros del modeloARIMA seleccionado, comunmente se utilizan los metodos de maxima verosimilitud y mınimos cuadra-dos, obteniendo los errores estandar y los residuos del modelo. Finalmente sigue la ultima etapa y una delas mas importantes consiste en verificar que el modelo seleccionado proporciona un ajuste adecuado ycumple los supuestos basicos. En particular el diagnostico del modelo es una de las etapas mas importan-tes en la construccion de este. Para examinar el adecuado ajuste de un modelo estadıstico, a menudo serealiza un analisis de los residuales. En particular nos interesa encontrar que los residuos del modelo, sonun ruido blanco es decir que son independientes y por lo tanto el proceso no presenta ninguna correlacionserial. Ademas la media y la varianza deben ser constantes en el tiempo. En caso de no cumplirse lossupuestos, se realizan las modificaciones necesarias y se repiten las etapas anteriores hasta obtener elmejor modelo.

El metodo usual consiste en graficar las funciones de los ACF y PACF de los residuales, que permi-te mostrar que rezagos son significativos, y tambien si hay alguna estructura en general. Sin embargoestos graficos presentan dos problemas, primero solo mostraran estructuras dependientes lineales, y esprobable que en muchos casos las estructuras no sean lineales. El segundo problema es que en presencia dedatos atıpicos (outliers), la funcion de auto correlacion muestral (ACF) y la funcion de auto correlacionparcial (PACF), no son robustas, por lo que la estructura de correlacion es seriamente perturbada (Chan& Wei, 1992; Bonifazi & Mendez, 2014; Duerre et al, 2014; Bonifazi, 2015). Por esta razon la segunda op-cion, es construir una estadıstica de prueba para probar la hipotesis nula, de que los residuales del modeloson independientes hasta un rezago h. Con el fin de encontrar estructuras lineales y no lineales, en mediay varianza. Estas estadısticas conocidas como portmanteau iniciaron con el trabajo de Box y Pierce, en ladecada de los 70. Si se ha elegido el modelo apropiado, habra una autocorrelacion de cero. En esta ultimaetapa de verificacion de los supuestos, la metodologıa propuesta por Box y Jenkins, parte de la idea deque todo modelo es erroneo, debido a que el modelo desea representar un fenomeno real, de la manera massimple. Evidentemente, si se debe seleccionar un modelo, este debe ser aquel que viole menos supuestos,o los menos importantes; es por esto que se evaluan a todos los modelos para encontrar sus posibles fallas.

Entonces las pruebas portmanteau se utilizan para probar la bondad de ajuste de modelos ARMA enseries de tiempo. Las estadısticas iniciales de las pruebas portmanteau demostraron ser muy ineficientespara detectar desviaciones de los supuestos, pero ha aumentado el interes en el campo y ha aparecidorecientemente una nueva variedad de estadısticas (ver Li y McLeod 1983, McLeod 1994, Monti 1994,Hong 1996, Pena y Rodrıguez 2002 entre otras). Hay muchos artıculos que analizan el comportamientode las pruebas, ver por ejemplo (Safi & Al-Reqep 2014), sin embargo no parece haber un consenso clarode cual es la mejor prueba, es por esta razon que es pertinente proponer un nuevo metodo mas eficienteen terminos de potencia que las pruebas clasicas.

Esta nueva prueba perteneciente a la familia de estadısticas propuestas por Box y Jenkins (1976), esmostrada en este artıculo que esta organizado de la siguiente manera: en la seccion 2 se encuentran losobjetivos de esta tesis, la seccion 3 se enfoca en mostrar algunas de las principales pruebas portmanteaude uso comun. En la seccion 4 se habla sobre la metodologıa utilizada y se propone una estadısticade prueba nueva para el analisis de los residuales de un modelo de series de tiempo, que combina lascorrelaciones parciales con las muestrales, a partir de la estadıstica Q dada en la seccion 3. En la seccion5 se muestran los resultados, primero el ajuste empırico de la estadıstica propuesta a la distribucionχ2, y luego se compara el rendimiento en terminos de potencia, de la propuesta con las pruebas port-manteau dadas en la seccion 3, todo esto de forma extensa, por medio de simulaciones Montecarlo paradiferentes parametros de modelos, rezagos y tamanos de muestra. Finalmente en la seccion 5 se discutelos resultados obtenidos y de allı se dan las conclusiones mas importantes.

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 3

2. Objetivos

2.1. General

Proponer una nueva prueba para el analisis de la dependencia de los residuales en modelos ARMA, maspotente que las pruebas de Ljung-Box y Monti.

2.2. Especıficos

Determinar cual de las pruebas portmanteau, mas populares que se usan en la actualidad es la demayor potencia en diferentes escenarios.

Analizar el efecto de los rezagos h, en la potencia de las pruebas utilizadas en este estudio.

Encontrar la distribucion teorica y mostrar el ajuste empırico de la estadıstica propuesta a esadistribucion.

3. Marco Teorico

3.1. Series Temporales

Por serie de tiempo nos referimos a datos estadısticos o secuencia de datos que se recopilan, observan oregistran en intervalos de tiempo regulares (diario, semanal, semestral, anual, entre otros) y ordenadoscronologicamente. Los datos pueden estar espaciados a intervalos iguales o desiguales. Las series detiempo son extremadamente comunes. En los negocios, observamos tasas de interes semanales, preciosde cierre diarios, ındices de precios mensuales, cifras de ventas anuales, etc. En meteorologıa, observamostemperaturas altas y bajas diarias, ındices anuales de precipitacion y sequıa y velocidades de viento porhora. En agricultura, registramos cifras anuales de produccion agrıcola y ganadera, erosion del suelo yventas de exportacion. En las ciencias biologicas, observamos la actividad electrica del corazon a intervalosde milisegundos. En ecologıa, registramos la abundancia de una especie animal. La lista de areas en lasque se estudian las series temporales es practicamente infinita. El proposito del analisis de series detiempo es generalmente doble: entender o modelar el mecanismo estocastico que da lugar a una serieobservada y predecir los valores futuros de una serie basada en la historia de esa serie.

Año

Pre

cipi

taci

ón

1880 1900 1920 1940 1960 1980

1020

3040

Año

Pre

cipi

taci

ón

1880 1900 1920 1940 1960 1980

1020

3040

Figura 1: Grafica de la serie temporal anual de la lluvia en Los Angeles.

Facultad de Estadıstica, diciembre 2017

4 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

En la figura 1, se observa un ejemplo de serie temporal de la precipitacion de la lluvia anual para la ciudadde Los Angeles, durante el perıodo 1878-1992 tomado del paquete TSA de R. En el grafico, se puedenobservar anos extremadamente humedos como 1883, y otros extremadamente secos 1983, el objetivo serıamodelar esta serie, con el fin de pronosticar la precipitacion en anos proximos. Para modelar estas seriesBox & Jenkins propusieron una metodologıa que se muestra a continuacion.

3.2. Metodologıa Box & Jenkins

En el analisis de series de tiempo, la metodologıa de Box-Jenkins, nombrada ası en honor a los estadısticosGeorge E. P. Box y Gwilym Jenkins, se aplica a los modelos autorregresivos de media movil ARMA o alos modelos autorregresivos integrados de media movil (ARIMA) para encontrar el mejor ajuste de unaserie temporal de valores, a fin de que los pronosticos sean mas acertados.

El metodo original utiliza un enfoque de modelado iterativo en tres etapas, usando datos de un horno degas. Estos datos son conocidos como datos de Box-Jenkins del horno de gas para la evaluacion comparativade modelos de prediccion.

Las tres etapas del modelado iterativo son las siguientes:

1. Identificacion y seleccion del modelo: asegurarse de que las variables son estacionarias, la identifi-cacion de la estacionalidad de la serie dependiente (diferenciacion estacional, para cierto perıodo,si es necesario), y el uso de los graficos de las funciones de autocorrelacion y de autocorrelacionparcial de la serie de tiempo se utilizan para decidir cual componente (si es el caso) se debe utilizaren el modelo, el promedio autorregresivo (AR) o un promedio movil (MA).

2. Estimacion de parametros usando algoritmos de calculo para tener coeficientes que mejor ajusten elmodelo ARIMA seleccionado. Los metodos mas comunes usan estimacion de maxima verosimilitudo mınimos cuadrados no lineales.

3. Comprobar el modelo mediante el ensayo, si el modelo estimado se ajusta a las especificaciones deun proceso univariado estacionario. En particular, los residuos deben ser independientes el uno delotro, ademas, la media y la varianza deben ser constantes en el tiempo. (Para identificar los erroresde especificacion son utiles la graficacion de la media y la varianza de los residuos a traves del tiempoy la realizacion de una prueba de Ljung-Box o bien por medio del trazado de autocorrelacion yautocorrelacion parcial de los residuos.) Si la estimacion es inadecuada, tenemos que volver al pasouno e intentar buscar un modelo mejor.

4. Modelos para series estacionarias

En esta seccion se discute los conceptos basicos de una clase amplia de modelos de series de tiempoparametricos de los modelos autorregresivos de medias moviles (ARMA). Estos modelos han asumidogran importancia en el modelado de procesos del mundo real.

4.1. Proceso de Medias Moviles

Un modelos de medias moviles de orden (q), denotado como MA(q) describe una serie temporal estacio-naria, los primeros en considerarlo fue Slutzky (1937) y Wold (1938), puede ser escrito como sigue.

Xt = µ+ εt + θ1εt−1 + · · ·+ θqεq−1 (1)

El promedio movil en terminologıa surge del hecho de que Yt es obtenido al aplicar los pesos 1, θ1, θ2, ...,θqa las variables εt, εt − 1, εt − 2, ..., εt − q y luego moviendo los pesos y aplicandolos a εt + 1, εt, εt −1, ..., εt − q+ 1 para obtener Yt + 1 y ası sucesivamente.

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 5

En la practica, la informacion disponible para poder estimar los modelos y luego predecir con ellos sonlas propias observaciones de la serie. Por ello, vamos a exigir que los modelos MA sean invertibles. Lapropiedad de invertibilidad establece que el valor presente de y t pueda expresarse como una combinacionlineal convergente de observaciones pasadas.

En general, en un modelo MA(q), la condicion de invertibilidad viene dada porque las soluciones de lasiguiente ecuacion:

1 + θ1x+ · · ·+ θqxq = 0 (2)

Proceso de medias moviles de primer orden:Consideramos el caso mas simple del proceso de medias moviles, el MA(1) es decir orden 1 ya que tieneun solo parametro θ si µ = 0 se define a continuacion.

Xt = µ+ εt + θεt−1

donde µ es la media de la serie, θ es el parametro del modelo y εt, εt−1 son los terminos de error (ruidoblanco). El valor esperado E(Yt) = 0 y su varianza Var(Yt) = σ2e(1 + θ2), con Cov(Yt, Yt−1) = −θσ2e yCov(Yt, Yt−1) = 0. Ya que no hay e ′s con ındice comun entre Yt y Yt−2. Analogamente se obtiene queCov(Yt, Yt−k = 0) siempre que k2, es decir, el proceso no tiene una correlacion mas alla del rezago 1.Este hecho sera importante en el momento que tengamos que elegir modelos adecuados para datos reales.En el caso concreto de la propiedad de invertibilidad para el modelo MA(1) significa que |θ1| < 1, esdecir 1 + θ1x =, entonces la solucion es x = −1/θ1.

4.2. Procesos Autorregresivos

Los procesos autorregresivos propuestos por Yule (1926) son como su nombre sugiere: son regresionessobre sı mismos. Especıficamente, un proceso autorregresivo Xt de orden p satisface la siguiente ecuacion:

Xt = c+ φ1Xt−1 + · · ·+ φpXt−p + εt (3)

En un modelo AR(p) en valor en el momento t de la serie se expresa como una combinacion lineal delas p observaciones anteriores de la serie mas el termino de innovacion εt, el cual se asume que sonindependientes de Yt−1, Yt−2, Yt−3, ..., y que incorpora todo lo nuevo de la serie en el momento t que nose explica por los valores pasados. Sea el polinomio caracterıstico del modelo AR(p).

φ(x) = 1 − φ1x− φ2x2 − · · ·− φpxp (4)

y correspondiente ecuacion caracterıstica del AR

1 − φ1x− φ2x2 − · · ·− φpxp = 0 (5)

Como se senalo anteriormente, suponiendo que εt es independiente de Yt−1, Yt−2, Yt−3, ... existe unasolucion estacionaria a la ecuacion 6 si y solo si las p raıces de la ecuacion caracterıstica AR exceden cadauna 1 en valor absoluto (modulo). Se pueden usar otras relaciones entre raıces y coeficientes polinomicospara mostrar que las siguientes dos desigualdades son necesarias para la estacionariedad. Es decir, paraque las raıces sean mayores que 1 en modulo, son necesarias ambas, pero no suficiente

φ1 + φ2 + · · ·+ φp < 1y |φp| < 1

}(6)

Proceso Autorregresivo de primer orden:El caso mas simple de un proceso autorregresivo es el AR(1)

Facultad de Estadıstica, diciembre 2017

6 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

Xt = c+ φXt−1 + εt

donde εt es un proceso de ruido blanco con media cero y varianza σ2. El proceso es de covarianza esestacionario si y solo si |φ| < 1. Si φ = 1, entonces Xt tiene una raız unitaria. El requisito de |φ| < 1generalmente se denomina condicion de estacionariedad para el proceso AR(1) ver Box & Jenkins(1976).

En este caso la media marginal va estar dad por E(Xt) = c + φE(Xt−1) ⇒ µ = c1−φ , en particular si

c = 0, la media es 0, y con varianza Var(Xt) = γ0 = σ2e

1−φ2 , donde σe es la desviacion estandar de εt.

4.3. Modelo autorregresivo de medias moviles ARMA(p,q)

La notacion ARMA(p, q) se refiere al modelo con p terminos autorregresivos y q terminos de mediamovil. Este modelo contiene los modelos AR(p) y MA(q).

Xt = c+

p∑i=1

φiXt−i + εt +

q∑i=1

θiεt−i (7)

El modelo ARMA general fue descrito en la tesis de 1951 de Whitle, pero fueron popularizados en 1971por George E. P. Box y Jenkins, quienes expusieron en su libro un metodo iterativo (Box-Jenkins) paraelegir el numero de parametros y estimarlos. El modelo ARMA permite recoger efectos mas duraderosde las innovaciones con menos restricciones, que el AR(p) y permite conservar sus efectos a diferenciadel MA(q), en el cual las innovaciones dejan de tener efectos despues de q periodos.

Proceso Autorregresivo de de medias moviles de orden (1,1)El caso mas simple de estos modelos mixtos es el ARMA(1,1), definiendo la ecuacion puede ser escrito:

Xt = c+ φXt−1 + εt + εt−1 (8)

La condicion de estacionariedad indica que la parte autorregresiva es estacionaria, esto es si |φ| < 1, y lacondicion de invertibilidad se cumple si su componente de medias moviles es invertible, es decir |θ| < 1.En este caso la media de E(Xt) es µ = c

1−φ y la funcion de autocorrelacion.

ρ(h) =

{(1+φθ)(φ+θ)1+θ2+2φθ ,h = 1

φρ(h− 1) ,h > 1(9)

5. Pruebas de Bondad de Ajuste

En esta seccion se consideran siguientes pruebas de bondad de ajuste para el analisis de la independenciade los residuales en modelos de series de tiempo, Box-Pierce, Ljung-Box y Monti. Estas tambien sonllamadas pruebas portmanteau, y asumimos bajo la hipotesis nula que el modelo ajustado es el correcto,y los residuales se comportan como un proceso ruido blanco.

Sea {Xt} un proceso generado por un modelo ARMA(p,q) estacionario e invertible, de la forma φ(B)Xt =θ(B)εt donde ε ∼ N(0,σ2ε), con φ(B) y θ(B) son polinomios de orden p y q respectivamente, dados porφ = 1 − φ1B − · · · − φpBp y θ = 1 − θ1B − · · · − θqBq donde B es el operador de rezago definidocomo BkXt = Xt−k. Por lo general, Xt es alguna transformacion de una serie temporal observada, como

la diferenciacion. Definimos a ˆθ(B) y ˆφ(B) como el polinomio de los coeficientes estimados donde los

coeficientes φi y θj son reemplazados por los estimadores de maxima verosimilitud φi y θj, los residuales

de este modelo estan dados por εt = θ−1(B)φ(B)Xt. Donde ε1, ε2, ..., εT son los residuales obtenidosdespues de estimar un modelo ARMA(p,q) en una muestra de tamano T , y sea rk los coeficientes deautocorrelacion estimada de los residuales.

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 7

rk =

T∑t=k+1

εtεt−k

/ T∑t=1

ε2t para k = 1, 2, ...,h 6 T − 1 (10)

Si los ordenes p y q estan adecuadamente identificados, cada rk ≈ 0 para k = 1, ...,h donde h seelige lo suficientemente grande como para detectar una correlacion significativa en los datos. Basadosen estos coeficientes estimados, Box y Jenkins propusieron una familia de estadısticas para analizar laindependencia entre los residuales en el ano 1976,tomado de (Zhang 2015) como sigue:

Q = T

h∑k=1

wkg(r2k) + (1 − δ)

h∑k=1

ωkg(π2k)

}(11)

Donde los πk son los coeficientes de autocorrelacion parcial estimados de los residuales, 0 6 δ 6 1,h <T ,wk > 0,ωk > 0, y g es una funcion de suavizamiento no decreciente con g(0) = 0. Algunos miembrosconocidos de esta familia cuando g(x) = x son:

Box & Pierce (1970), cuando δ = 1 y wk = 1

Ljung & Box (1978), cuando δ = 1 y wk = (T + 2)/(T − k)

Monti (1994), cuando δ = 0 y ωk = (T + 2)/(T − k)

Estos estadısticos pueden ser resumidos como:

QBP = T

h∑k=1

r2k QLB = T

h∑k=1

(T + 2)

(T − k)r2k QM = T

h∑k=1

(T + 2)

(T − k)π2k (12)

Donde QBP es la estadıstica de Box & Pierce (1970), QLB la estadıstica de Ljung & Box (1978), y QMes la estadıstica de Monti (1994).

5.1. Prueba de Box y Pierce

La propuesta clasica de las pruebas portmanteau es una de las dadas por Box-Pierce.

QBP = T

h∑k=1

r2k (13)

Entonces QBP es la estadıstica de prueba, donde rk es la autocorrelacion muestral de orden k delresidual,h es el numero de rezagos que se estan probando y T es el tamano de la muestra.Esta estadıstica se utiliza para probar la correlacion significativa hasta el un rezago h. Sabemos que paradatos independientes e identicamente distribuidos, cuando T → ∞, las autocorrelaciones se comportancomo variables aleatorias independientes con distribucion normal, y por lo tanto bajo la hipotesis nula(modelo correctamente ajustado) se muestra que QBP es una variable aleatoria asimtoticamente distri-buida de Chi-cuadrado con h − p − q grados de libertad, donde p y q son el orden de los terminosautorregresivos y de media movil estimados en el modelo ajustado, respectivamente.Safi & Al-Reqep (2014) indico que el procedimiento de normalizacion utilizado en la prueba de Box-Piercees inapropiado para una serie independiente e identicamente distribuida (i.i.d.) normal con una mediadesconocida. En consecuencia, el pobre desempeno empırico de la prueba no es totalmente inesperado.Por otra parte, Arranz (2005) demostro que en muestras finitas su distribucion se separa de la asintotica.

Facultad de Estadıstica, diciembre 2017

8 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

5.1.1. Distribucion Asintotica de QBP

Sea {Xt} un proceso ARMA(p,q) donde los terminos de error {ε} son ruido blanco. Ahora bien, si elorden del modelo (p,q) fuera correctamente identificado y ajustado, y los ε ′s para la muestra de laserie se calcularan utilizando los valores de parametros verdaderos, entonces estos ε ′s serıan desviacionesaleatorias no correlacionadas, y sus primeras h autocorrelaciones muestrales r = (r1, r2, ..., rh)

′, donde hes pequeno en relacion a T y

rk =

T∑t=k+1

εtεt−k

/ T∑t=1

ε2 (14)

para T suficientemente grande r se acerca a una distribucion normal (Box & Pierce 1970) como si el modelofuera de orden (p + q, 0). Tambien se puede demostrar facilmente que los {rk} no estan correlacionadoscon varianza

Var(rk) =T − k

T(T + 2)≈ 1/T (15)

Es decir que el vector de autocorrelacion de los residuales es aproximadamente una transformacion linealde una variable normal r ∼ N(0, (1/T)I). Por lo cual se desprende en particular que la estadıstica T(T +

2)∑hk=1(T −k)

−1r2k, para un T grande se distribuye χ2 con h grados de libertad; como una aproximacion

adicional de T∑hk=1 r

2k ∼ χ2h. Box y Pierce hicieron una representacion de r como transformacion lineal

de r, con r = (I−V)r, donde V = X(X ′X)−1X ′ es una matriz de dimension h−(p+q), y X es una matrizh× p+ q cuyo (i, j)-esimo elemento es cero si i < j y ψj si i > j, con coeficientes ψ(B) = [φ(B)θ(B)]−1.

Por lo tanto r ∼ N(0, (1/T)[I− V], y la estadıstica QBP = T∑hk=1 r

2k ∼ χ2h−p−q.

5.2. Prueba de Ljung-Box

Despues de algunas discusiones sobre la distribucion para la muestra finita de la estadıstica de pruebapropuesta por Box y Pierce y su rendimiento conservador.Ljung y Box (1978) propusieron una version modificada de esa prueba, mejorando esta aproximacionsustituyendo los coeficientes de autocorrelacion rk en (13) por sus valores estandarizados

r2k =(T + 2)

(T − k)r2k (16)

Obteniendo la estadıstica

QLB = T

h∑k=1

(T + 2)

(T − k)r2k (17)

La estadıstica QLB tiene una distribucion para una muestra finita que esta mucho mas cerca de la dela distribucion χ2 con h − p − q grados de libertad, que la estadıstica QBP. La intuicion indica que seesta ajustando cada rk en la estadıstica QBP por su varianza asintotica. Sin embargo, esta modifica-cion no carece de crıtica, ya que se ha demostrado, segun (Arranz 2005), que su varianza podrıa sersustancialmente mayor que la de su distribucion asintotica.

5.2.1. Distribucion Asintotica de QLB

Sea {Xt} un proceso generado por un modelo ARMA(p,q) con ε ∼ (0,σ2ε). Si el modelo es el apropiadola funcion de autocorrelacion muestral r = (r1, r2, ..., rh)

′, definida como en (10), Box & Pierce (1970)demostraron que los rk son independientes y se distribuyen asintoticamente N(0, T−1), bajo el supuesto

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 9

de que la varianza de los rk es T−1 y es una aproximacion de la cantidad Var(rk) = (T − k)/(T(T + 2)).Esta aproximacion de la varianza fue utilizada por la dificultad de derivar la distribucion nula de QBP.Sin embargo el resultado de Box & Pierce provee una buena aproximacion para un T relativamentegrande con respecto a h, generalmente tomando a h como 15 o 20, pero este requerimiento difıcilmentese mantiene en la practica, esta observacion fue notada por (Prothero & Wallis, 1976, citado por Davies,1977 p. 518) quien propone usar la estadıstica QLB como alternativa a QBP. Ljung & Box demostraronque QLB, se distribuye aproximadamente χ2 con h− p− q grados de libertad con E(QLB) ' h−p−q yV(QLB) = 2h

(1 + h−10

T

)y aunque la varianza de QLB excede a 2h los estudios de simulacion de Ljung

& Box (1978) indican que para propositos practicos la aproximacion es adecuada.

5.3. Prueba de Monti

Las estadısticas dadas en (13) y (17), estan basadas sobre los coeficientes de autocorrelacion muestral.Monti (1994) propuso un estadıstico alternativo utilizando los coeficientes de autocorrelacion parcial, πk,k = 1, 2, ...,h. El estadıstico propuesto es

QM = T

h∑k=1

(T + 2)

(T − k)π2k (18)

donde T es la longitud de la serie.En 1994 Monti demostro que si el modelo ARMA ajustado es el adecuado, entonces QM se distribuyeasintoticamente como una variable aleatoria χ2h−p−q. Ademas Monti (1994) demostro bajo simulacionque el rendimiento deQM es comparable al deQLB y mejor si el orden del promedio movil es subestimado.Por otro lado, QLB funciona mejor si el orden de la parte autorregresiva es el subestimado.

5.4. Propiedades Asintoticas de QM

Sea rk el k-esimo coeficiente de autocorrelacion muestral de los errores y πk el k-esimo coeficiente decorrelacion parcial de εt. Sea r = (r1, r2, ..., rh)

′ y π = (π1,π2, ...,πh)′. Por el algoritmo de Durbin-

Levinson, el vector π se puede obtener como una funcion de r,π = ψ(r), con el k-esimo elemento dadopor

πk = ψk(r) =rk − r

′(k−1)R

−1(k−1)r

∗(k−1)

1 − r ′(k−1)Rh−1(k−1)r(k−1)

(19)

Donde Rk is la matriz Toeplitz k × k, tal que Rk = (r|i−j|)i,j=1,2,...,k, con r∗k = (rk, rk−1, ..., r1)′. Sea

π = (π1, π2, ..., πh)′, el vector de los primeros h autocorrelaciones parciales de los residuales. Entonces

πk puede ser obtenido, analogamente a πk, reemplazando las autocorrelaciones del error por las autoco-rrelaciones del residual en la ecuacion (17). Monti afirma que si el modelo es correctamente identificado,QM se distribuye asintoticamente como una variable aleatoria χ2h−p−q. La demostracion es como sigue:

Si las autocorrelaciones del error son cero, rk = Op(T− 1

2 )(k = 1, 2, ...). Ademas Rk = Ik + Op(T− 1

2 )por (12).

π = r+ Op(T−1) (20)

La expansion de Taylor de ψ(r) alrededor de r

π = r+∂π

∂r(r− r) + Op(T

−1) (21)

Ya que ∂π/∂r = I+ Op(T− 1

2 ), por (20),(21) se vuelve en

Facultad de Estadıstica, diciembre 2017

10 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

π = r+ Op(T−1) (22)

Ahora r puede ser aproximado por una transformacion lineal singular de r, r = (Ih−V)r+Op(T−1), donde

V es una matriz idempotente con rangos p+q (Box & Pierce 1970), y T12 r esta distribuida asintoticamente

como una variable normal multivariada con vector de medias cero y matriz de covarianzas diagonal Σhcon

Var(T12 rk) =

T − k

T + 2(23)

Consecuentemente, T12Σ− 1

2 π es asintoticamente normal multivariada con vector de medias cero y matrizde covarianzas (Ih − V) y QM es asintoticamente una χ2h−p−q. Bajo la hipotesis nula, QLB y QM sonasintoticamentes equivalentes, pero obviamente, algunas diferencias pueden esperarse en sus comporta-mientos en muestras pequenas. En particular, sus resultados bajo la hipotesis alternativa pueden sersustancialmente diferentes, como se muestra en (Monti 1994).

6. Estadıstica Propuesta

Sea {Xt} un proceso de media cero generado por un modelo ARMA(p,q), es decir φ(B)Xt = θ(B)εt , dondeB es el operador de rezago, φ(B) es un polinomio de orden p, y θ(B) es un polinomio de orden q, y εt esruido blanco. Donde ε1, ε2, ..., εT son los residuales obtenidos despues de estimar el modelo ARMA(p,q)en una muestra de tamano T , y sea rk los coeficientes de autocorrelacion estimada de los residuales comoen (10). La estadıstica propuesta parte de asignar un valor a δ y a wk,ωk en la estadıstica Q, dada en(11) diferente a los usualmente utilizados en las estadısticas clasicas. Se tomo el valor de 0.5 para δ ypesos,

wk = ωk =(T + 2)

(T − k)

(h− k+ 1)

h(24)

Los pesos (T + 2)/(T − k) son tomados como en QLB y QM, para la parte restante (h − k + 1)/h sonderivados al usar tecnicas de analisis multivariado sobre la matriz de autocorrelacion (similar a Pena &Rodrıguez (2002)). Observe que la autocorrelacion al rezago 1, r1, esta dada por el peso h/h = 1. Laautocorrelacion muestral aal rezago 2, r2 esta dada por el peso (h− 1)/h < 1. Se puede interpretar quelos pesos hacen mas enfasis sobre la primera autocorrelacion, y menor enfasis sobre la autocorrelacional rezago h que corresponde a 1/h. Esto coincide con la intuicion sobre las estimaciones pues la primeraautocorrelacion r1 se calcula usando informacion de todas las n observaciones. La segunda autocorrelaciose basa en n−1 observaciones, y la h-esima autocorrelacion se basa en n−h observaciones. Intuitivamente,tiene sentido poner mas enfasis en la primera autocorrelacion, ya que deberıa ser la mas precisa. Estaidea tambien es valida para las autocorrelaciones parciales. La estadıstica se puede resumir como sigue:

Qm0.5= T

(T + 2)

2h

h∑k=1

(h− k+ 1)

(T − k)(r2k + π

2k) (25)

Alternativamente a las pruebas de Ljung-Box y Monti, las cuales utilizan los coeficientes de correlacionmuestral y parcial, respectivamente. Esta mixtura pretender combinar coeficientes de correlacion muestraly parcial, asignandoles la misma ponderacio a traves de δ. En la siguiente seccion, se muestra cual es ladistribucion asintotica de Qmδ .

6.1. Distribucion Asintoticas de Qmδ

Sea r = (r1, ..., rh)′ y π = (π1, ..., πh)

′ y usando los resultados de Ljung y Box (1978) y Monti (1994) que√T r y

√T π son asintotica mente normal multivariados con matriz de media cero y covarianza (I − V),

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 11

donde V = XΨ−1X ′, es la matriz de informacion para los parametros φ y θ, y X es una matriz h× (p+q)con los elementos φ y θ definidos por 1

φ(B =∑φiB

i y 1θB

=∑θiB

i.

Teorema 1. Bajo la hipotesis nula de un modelo adecuadamente ajustado, las estadısticas QLB y QM sedistribuyen asintotica mente como

∑hk=1 λkχ

2k donde

{χ2k}

son variables aleatorias chi-cuadrado indepen-dientes con un grado de libertad y λk = (k = 1, ...,h) son los valores propios de (I−V)W, donde W es una

matriz diagonal con elementoswii = (k−i+1)/h (i = 1, ...,h). Defiendo a QLB = T(T+2)h

∑hk=1

(h−k+1)T−k r2k

y QM = T(T+2)h

∑hk=1

(h−k+1)T−k π2k.

Demostracion teorema 1. Tanto QLB como QM pueden ser expresado como formas cuadratica. Definiendoa W como una matriz diagonal de pesos.

W =

1 0 · · · 00 h−1

h· · · 0

... · · ·. . .

...0 · · · 0 1

h

Entonces QLB y QM son asintotica mente expresados como formas cuadraticas QLB ' T r ′Wr y QM 'T r ′Wr cuando T →∞. Donde A ′ denota la operacion transpuesta de un vector o matriz A y r, π es unvector h × 1 de la (autocorrelacion parcial) desde un rezago 1 hasta h. De el resultado en Box(1954),ambas formas cuadraticas se distribuyen una combinacion lineal de variables aleatoria chi cuadradosindependientes por su respectivo valor propio como se muestra a continuacion

h∑k=1

λkχ2k (26)

Los λk son los h valores propios de la matriz (I−V)W donde (I−V) es la matriz de covarianza de ambos√T r y

√Tπ. Box Pierce(1970) y McLeod(1978) aproximaron la matriz V con la matriz de proyeccion

X(X ′X)−1X ′ cuando h es suficientemente grande.

Observamos que las estadısticas QLB y QM siguen la misma distribucion nula asintotica que la de Penay Rodrıguez(2002, 2006) y esta distribucion es similar a la de Mahdi y McLeod (2012). La densidades difıcil de escribir en forma explıcita, pero la aproximacion de la distribucion ha sido discutida pormuchos autores. Imhof (1961) habıa demostrado que las probabilidades se pueden encontrar a travesde la integracion numerica. Pena y Rodrıguez(2006) sugirieron una aproximacion normal usando unageneralizacion de la transformacion de raız cubica Wilson-Hilferty de una variable aleatoria chi-cuadrado.Lin y McLeod (2006) y Mahdi y McLeod (2012) sugirieron un metodo de Monte Carlo para determinarlos puntos crıticos y los valores p. Para facilidad computacional, como la de Pena y Rodrıguez (2002),recomendamos una aproximacion usando una distribucion gamma descrita en Satterthwaite (1941,1946)y Box (1954) con parametros de forma y escala

α =3h(h+ 1)2

4(2h2 + 3h+ 1 − 6h(p+ q)), (27)

β =2(2h2 + 3h+ 1 − 6h(p+ q)

h(h+ 1)(28)

respectivamente. La derivacion de α y β sigue una metodologıa similar a la de Pena y Rodrıguez(2002),excepto que nuestra forma y escala recomendadas son conservadoras para mejorar la aproximacion. Puedeser natural dejar que h dependa del tamano de muestra T , particularmente para detectar la correlacionserial en rezagos mas altos. El siguiente teorema, que es similar a los resultados de Bhansali, Giraitisy Kokoszka (2007), proporciona la distribucion asintotica de nuestra estadıstica como (T ,h) → ∞.Resultados similares pueden derivarse para las estadısticas de Pena y Rodrıguez (2002) y Mahdi y

Facultad de Estadıstica, diciembre 2017

12 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

McLeod (2012), pero en la practica si h es grande en relacion con T , sus estadısticas pueden volversenumericamente inestables.

Teorema 2. Sea {Yt} un proceso ARMA(p,q) con secuencia de errores {εt}. Si h = O(Tδ) para algun0 < δ < 1 talque h/T → 0 y E[ε8] <∞, entonces bajo la hipotesis nula cuando T →∞, (QLB−k1)/

√K2

converge a variable normal estandar, donde K1 y K2 son dados por (29) y (30) respectivamente.

Aproximacion gamma. Box(1954) y Satterthwaite(1941,1946) demostraron que la distribucion de estaforma cuadratica en general puede ser aproximado por cχ2k, o por la distribucion gama. Los parametrosson escogidos tal que la distribucion tiene los mismos dos primeros cumulan tes que la forma cuadratica.En particular, considere los parametros de forma y escala para la distribucion gama:

α =K21

K2

y

β =K2

K1

donde Ki es el i-esimo cumulante de la distribucion. Box (1954) proporciono una formula para los cumu-lantes y por simple manipulacion algebraica de el resultado en Pena y Rodrıguez provee:

K1 =

h∑i=1

= tr((I− V)W) =h− 1

2− (p+ q) +

1

h

h∑i=2

(i− 1)vii

y

K2 = 2

h∑i=1

λ2i = 2tr((I− V)W(I− V)W)

=1

3h(h+ 1)(2h+ 1) − 2(p+ q) +

4

h

h∑i=2

(i− 1)vii −4

h2

h∑i=2

(i− 1)2vii +2

h2

h∑i=2

h∑j=2

(i− 1)(j− 1)v2ij

donde vij es el elemento en la fila i, columna j de la matriz V. Pena y Rodrıguez (2002) demostraronque cuando h es moderadamente grande los terminos O(h−1) y O(h−2) tienden a cero. Recomendamosusar un lımite superior en K1 ya que mejora la aproximacion bajo la distribucion nula y el argumentolimitante para K2 de Pena y Rodrıguez

K1 =h+ 1

2− (p+ q) (29)

K2 =(h+ 1)(2h+ 1)

3h− 2(p+ q) (30)

Aplicando los teoremas de aproximacion gamma descrito por Box(1954) y Satterthwaite(1941,1946), estosugiere que la distribucion bajo la hipotesis nula para la estadıstica Qmδ es gamma con parametros α,βdados por:

α =3(h2 + h− 2(h− 1)(p+ q))2

4(2h3 + 3h2 + h− 6(h2 − 2h− 1)(p+ q)), β =

2(2h3 + 3h2 + h− 6(h2 − 2h− 1)(p+ q))

3h(h2 + h− 2(h− 1)(p+ q))(31)

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 13

7. Metodologıa

Se simularon quince modelos ARMA(p,q) para el valor de δ = 0.5 y h = 20 con longitud de la serie 300con diferentes valores de φ y θ estacionarios e invertibles. Posteriormente se ajusta el modelo con el ordencorrecto, y se calcula el valor de Qmδ , graficando los valores de la estadıstica en un histograma con ajustede la densidad para una distribucion gama 1 con parametros α y β como en (31). Se utilizo la pruebade bondad de ajuste de Kolmogorov-Smirnov para verificar que Qmδ se distribuye gama. Se compararonlas pruebas Box-Pierce, Ljung-Box y Monti con la la propuesta con el fin de encontrar el metodo maspotente en diferentes escenarios. Se utilizaron tres tamanos de muestra para la longitud de la serie T ,para datos pequenos T = 50, para datos medianos T = 200 y para datos grandes T = 500 con rezagosh = 5, 10, 15, 20. Los modelos ARMA(p,q) simulados con parametros φ y θ, estacionarios e invertiblescon p y q 6 2, donde ARMA(1,0) es ajustado en todos los casos. Por lo que el numero total de escenariosevaluados fue de 180. Para el calculo del error de tipo I, se tomaron 6 de los modelos (1, 4, 6, 8, 13 y14) propuestos. con longitud de la serie 50, 125, 200, 275, 350, 425 y 500. Finalmente se graficaron paraver el comportamiento de cada una de las pruebas Portmanteu. El numero de simulaciones montecarlo(Nsim) fue de 10.000, utilizando el software estadıstico R version 3.4.2, para la potencia de las pruebasse utilizo un valor α = 0.05.

8. Resultados

Esta seccion se divide en tres partes. La primera parte muestra el ajuste empırico de la estadıstica Qmδa la curva de densidad de la distribucion teorica Γ(α,β), ademas se evalua la bondad de ajuste con laayuda de la prueba no parametrica de Kolmogorov - Smirnov. En la segunda parte se evalua el error detipo I para las pruebas Portmanteau en 6 escenarios. Finalmente se calcula la potencia de las pruebasPortmanteau, bajo diferentes escenarios para datos pequenos, medianos y grandes.

8.1. Ajuste empırico a la distribucion gama

A continuacion se muestran los resultados obtenidos por simulacion montecarlo verificando empıricamenteque la distribucion Γ(α,β) se ajusta adecuadamente a la distribucion nula de Qmδ . En la figura 2 segrafica ron 15 histogramas que corresponden al valor de la estadıstica Qmδ de los modelos ARMA(p,q)propuestos en este este estudio. La aproximacion a la distribucion gamma parece la adecuada.

Tabla 1: Pruebas de ajuste Kolmogorov-Smirnov a la estadıstica Qmδ .

Modelo Metodo α β δ φ1 φ2 θ1 θ2 D Valor p Alternativa1 K-S 11.032 1.317 0.5 - - 0.7 - 0.010 0.258 Dos Colas2 K-S 11.032 1.317 0.5 - - 0.4 - 0.008 0.591 Dos Colas3 K-S 11.032 1.317 0.5 - - -0.5 - 0.010 0.247 Dos Colas4 K-S 10.650 1.274 0.5 0.5 0.3 - - 0.013 0.055 Dos Colas5 K-S 10.650 1.274 0.5 1.2 -0.73 - - 0.009 0.447 Dos Colas6 K-S 10.650 1.274 0.5 - - 1 -0.6 0.010 0.240 Dos Colas7 K-S 10.650 1.274 0.5 - - 0.24 0.1 0.010 0.253 Dos Colas8 K-S 10.650 1.274 0.5 0.6 - 0.4 - 0.012 0.132 Dos Colas9 K-S 10.650 1.274 0.5 0.5 - -0.7 - 0.008 0.558 Dos Colas10 K-S 10.650 1.274 0.5 -0.2 - -0.6 - 0.012 0.128 Dos Colas11 K-S 10.297 1.224 0.5 0.7 0.2 -0.5 - 0.026 0.051 Dos Colas12 K-S 10.297 1.224 0.5 1 -0.35 0.1 - 0.012 0.111 Dos Colas13 K-S 10.297 1.224 0.5 0.4 - -0.6 0.3 0.012 0.096 Dos Colas14 K-S 9.9850 1.070 0.5 0.9 -0.3 1.3 -0.5 0.105 0.000 Dos Colas15 K-S 9.9850 1.070 0.5 0.4 -0.3 -0.3 1.1 0.174 0.000 Dos Colas

1Sea x una variable aleatoria con parametros α,β, parametro de forma y escala se dice que se distribuye gama si sufuncion de densidad esta dada por 1

Γ(α)βα xα−1e−x/β con x ∈ [0,∞).

Facultad de Estadıstica, diciembre 2017

14 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

Figura 2: Histograma de la estadıstica Qmδ , ajuste dist. Γ(α,β)

.

Los resultados de la figura reffig1, muestran el correcto ajuste de la estadıstica a la distribucion Γ(α,β).Aunque en algunos casos el ajuste no fue tan bueno, por ejemplo para el modelo 15, en general laaproximacion a la distribucion gama parece adecuado. En la tabla 1., se observan los resultados obtenidosde la aplicacion de la prueba de bondad de ajuste Kolmogorov - Smirnov a la distribucion gama. En lamayorıa de casos el p valor fue mayor al nivel de significacion, para un α = 0.05, contrastando la hipotesisnula F(x) = F(y) vs F(x) 6= F(y), por lo que no hay suficiente evidencia estadıstica para rechazar H0 y seconcluye que la estadıstica de prueba propuesta Qmδ sigue en general una distribucion Γ(α,β).

9. Tamano de la Prueba

En esta seccion se calcula el error tipo I, definido como la Pr(Rechazar H0|H0 es verdadaera) o falsopositivo, es el error que se comete cuando el investigador rechaza la hipotesis nulaH0 siendo esta verdaderaen la poblacion. Se eligieron como casos particulares el modelo 1 un MA(1) con θ = 0.7, el modelo 4un AR(2) φ1 = 0.5,φ2 = 0.3, modelo 6 un MA(2) con θ1 = 1, θ2 = −0.6, modelo 8 un ARMA(1,1)φ00.6, θ = 0.4, modelo 13 un ARMA(1,2) con φ = 0.4, θ1 = −0.6, θ2 = 0.3 y modelo 14 un ARMA(2,2)con φ1 = 0.9,φ2 = −0.3, θ1 = 1.3, θ = −0.5. Los resultados obtenidos se muestran en la figura 3. El valorde α utilizado fue al 0.05. Como vemos las pruebas en general se comportan bastante bien moviendosealrededor del 5 %, por lo que no hay inflacion del error de tipo I.

9.1. Estudio de Simulacion para Datos Pequenos

Generamos datos para un tamano de muestra pequeno (T = 50) mediante el software estadıstico R y lapotencia de las pruebas se calcula para los rezagos h = 5, 10, 15 y 20. Los resultados se presentan en laTabla 2 para h = 5 y 20. Para los otros rezagos la Tabla 8 se encuentra en el apendice.Los resultados de la simulacion revelan que todas las pruebas portmanteau son sensibles a la eleccion de

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 15

Figura 3: Resultados del Error de tipo I cometido con los modelos ARMA ajustados.

rezagos h y alcanzan su maxima potencia cuando este es h = 5. Por ejemplo, en el modelo 1 MA(1),hay deficiencias de la potencia de la prueba para el caso QBP del rezago 5 al rezago 10, es igual a(0.3376 − 0.2112)/0.3376 × 100 % = 37.4 % y calculos similares son utilizados para los otros modelos.Entonces, los promedios de la disminucion de la potencia con respecto a h del rezago 5 al 10 es un19.3 %, 12.3 %, 20.1 %, 0.4 % para QBP,QLB,QM,Qm0.5

respectivamente, con excepcion del modelo 7 enel cual la potencia no disminuyo sino aumento, para QLB,QM,Qm0.5

y Qm0−75.

Para los AR(p) y MA(q), los resultados muestran que QM es mejor que QLB si el orden del componentedel promedio movil es subestimado (ver los modelos 1,2,3,6, y 7 para todos los rezagos seleccionados). Porotro lado QLB tiene mejor rendimiento que QM si el orden del componente autorregresivo es subestimado(ver modelos 4 y 5 para todos los rezagos.)En la Tabla 2 se observa que la estadıstica propuesta Qmδ , fue la mas potente en los modelos 1, 3, 4, 8,10, 12 y 14 para el rezago h = 5. Mientras que para el rezago h = 20, fue la prueba mas potente exceptoen el modelo 2 y 7. En la general los resultados muestran que a medida que aumenta los rezagos h, elresultado de la estadıstica propuesta es mas potente que las demas. Para tener una vision general delos resultados calculamos el promedio de la potencia para cada prueba Portmanteau teniendo en cuentalos 15 modelos propuestos en los cuatro rezagos seleccionados h=5,10,15 y 20 los resultados fueron lossiguiente. Para QBP fue de 21.92 %, para QLB fue de 32.76 %, para QM fue de 34.92 % y para 41.94 %, loque muestra una mejora considerable con respecto a las pruebas clasicas, si comparamos con Box-Piercela mejora fue de un 47.7 % y se la comparamos con la prueba de Monti la mejora fue de un 16.7 %.

9.2. Estudio de Simulacion para Datos Medianos

Se generaron datos con tamano de muestra mediano (T = 200) por medio del software estadıstico R yla potencia de las pruebas se calculo para h = 5, 10,15 y 20. Los resultados son presentados en la Tabla3, para los rezagos h = 5 y 15, los otros rezagos se encuentran disponibles en el apendice en la Tabla 9.El estudio de simulacion muestra que la potencia de las pruebas Portmanteu aumenta cuando T=200,en comparacion con T=50. La potencia de las pruebas decrece con respecto al rezago h 5 a 10 en11.7 %, 9.4 %, 9.2 %, 0.7 % para QBP,QLB,QM y Qmδ respectivamente, con excepcion de los modelos5,14 y 15 pues todas tienen la misma potencia aproximadamente 100 %.En la Tabla 3 se observa que QLB tiene mejor rendimiento que QM cuando el componente autorregresivodel modelo ajustado es subestimado (ver modelo 4 Tablas 3 y 9 para todos los rezagos). Contrariamente,si el orden del componente de promedios moviles es subestimado entonces QLB es peor que QM (ver los

Facultad de Estadıstica, diciembre 2017

16 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

Tabla 2: Potencia de las pruebas Portmanteau con T = 50, h=5 y 20, α = 0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5QBP QLB QM Qm0.5

h = 5 h = 201 - - 0.7 - 0.3376 0.3984 0.5700 0.5794 0.1228 0.2832 0.2554 0.42322 - - 0.4 - 0.0812 0.1212 0.1330 0.1286 0.0312 0.1182 0.0662 0.12063 - - -0.5 - 0.1392 0.1944 0.2388 0.2456 0.0538 0.1670 0.1136 0.19024 0.5 0.3 - - 0.1992 0.2434 0.2436 0.3110 0.0716 0.1824 0.0978 0.21045 1.2 -0.73 - - 0.9910 0.9960 0.9932 0.9960 0.9254 0.9676 0.9410 0.98946 - - 1 -0.6 0.3304 0.3762 0.4984 0.4854 0.1142 0.2820 0.2298 0.38707 - - 0.24 0.1 0.0310 0.0440 0.0586 0.0350 0.0122 0.0728 0.0458 0.05528 0.6 - 0.4 - 0.2650 0.3140 0.3836 0.4524 0.1084 0.2540 0.1744 0.32449 0.5 - -0.7 - 0.0642 0.0906 0.1362 0.1082 0.0284 0.1136 0.0748 0.116610 -0.2 - -0.6 - 0.3288 0.3974 0.5526 0.5776 0.1232 0.2838 0.2584 0.433611 0.7 0.2 -0.5 - 0.2778 0.3576 0.3750 0.3734 0.0878 0.2384 0.1690 0.304612 1 -0.35 0.1 - 0.6084 0.6586 0.6700 0.7646 0.3050 0.5070 0.3798 0.630613 0.4 - -0.6 0.3 0.0756 0.1062 0.1270 0.1062 0.0260 0.1148 0.0714 0.114014 0.9 -0.3 1.3 -0.5 0.7868 0.8392 0.9376 0.9566 0.3862 0.6196 0.6612 0.856615 0.4 -0.3 -0.3 1.1 0.4336 0.5404 0.7580 0.6168 0.1322 0.3554 0.5252 0.6218

modelos 1, 2, 3, 6 y 7 para todos los rezagos seleccionados en las Tablas 3 y 9). En cuanto a los resultadosde la estadıstica propuesta Qmδ para el rezago h = 5, fue la mas potente para los modelos 1, 3, 4, 8,10, 12 y 14. Sin embargo si el numero de rezagos aumenta hasta h = 20, fue igual o mas potente quelas pruebas clasicas en todos los modelos, (ver Tabla 9 con h=20). Como resultado global para todos losrezagos comparamos el promedio de la potencia obtenida por cada prueba, fueron los siguientes 71.06 %,72.91 %, 74.81 %, 79.71 %, para QBP, QLB, QM y Qmδ respectivamente. se aprecia que el incrementoen la potencia varia desde 6.1 % hasta 10.8 % si lo comparamos con las pruebas clasicas de Monti oBox-Pierce.

Tabla 3: Potencia de las pruebas Portmanteau con T = 200, h=5 y 15, α = 0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5QBP QLB QM Qm0.5

h = 5 h = 151 - - 0.7 - 0.9952 0.9964 0.9990 0.9992 0.8908 0.9028 0.9852 0.99922 - - 0.4 - 0.3252 0.3466 0.3746 0.4174 0.1768 0.2204 0.2102 0.34503 - - -0.5 - 0.6662 0.6968 0.7488 0.7836 0.3840 0.4466 0.4972 0.69684 0.5 0.3 - - 0.9104 0.9152 0.9216 0.9544 0.7412 0.7546 0.7438 0.90265 1.2 -0.73 - - 1 1 1 1 1 1 1 16 - - 1 -0.6 0.9868 0.9852 0.9936 0.9938 0.8424 0.8806 0.9468 0.98967 - - 0.24 0.1 0.0592 0.0738 0.0740 0.0540 0.0514 0.0738 0.0634 0.06148 0.6 - 0.4 - 0.9370 0.9372 0.9648 0.9784 0.7366 0.7752 0.8272 0.94629 0.5 - -0.7 - 0.3126 0.3310 0.4084 0.3770 0.1648 0.1940 0.2506 0.337410 -0.2 - -0.6 - 0.9928 0.9932 0.9972 0.9992 0.8856 0.8998 0.9680 0.993011 0.7 0.2 -0.5 - 0.9968 0.9972 0.9978 0.9974 0.9810 0.9862 0.9818 0.995412 1 -0.35 0.1 - 0.9990 0.9992 0.9994 0.9994 0.9888 0.9898 0.9934 0.999213 0.4 - -0.6 0.3 0.6312 0.6546 0.6410 0.6692 0.4038 0.4508 0.4368 0.606214 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 115 0.4 -0.3 -0.3 1.1 1 1 1 1 0.9960 0.9982 1 1

9.3. Estudio de Simulacion para Datos Grandes

Se generaron datos de tamano de muestra grandes con (T = 500) por medio del software estadıstico Ry la potencia de las pruebas se calcula para h = 5, 10, 15 y 20. Los resultados se presentan en la Tabla4 para h = 5 y 15, para los rezagos 10 y 20 los resultados se encuentran en la Tabla 10 que esta en elapendice. Todas las pruebas presentan sensibilidad al valor del rezago escogido h.En promedio la potencia de las pruebas decrece en cuando se pasa del rezago h = 5 a h = 10, en4.5 %, 4.6 %, 4.1 %, 0.5 % para las pruebas QBP,QLB,QM y Qm0.5

respectivamente, exceptuando en losmodelo 1,5,6,10,11,12,14 y 15 que la potencia es aproximadamente 100 %. La estadıstica propuesta tubo

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 17

mejores resultados que las pruebas clasicas para los rezagos h = 10, 15 y 20. En general el promediode la potencia obtenido por las pruebas Portmanteau fue de 87.11 %, 87.44 %, 88.32 %, 90.76 % para lasestadısticas QBP,QLB,QM y Qm0.5

respectivamente, por lo tanto la mejora en potencia que ofrece Qmδes entre 2.7 % a 4 % con respecto a las pruebas clasicas.

Tabla 4: Potencia de las pruebas Portmanteau con T = 500, h=5 y 10, α = 0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5QBP QLB QM Qm0.5

h = 5 h = 101 - - 0.7 - 1 1 1 1 1 1 1 12 - - 0.4 - 0.7512 0.7692 0.7892 0.8346 0.5974 0.5958 0.6344 0.78243 - - -0.5 - 0.9866 0.9902 0.9944 0.9964 0.9518 0.9588 0.9732 0.99184 0.5 0.3 - - 1 1 0.9998 1 0.9994 0.9996 0.9996 15 1.2 -0.73 - - 1 1 1 1 1 1 1 16 - - 1 -0.6 1 1 1 1 1 1 1 17 - - 0.24 0.1 0.1032 0.1158 0.1140 0.0982 0.0850 0.0950 0.0874 0.10608 0.6 - 0.4 - 1 1 1 1 0.9998 1 0.9998 19 0.5 - -0.7 - 0.7748 0.7820 0.8314 0.8258 0.5966 0.6078 0.7168 0.816410 -0.2 - -0.6 - 1 1 1 1 1 1 1 111 0.7 0.2 -0.5 - 1 1 1 1 1 1 1 112 1 -0.35 0.1 - 1 1 1 1 1 1 1 113 0.4 - -0.6 0.3 0.9848 0.9850 0.9848 0.9876 0.9540 0.9546 0.9548 0.986614 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 115 0.4 -0.3 -0.3 1.1 1 1 1 1 1 1 1 1

10. Ejemplo Ilustrativo: Tasas de consumo personal en los Esta-dos Unidos.

Para validar los resultados del estudio de simulacion, aplicamos las pruebas de portmanteau para probarla adecuacion de los modelos ajustados sobre un conjunto de datos reales. Se utiliza la base de datosusconsumption del paquete fpp la cual contiene los cambios porcentuales en el gasto de consumopersonal trimestral y el ingreso personal disponible para los Estados Unidos, 1970 a 2010. Por facilidadsolo se trabajara con la variable el consumo.

10.1. Exploracion de los datos

En la figura 4 se muestra el grafico de la serie de tiempo junto con la funcion de autocorrelacion (ACF)y la funcion de auto correlacion parcial (PACF), esta serie presenta considerables fluctuaciones a lolargo del tiempo, no parece haber tendencia por lo que un modelo estacionario parece razonable. Paracomprobar estas hipotesis utilizamos la prueba de Dickey Fuller para la serie del consumo personal enEE.UU., el estadıstico de prueba obtenido es -4.2556 y el p valor es 0.01. Con la hipotesis nula de noestacionariedad en la serie, esto proporciona una fuerte evidencia de que la serie no tien raız unitaria.

10.2. Ajustando el Modelo Apropiado

Nos encontramos ante una serie no estacional, y que no tiene tendencia observando la tabla 3, la funcionde autocorrelacion muestral extendida (EACF) parece apropiado ajustar un modelo ARMA(0,3), porotra parte la funcion auto.arima del paquete forecast de R que devuelve el mejor modelo ARIMAacorde al valor del AICc tambien indica que el mejor modelo es el MA(3).

En la Tabla 3 se muestra el patron esquematico para un modelo MA(3). El vertice superior izquierdodel triangulo de ceros esta marcado con el sımbolo o y esta ubicado en la fila p = 0 y q = 3, unaindicacion de un modelo MA(3). El modelo para la serie original de consumo personal trimestral enEE.UU serıa entonces un modelo ARMA(0,3). Realizamos las pruebas Portmanteau antes mencionadas

Facultad de Estadıstica, diciembre 2017

18 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

Años

Var

iaci

ón p

orce

ntua

l del

gas

to

1970 1980 1990 2000 2010

−2

−1

01

2

Años

Var

iaci

ón p

orce

ntua

l del

gas

to

1970 1980 1990 2000 2010

−2

−1

01

2

1 2 3 4 5

−0.

10.

10.

3

Rezago

AC

F

1 2 3 4 5

−0.

10.

10.

3

Rezago

AC

F

1 2 3 4 5

−0.

10.

10.

3

Rezago

Par

tial A

CF

1 2 3 4 5

−0.

10.

10.

3

Rezago

Par

tial A

CF

Figura 4: Variacion porcentual trimestral en el gasto de consumo personal en EE.UU.

Tabla 5: EACF para la serie de consumo personal EE.UU.

MA0 1 2 3 4 5 6 7 8 9 10 11 12 13

AR

0 x x x o o o o o o o o o o o1 x o x o o o o o o o o o o o2 x o x o o o o x o o o o o o3 x x o o o o o x o o o o o o4 x o o o o o o x o o o o o o5 x x o o x o o o o o o o o o6 x o x o x o o o o o o o o o7 x o x x x o o o o o o o o x

para el modelo ARMA(0,3). La Tabla 4 muestra los valores de p de las pruebas Portmanteau para losrezagos seleccionados, h = 5, 10, 15 y 20 con α = 0.05 o α = 0.1. Claramente, el resultado indica quepara todos los rezagos, todas las pruebas Portmanteau no tienen suficiente evidencia para rechazar lahipotesis nula de la adecuacion del modelo, es decir, todas las pruebas tienen el mismo resultado paralos diagnosticos de autocorrelacion y detectan correctamente el modelo ajustado.

10.3. Ajustando un Modelo Inapropiado ARMA(2,0)

Ahora, supongamos que los datos de la serie temporal de consumo personal trimestral en EE.UU esta malajustada por el modelo ARMA(2,0). Realizamos las pruebas mencionadas anteriormente para el modeloajustado ARIMA(2,0). La Tabla 5 muestra los valores p de las pruebas Portmanteau para los rezagos, h= 5, 10, 15 y 20 con α = 0.1. Claramente, los resultados indican que para el reazgo 5, todas las pruebasPortmanteau rechazan la hipotesis nula de la adecuacion del modelo, es decir, todas las pruebas tienenel mismo resultado para los diagnosticos de autocorrelacion.

Ademas, para mayor claridad, si se utiliza la prueba de Montin QM para el diagnostico de idonei-

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 19

dad del modelo, aunque para h = 5, la prueba QM muestra que el modelo ajustado ARMA(2,0) pareceser inadecuado, sin embargo para m = 10, 15 y 20 la prueba de QM hay evidencia significativa paraapoyar la hipotesis nula de adecuacion del modelo. Mientras que las pruebas clasicas Ljung-Box QLBy Box-Pierce QBP dan valores p similares h. Sin embargo para un α = 0.1, QBP rechazarıa H0 para h= 5 y 10. Mientras QLB con α, rechazarıa la hipotesis nula para h=5,10 y 15, pero no para h=20. Laestadıstica propuesta es la que tiene mejor resultado, pues para un α = 0.1, rechaza la hipotesis nula entodos los casos, es decir que detecta que el modelo no es el adecuado.

Tabla 6: Valores p de la prueba Portmanteau para los residuales del modelo ajustado.

Modelo h QBP QLB QM Qm0.5Modelo QBP QLB QM Qm0.5

ARMA(0,3) 5 0.3419 0.3287 0.3470 0.2039 ARMA(2,0) 0.0397 0.0354 0.0422 0.0292ARMA(0,3) 10 0.3468 0.3085 0.2309 0.2657 ARMA(2,0) 0.3468 0.0684 0.1002 0.0315ARMA(0,3) 15 0.3839 0.3164 0.3150 0.3120 ARMA(2,0) 0.3839 0.0966 0.1157 0.0516ARMA(0,3) 20 0.5762 0.4849 0.5518 0.3540 ARMA(2,0) 0.5762 0.1737 0.3287 0.0740

11. Conclusiones

Se compararon cuatro pruebas de Portmanteu, con diferentes tamanos de muestra T , rezagos h y condiferentes modelos ARMA(p,q) con p,q 6 2, lo qu proporciono una amplio espectro de resultados untotal de 180 escenarios diferentes. Con la simulacion de MonteCarlo, se concluyo que los valores masaltos de potencia para todas las pruebas se encuentran en muestras grandes (T = 500).

Las pruebas son sensibles al valor del rezago h, pues entre mayor sea el rezago la potencia disminuye,manteniendo el mismo tamano de muestra.Para los modelos ARMA(p,q), el rendimiento de la prueba de QM es mejor que la prueba de QLBsi el orden del componente del promedio movil se subestima, mientras que QLB funciona mejor sise subestima el orden del componente autorregresivo.La distribucion de la estadıstica propuesta se aproxima asintoticamente a una distribucion gama.La estadıstica propuesta en este estudio mostro ser mas potente que las pruebas clasicas en generalen todos los escenarios, parece funcionar mejor cuando h y T son grandes.

11.1. Futuras Investigaciones y Limitaciones del Estudio

Para proximas oportunidades primero se busca encontrar el valor de δ, que maximice la potencia dela prueba para un escenario especifico. Por otra parte se podrıa pensar en hacer una extension de estaprueba para los modelos generalizados auto regresivos condicionalmente heterocedastico(GARCH) y losmodelos autorregresivos de umbrales (TAR). Segundo, ampliar la investigacion para examinar la relacionentre los coeficientes ARMA(p,q) y la potencia de las pruebas de bondad de ajuste en series de tiempo.

Agradecimientos

En primer lugar quiero agradecer al padre eterno (Hashem), por permitirme vivir este momento y darmela oportunidad de cursar esta carrera aquı en la Universidad Santo Tomas. Tambien quiero agradecer a midirectora de tesis la profesora Hanwen Zhang, por el apoyo incondicional y constante seguimiento brindadodurante el proceso de elaboracion de este documento, aportes y correcciones al mismo. Finalmente quieroagradecer a mi familia, mis padres y hermano por ser los cimientos de mi vida y darme las fuerzasnecesarias para terminar esta carrera. Pero principalmente a mi madre Rocio Bonilla, por financiar misestudios.

12. Apendice

Facultad de Estadıstica, diciembre 2017

20 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

Tabla 7: Potencia de las pruebas Portmanteau con T = 50, h=10 y 15, α = 0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5QBP QLB QM Qm0.5

h = 10 h = 151 - - 0.7 - 0.2112 0.3244 0.4196 0.5208 0.1516 0.2964 0.3328 0.46602 - - 0.4 - 0.1062 0.1038 0.1046 0.1262 0.0636 0.1138 0.0898 0.11863 - - -0.5 - 0.1488 0.1678 0.1680 0.2346 0.0922 0.1664 0.1458 0.20644 0.5 0.3 - - 0.1350 0.1782 0.1624 0.2688 0.1464 0.1854 0.1230 0.23865 1.2 -0.73 - - 0.9786 0.9826 0.9828 0.9962 0.1548 0.9752 0.9692 0.99126 - - 1 -0.6 0.1968 0.2928 0.3556 0.4694 0.1494 0.2810 0.2766 0.43207 - - 0.24 0.1 0.0234 0.0574 0.0578 0.0424 0.0282 0.0654 0.0524 0.04868 0.6 - 0.4 - 0.1762 0.2634 0.2822 0.4076 0.1384 0.2520 0.2044 0.35929 0.5 - -0.7 - 0.0480 0.0946 0.1140 0.1210 0.1024 0.1042 0.0926 0.121410 -0.2 - -0.6 - 0.2084 0.3132 0.4088 0.5268 0.1556 0.2948 0.3196 0.468811 0.7 0.2 -0.5 - 0.1698 0.2650 0.2576 0.3646 0.1552 0.2352 0.2062 0.338212 1 -0.35 0.1 - 0.4566 0.5716 0.5484 0.7124 0.1490 0.5210 0.4432 0.661413 0.4 - -0.6 0.3 0.0980 0.1048 0.0948 0.1212 0.0502 0.1068 0.0794 0.113614 0.9 -0.3 1.3 -0.5 0.6132 0.7152 0.8418 0.9260 0.1498 0.6492 0.7384 0.890215 0.4 -0.3 -0.3 1.1 0.2584 0.3778 0.7146 0.6854 0.1556 0.3618 0.6274 0.6722

Tabla 8: Potencia de las pruebas Portmanteau con T = 200, h=10 y 20, α = 0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5QBP QLB QM Qm0.5

h = 10 h = 201 - - 0.7 - 0.9580 0.9662 0.9964 0.9990 0.8186 0.8516 0.9690 0.99402 - - 0.4 - 0.2138 0.2460 0.2618 0.3890 0.1536 0.1908 0.1822 0.29883 - - -0.5 - 0.4808 0.5110 0.5902 0.7512 0.3224 0.3860 0.4188 0.63164 0.5 0.3 - - 0.8050 0.8338 0.8410 0.9230 0.6636 0.7148 0.6836 0.87565 1.2 -0.73 - - 1 1 1 1 1 1 1 16 - - 1 -0.6 0.9222 0.9360 0.9764 0.9934 0.7734 0.8254 0.9160 0.98087 - - 0.24 0.1 0.0478 0.0716 0.0612 0.0598 0.0486 0.0692 0.0572 0.06768 0.6 - 0.4 - 0.8362 0.8568 0.8962 0.9662 0.6666 0.6996 0.7652 0.92129 0.5 - -0.7 - 0.2078 0.2280 0.2924 0.3644 0.1530 0.1852 0.2094 0.309010 -0.2 - -0.6 - 0.9508 0.9528 0.9872 0.9988 0.8068 0.8474 0.9382 0.993211 0.7 0.2 -0.5 - 0.9906 0.9922 0.9920 0.9988 0.9688 0.9760 0.9712 0.995612 1 -0.35 0.1 - 0.9958 0.9974 0.9982 0.9998 0.9798 0.9866 0.9864 0.999013 0.4 - -0.6 0.3 0.4866 0.5138 0.5044 0.6564 0.3452 0.4166 0.3668 0.563614 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 115 0.4 -0.3 -0.3 1.1 1 1 1 1 0.9854 0.9924 1 1

Tabla 9: Potencia de las pruebas Portmanteau con T = 500, h=15 y 20, α = 0.05 y ajuste ARMA(1,0).

Modelo φ1 φ2 θ1 θ2 QBP QLB QM Qm0.5QBP QLB QM Qm0.5

h = 15 h = 201 - - 0.7 - 1 1 1 1 1 1 1 12 - - 0.4 - 0.4860 0.5030 0.5324 0.7406 0.4262 0.4356 0.4650 0.67603 - - -0.5 - 0.8998 0.9038 0.9346 0.9868 0.8500 0.8528 0.8916 0.98064 0.5 0.3 - - 0.9978 0.9986 0.9978 0.9996 0.9964 0.9944 0.9946 0.99965 1.2 -0.73 - - 1 1 1 1 1 1 1 16 - - 1 -0.6 1 0.9998 1 1 0.9994 1 1 17 - - 0.24 0.1 0.0728 0.0888 0.0734 0.1008 0.0674 0.0796 0.0764 0.09968 0.6 - 0.4 - 0.9990 0.9990 0.9992 1 0.9946 0.9972 0.9992 19 0.5 - -0.7 - 0.4896 0.5050 0.6180 0.7740 0.4212 0.4438 0.5440 0.721210 -0.2 - -0.6 - 1 1 1 1 0.9998 1 1 111 0.7 0.2 -0.5 - 1 1 1 1 1 1 1 112 1 -0.35 0.1 - 1 1 1 1 1 1 1 113 0.4 - -0.6 0.3 0.9120 0.9200 0.9156 0.9802 0.8698 0.8874 0.8706 0.968814 0.9 -0.3 1.3 -0.5 1 1 1 1 1 1 1 115 0.4 -0.3 -0.3 1.1 1 1 1 1 1 1 1 1

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 21

Referencias

Anderson, R. L. (1942), ‘Distribution of the serial correlation coefficient’, The Annals of MathematicalStatistics 13(1), 1–13.

Arranz, M. A. (2005), ‘Portmanteau test statistics in time series’, Time Orientated Language pp. 1–8.

Box, G. E. & Jenkins, G. M. (1976), Time series analysis: forecasting and control, revised ed, Holden-Day.

Box, G. E. & Pierce, D. A. (1970), ‘Distribution of residual autocorrelations in autoregressive-integratedmoving average time series models’, Journal of the American statistical Association 65(332), 1509–1526.

Davies, N., Triggs, C. & Newbold, P. (1977), ‘Significance levels of the box-pierce portmanteau statisticin finite samples’, Biometrika 64(3), 517–522.

Fisher, T. J. (2011), ‘Testing adequacy of arma models using a weighted portmanteau test on the residualautocorrelations’, Contributed Paper 327, 2011.

Fisher, T. J. & Gallagher, C. M. (2012), ‘New weighted portmanteau statistics for time series goodnessof fit testing’, Journal of the American Statistical Association 107(498), 777–787.

Imhof, J. (1961), ‘Computing the distribution of quadratic forms in normal variables’, Biometrika48(3/4), 419–426.

Lin, J.-W. & McLeod, A. I. (2006), ‘Improved pena–rodriguez portmanteau test’, Computational Statis-tics & Data Analysis 51(3), 1731–1738.

Ljung, G. M. & Box, G. E. (1978), ‘On a measure of lack of fit in time series models’, Biometrikapp. 297–303.

Mahdi, E. & Ian McLeod, A. (2012), ‘Improved multivariate portmanteau test’, Journal of Time SeriesAnalysis 33(2), 211–222.

McLeod, A. I. & Li, W. K. (1983), ‘Diagnostic checking arma time series models using squared-residualautocorrelations’, Journal of Time Series Analysis 4(4), 269–273.

Monti, A. C. (1994), ‘A proposal for a residual autocorrelation test in linear models’, Biometrika pp. 776–780.

Pena, D. & Rodrıguez, J. (2002), ‘A powerful portmanteau test of lack of fit for time series’, Journal ofthe American Statistical Association 97(458), 601–610.

Safi, S. K. & Al-Reqep, A. A. (2014), ‘Comparative study of portmanteau tests for the residuals autoco-rrelation in arma models’, Journal of Applied Mathematics and Statistics 2(1), 1–13.

Satterthwaite, F. E. (1941), ‘Synthesis of variance’, Psychometrika 6(5), 309–316.

Satterthwaite, F. E. (1946), ‘An approximate distribution of estimates of variance components’, Biome-trics bulletin 2(6), 110–114.

Slutzky, E. (1937), ‘The summation of random causes as the source of cyclic processes’, Econometrica:Journal of the Econometric Society pp. 105–146.

Whitle, P. (1951), Hypothesis testing in time series analysis, Vol. 4, Almqvist & Wiksells.

Wold, H. (1938), A study in the analysis of stationary time series, PhD thesis, Almqvist & Wiksell.

Yule, G. U. (1926), ‘Why do we sometimes get nonsense-correlations between time-series?–a study insampling and the nature of time-series’, Journal of the royal statistical society 89(1), 1–63.

Zhang, H. (2015), ‘Una nota sobre la prueba de pena y rodrıguez para la bondad del ajuste en series detiempo’, Comunicaciones en Estadıstica 1(1), 33–41.

Facultad de Estadıstica, diciembre 2017

22 Rafael Eduardo Dıaz Bonilla & Hanwen Zhang

A. Codigos

Serie larain (Annual rainfall in Los Angeles / time series) del paquete TSA. Annual precipitation (ininches) in Los Angeles, 1878-1992.

################################# Codigos Tesis ################################

library(TSA);data(larain) # Serie de tiempo ejemplo

par(mar=c(3,3,2,2),mgp=c(1.6,.6,0))

plot(larain ,ylab='Precipitacion ',xlab='A~no',type='o', col = 4)

rect(par("usr")[1], par("usr")[3],par("usr")[2],par("usr")[4],col=gray(.9 ,.9),

border='white ');grid(lty=1, col='white ');par(new = T)

plot(larain ,ylab='Precipitacion ',xlab='A~no',type='o', col = 4)

#-------------------------------------------------------------------------------

Funcion que incluye las pruebas Portmanteau utilizadas en esta tesis. ”Box-Pierce (1970)”, ”Ljung-Box(1978)”, ”Monti(1994)”, ”La Estadıstica Propuesta(2017)”.

# Test Portamnteau para la independencia de los residuales de un modelo ARMA(p,q).

Portmanteau <- function(y,h=5, metodo = "Box -Pierce",p,q){

ifelse(metodo == "Qm",d<-0.5,ifelse(metodo =="Monti",d<-0,d<-1))

Ti <- length(y)

mod <- arima(y,order=c(p,0,q),method = "ML")

ri <- acf(mod$res ,plot = F, lag.max = h, na.action = na.pass)

pi <- pacf(mod$res ,plot = F, lag.max = h, na.action = na.pass)

if(metodo == "Box -Pierce"){

parametro = h-p-q;wi <- 1}

if(metodo == "Ljung -Box" | metodo == "Monti"){

wi <- (Ti+2)/seq(Ti-1,Ti-h); parametro = h-p-q}

else if(metodo == "Qm"){

wi <- (Ti+2)/seq(Ti-1,Ti-h)*(h-1:h+1)/h

shape = (3/4)*(h^2+h-2*(h-1)*(p+q))^2/(2*h^3+3*h^2+h-6*(h^2-2*h-1)*(p+q));

scale = (2/3)*(2*h^3 +3*h^2+h-6*(h^2-2*h-1)*(p+q))/(h*(h^2+h-2*(h-1)*(p+q)));

parametro = c(shape ,scale)}

Q <- Ti*(d*sum(wi*identity(ri$acf[1:h]^2))+(1-d)*sum(wi*identity(pi$acf[1:h]^2)))

ifelse(metodo == "Box -Pierce" | metodo == "Ljung -Box" | metodo == "Monti",

vp <- pchisq(Q,parametro ,lower.tail = F),

vp <- pgamma(Q,shape=shape ,scale=scale ,lower.tail = F))

list("Q"= Q,"Parametro"= parametro ,"vp"= vp)}

#--------------------------------------------------------------------------------

Los 15 modelos ARMA(p,q) estacionarios e invertibles, simulados en el estudio con p,q 6 2. Algunos deestos modeloes fueron extraidos del estudio de Safi & Al-Reqep en el 2014.

########### Lista de los 15 modelos prpuestos ARMA(p,q) con p,q <= 2 ###########

mod = list(list(ma=0.7), #Modelo_1 MA(1)

list(ma=0.4), #Modelo_2 MA(1)

list(ma=-0.5), #Modelo_3 MA(1)

list(ar=c(0.5,0.3)), #Modelo_4 AR(2)

list(ar=c(1.2,-0.73)), #Modelo_5 AR(2)

list(ma=c(1,-0.6)), #Modelo_6 MA(2)

list(ma=c(0.24,0.1)), #Modelo_7 MA(2)

list(ar=0.6,ma=0.4), #Modelo_8 ARMA(1,1)

list(ar=0.5,ma=-0.7), #Modelo_9 ARMA(1,1)

list(ar=-0.2,ma=-0.6), #Modelo_10 ARMA(1,1)

list(ar=c(0.7,0.2),ma=-0.5), #Modelo_11 ARMA(2,1)

list(ar=c(1,-0.35),ma=0.1), #Modelo_12 ARMA(2,1)

list(ar=0.4,ma=c(-0.6,0.3)), #Modelo_13 ARMA(1,2)

list(ar=c(0.9,-0.3), ma=c(1.3,-0.5)),#Modelo_14 ARMA(2,2)

list(ar=c(0.4,-0.3), ma=c(-0.3,1.1)))#Modelo_15 ARMA(2,2)

#--------------------------------------------------------------------------------

Facultad de Estadıstica, diciembre 2017

Una nueva prueba Portmanteau 23

Ajuste Empırico de las distribuciones utilizando los 15 modelos propuestos. Graficas de los Histogramascon ajuste de la densidad y prueba K-S.

####################### Ajuste Empırico de la Estadıstica ######################

AR <- c(0,0,0,2,2,0,0,1,1,1,2,2,1,2,2)

MA <- c(1,1,1,0,0,2,2,1,1,1,1,1,2,2,2)

Nsim <- 10000

system.time(for(i in 1:Nsim){for(j in 1:15){

Q[i,j] = Portmanteau(arima.sim(n=500, model=mod[[j]]),

h = 30,metodo="Qm",p=AR[j],q=MA[j])$Q}})

# Histogramas de la estadıstica Qm

par(mfrow=c(3,5),mar=c(2.8,2.5,2.5,2),mgp=c(1.6,.6,0),xpd=TRUE)

# Graficas

Sh <- c(rep(11.03157,3),rep(10.64993,7),rep(10.2972,3),rep(9.985325,2))

Sc <- c(rep(1.317431,3),rep(1.273874,7),rep(1.223633,3),rep(1.165043,2))

for(i in 1:15){

hist(Q[,i], freq=F, col = "black", border="white",main = "", xlab="")

curve(dgamma(x,shape =Sh[i], scale=Sc[i]), add=T, col = "blue",lwd=2)}

# Prueba de Kolmogorvo Smirnov

KS <- NULL

for(i in 1:15){

KS[i] = ks.test(Q[,i],"pgamma",shape = Sh[i], scale = Sc[i])$p.val}

cbind(Modelo = 1:15,"K-S.PV" = round(KS ,4))

#--------------------------------------------------------------------------------

Potencia de las pruebas Portmanteau, evaluando en los 15 modelos para datos pequenos t = 50, paradatos medianos t = 200, para datos grandes t = 500, con rezagos h=5,10,15 y 20. Ajustando un modeloARMA(1,0) para todos los casos y Con 10.000 simulaciones montecarlo para un nivel de significancia delα = 0.05.

###################### Potencia de las Pruebas Portmanteau #####################

Nsim <- 10000 # Numero de simulaciones

t = 50 # t=200; t=500 longitud de la serie

l = 5 # l= 10; l= 15; l= 20 rezagos

vp1<-vp2<-vp3<-vp4<-matrix(NA,nrow = Nsim , ncol = length(mod))

for(i in 1:Nsim){

for(j in 1:length(mod )){

vp1[i,j]= Portmanteau(arima.sim(model=mod[[j]],n=t),h=l,metodo="Box -Pierce",p=1,q=0)$vp

vp2[i,j]= Portmanteau(arima.sim(model=mod[[j]],n=t),h=l,metodo="Ljung -Box",p=1,q=0)$vp

vp3[i,j]= Portmanteau(arima.sim(model=mod[[j]],n=t),h=l,metodo="Monti",p=1,q=0)$vp

vp4[i,j]= Portmanteau(arima.sim(model=mod[[j]],n=t),h=l,metodo="Qm",p=1,q=0)$vp}}

Box.P = as.matrix(sapply(1:length(mod),function(i) rbind(mean(vp1[1:Nsim ,i]<0.05))))

Ljung = as.matrix(sapply(1:length(mod),function(i) rbind(mean(vp2[1:Nsim ,i]<0.05))))

Monti = as.matrix(sapply(1:length(mod),function(i) rbind(mean(vp3[1:Nsim ,i]<0.05))))

m_0.5 = as.matrix(sapply(1:length(mod),function(i) rbind(mean(vp4[1:Nsim ,i]<0.05))))

Res <- cbind(1:15,Box.P,Ljung ,Monti ,m_0.5)

colnames(Res) <- c("Modelo","Q_BP","Q_LB","Q_M","Q_m");print(Res)

#--------------------------------------------------------------------------------

####################### Ejemplo Datos Reales usconsumption #####################

library(fpp)

data("usconsumption")

par(mar=c(3,3,1,2),mgp=c(1.6,.6,0)); layout(rbind(c(1, 1), c(2, 3)))

plot(usconsumption[,1], ylab = 'Variacion porcentual del gasto',

xlab = 'A~nos', type = 'o',col=4) #Grafico serie temporal

acf(usconsumption[,1], xlab = "Rezago", main = " ", lag.max = 20)#Grafico ACF

pacf(usconsumption[,1], xlab = "Rezago", main = " ", lag.max = 20)#Grafico PACF

fit <- auto.arima(usconsumption[,1],seasonal=FALSE)

summary(fit)

eacf(usconsumption[,1])

#--------------------------------------------------------------------------------

Facultad de Estadıstica, diciembre 2017


Recommended