+ All Categories
Home > Documents > ANALISIS DE DATOS ESTADISTICOSYt es una variable aleatoria escalar (vectorial) referida a la unidad...

ANALISIS DE DATOS ESTADISTICOSYt es una variable aleatoria escalar (vectorial) referida a la unidad...

Date post: 10-Feb-2021
Category:
Upload: others
View: 4 times
Download: 0 times
Share this document with a friend
52
ANALISIS DE DATOS ESTADISTICOS Tema V: Introducción al Análisis de Series Temporales Observatorio de la Realidad Social Gobierno de Navarra Septiembre – Noviembre 2017 Alba Del Villar, Estudiante Doctorado Economía [email protected] Alba Del Villar (UPNA) Series Temporales Noviembre 2017 1 / 52
Transcript
  • ANALISIS DE DATOS ESTADISTICOS

    Tema V: Introducción al Análisis de Series TemporalesObservatorio de la Realidad Social

    Gobierno de NavarraSeptiembre – Noviembre 2017

    Alba Del Villar, Estudiante Doctorado Economí[email protected]

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 1 / 52

  • Outline

    1 Repaso conceptos básicos

    2 Análisis de Series Temporales

    3 Metodos clásicos de análisis de series temporales

    4 Procesos estocásticos

    5 Modelos AR, MA, ARMA, ARIMA

    6 Estrategia Box and Jonkins

    7 Predicción de series temporales

    8 Algoritmo de análisis de series temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 2 / 52

  • Análisis univariante

    Media aritmética: Valor centralModa: Categoría más repetidaMediana: Divide la distribución de frecuencias en 1/2 y 1/2Rango o amplitud total: Distancia puntuación max y minVarianza: Promedio de los cuadrados de las desv w.r.t mediaDesviación típica: Raiz cuadrada de la varianzaCoeficiente de variación: Indice de variabilidadAsimetría de Pearson:

    Negativa (AS0): Media>Mo

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 3 / 52

  • Analisis bivariante

    A: Nominal x Nominal: El análisis de la relación entre las variables(o si son independientes) se realiza a partir de las diferenciasentre las frecuencias empíricas y las frecuencias teóricas (sonaquellas que se obtienen cuando ambas variables sonindependientes).B: Nominal x Ordinal: Gamma de Goodman, Kruskal, Tau BKendal, Tau C Kendal, D de Somer...C: Cualitativa x Cuantitativa: Dicot0́mica (T Student) y Análisis devarianzaD: Cuantitativa x Cualitativa (Análisis de correlación y RegresiónLineal Simple)

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 4 / 52

  • Analisis ANOVA

    Un factor: Explicar hasta que punto la variación de una variablediscreta (X) influye en la variación de otra variable cuantitativa (Y)Condiciones: Normalidad, homoscedasticidad e independenciaFormulación del modelo ( ANOVA)Fuentes de variación: Comparación entre grupos¿Quéexplica el modelo?

    Yij = ν + αj + eij (1)

    Dos factores: Explicar hasta que punto la variación de dosvariables discretas influye en la variación de otra variablecuantitativa (Y)

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 5 / 52

  • Análisis de Regresión

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 6 / 52

  • Link entre la dependiente y las independientes

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 7 / 52

  • Breve historia

    Una de las primeras aplicaciones procesos estocásticos AR: G. UYule and J. Walker entre 1920 y 1930.Herman Wold desarrolló el modelo ARMA (AutoRegressiveMoving Average) pero no pudo derivar la función de probabilidady estimación de los parametros.1970: "Time Series Analysis" de G. E. P. Box and G. M. Jenkinscon un procedimiento completo de modelaje de series:Especificación, Estimación, Diagnóstico, Predicción.1980: Desarrollan test de raices unitarias por C. W. J Granger andR. F. Engle, para series no estacionarias. Posible cointegración delas series no estacionarias a través de una raiz unitaria común.

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 8 / 52

  • Matemáticas y series temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 9 / 52

  • Matemáticas y series temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 10 / 52

  • Conceptos básicos

    Una serie temporal es una colección de observaciones de unavariable realizadas de forma secuencial en el tiempo, en las queel orden de observación es importante.Estudiar y modelizar el comportamiento de un fenómeno queevoluciona a lo largo del tiempo y realizar previsiones de losvalores que se alcanzarán en el futuro.Pretende extraer las regularidades que se observan en elcomportamiento pasado de la variable, es decir, obtener elmecanismo que la genera.Las ventas trimestrales de una empresa, el numero de casosmensuales de personas afectadas por el sida, la cantidad deaccidentes semanales de trafico o el numero de exportacionesefectuadas cada ano por un determinado país...

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 11 / 52

  • Análisis preliminar de la serie temporal

    Nivel: Medida local de tendencia central (media), de cada periodode tiempo que consideremos.Ésta medida es estable? Tiende a centrarse en un puntoespecífico en el tiempo?Tendencia: Representa el movimiento general de una variable alargo plazo de una serie temporalComponente cíclico: Representa oscilaciones de la variable conuna amplitud superior a un astacionalidad: Representaoscilaciones de la variable aleatoria de una periodicidad igual oinferior al ano.Residuo: Movimiento que no muestra un carácter periódicoreconocible

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 12 / 52

  • Ejemplo I: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 13 / 52

  • Ejemplo II: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 14 / 52

  • Ejemplo III: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 15 / 52

  • Ejemplo IV: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 16 / 52

  • Ejemplo V: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 17 / 52

  • Ejemplo VI: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 18 / 52

  • Ejemplo VII: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 19 / 52

  • Ejemplo VIII: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 20 / 52

  • Ejemplo IX: Series Temporales

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 21 / 52

  • Ruido Blanco, Senal Aleatoria o Estocástica

    (�) es una serie temporal puramente "ruidosa" por naturaleza.Es un caso particular de un proceso estocástico general en el cuallas variables aleatorias que lo forman no están correlacionadas.Se cumplen las siguientes condiciones,

    E(�t) = 0, ∀t (2)

    E(�2t ) = Vt(�t) = σ2, ∀t (3)

    E(�t , �t−s) = C(�t , �t−s) = 0,∀t , s (4)

    Ejemplos: Alarma de las ambulancias, TV canal no sintonizado,generación variables aleatorias

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 22 / 52

  • Ruido blanco generado de forma artificial

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 23 / 52

  • Metodos clásicos de análisis de series temporales

    Decomposición estacionalMetodo descriptivo: Descomponer la serie en tendencia-ciclo(Ct ,Tt ), estacionalidad (St ) y ruido(Et )Separar la tendencia y el ciclo.Separar tendencia y estacionalidadSupuestos para pronosticar: Estacionalidad constante para cada ty ruido media cero.Combinación de los componentes de la serie temporal

    AditivaYt = Ct + Tt + St + Et (5)

    MultiplicativaYt = CtxTtxStxEt (6)

    Métodos de suavizado (alisado): Para series sin comportamientoestacional

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 24 / 52

  • Descomposición estacional

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 25 / 52

  • Descomposición estacional:Pronostico

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 26 / 52

  • Tendencia y estacionalidad

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 27 / 52

  • Procesos estocásticos

    Un proceso estocástico es una secuencia de variables aleatorias,ordenadas y equidistantes cronologicamente, referidas a una(proceso univariante o escalar) o a varias (proceso multivariante ovectorial) características de una unidad observable en diferentesmomentos.Proceso estocástico univariante (multivariante)

    ...,Yt−1,Y0,Y1,Y2, ...; (Yt : t = 0,±1,±2, ...) (7)

    Yt es una variable aleatoria escalar (vectorial) referida a la unidadobservable considerada en el momentoLa serie temporal es un periodo muestral que tan sólo se refiere auna parte de la historia del proceso estocástico del que procededicha serie

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 28 / 52

  • Procesos estacionarios

    Un proceso estocástico (Yt ) es estacionario cuando laspropiedades estadísticas de cualquier secuencia finita Yt1,Yt2 ,...,Ytn (n >= 1) de componentes de (Yt ) son semejantes a las dela secuencia Yt1+h,Yt2+h , ...,Ytn+h para cualquier número enteroh = ±1,±2, ...Explotar la relación de simetría entre Yt y sus los valores previosy los siguientes, para poder pronosticar valores futuros de Yt .Condiciones:

    Esperanza matemática constante E(yt) = ν para todo tVarianza constante V (yt) = γ0 para todo tCovarianza constante (separación): C(Yt ,Yt−s) = γs para todo t

    Estacionaridad estricta y débil

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 29 / 52

  • Series estacionarias

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 30 / 52

  • Series no estacionarias

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 31 / 52

  • Procesos no estacionarios

    Un proceso estocástico (Yt ) es NO estacionario cuando laspropiedades estadísticas de al menos una secuencia finitaYt1,Yt2 , ...,Ytn (n >= 1) de componentes de (Yt ) son diferentes alas de la secuencia Yt1+h,Yt2+h , ...,Ytn+h para al menos unnúmero entero h = ±1,±2, ...i.e., La esperanza incondicional de algunos de sus componenteses distinta de la de otrosTransformar de forma adecuada para obtener series de aspectoestacionario: estabilizar su dispersión ( inducir estacionariedad envarianza) o para estabilizar su nivel (eliminar su tendencia oinducir estacionariedad en media).Modelos ARIMA: integrado de orden I. I(0), I(1), I(2)...

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 32 / 52

  • Concepto clave: Autocorrelacion ACF, PACF

    ACF:La autocorrelación simple de orden k (k > 0) de un proceso(Yt ) estacionario se representa con el símbolo ρk y se definecomo;

    ρk ≡Cov [Yt ,Yt+k ]

    Var [Yt ]1/2Var [Y1/2t+k ]

    ≡ γkγ0

    (8)

    PACF:La autocorrelación parcial de orden k (k > 0) de unproceso (Yt ) estacionario se representa con el símbolo ψkk y sedefine como el parametro en la siguiente regresión;

    Ỹt = ψk1 ˜Yt−1 + ψk2 ˜Yt−2 + ...+ ψkk ˜Yt−k + Ut (9)

    donde˜Yt−i = Yt−i − µY (i = 0,1, ..., k) (10)

    y Ut es independiente de Yt−t para todo i

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 33 / 52

  • Modelos autoregresivos AR(p)

    Un proceso estacionario Yt sigue un modelo AR(1), autoregresivode primer orden o p-orden, cuando la variable Yt se obtieneefectuando una regresión sobre valores pasados de la misma.Entonces, Yt ,

    Yt = f (Yt−1,Yt−2,Yt−3,Yt−4, ...Yt−p, �t) (11)

    Se puede representar de la siguiente forma, donde los valores deψ son claves para determinar p

    Yt = ψ0 +ψ1Yt−1 +ψ2Yt−2 +ψ3Yt−3 +ψ4Yt−4 + ..+ψpYt−p�t (12)

    ACF de un modelo AR(p) no se corta, tiende a cero rápidamente,exponencialmente, muchos coeficientes distintos de ceroPACF de un modelo AR(p) se corta (se hace cero) en el orden delmodelo (p).

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 34 / 52

  • Identificación del modelo AR(2)

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 35 / 52

  • Modelos medias moviles MA(q)

    Un proceso estacionario Yt sigue un modelo MA(1),de mediasmóviles de primer orden o q-orden cuando variable Yt se obtienecomo un promedio de variables de ruido blanco (�), siendo (θ) loscoeficientes de ponderación.

    Yt = f (�t−1, �t−2, �t−3, �t−4, ...�t−q) (13)

    Se puede representar de la siguiente forma, donde los valores deθ son claves para determinar q

    Yt = β0 + �t + θ1�t−1 + θ2�t−2 + θ3�t−3 + ...+ θq�t−q (14)

    ACF de un modelo MA(q) se corta (se hace cero) en el orden delmodelo (q) y caracteriza los procesos de medias mes.PACF de un modelo MA(q) no se corta, tiende a cero rdamente,exponencialmente. Muchos coeficientes distintos de cero.

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 36 / 52

  • Identificación del modelo MA(3)

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 37 / 52

  • Autoregressive Moving Average Processes: ARMA

    Un proceso estocástico estacionario (Yt ) sigue un modeloautorregresivo-media móvil de orden (p,q), o ARMA(p,q), si y sólosi:

    Yt = ψ0 + ψ1Yt−1 + ..+ ψpYt−p + θ1�t−1 + ...+ θq�t−q + �t (15)

    para todo t = 0,±1, ±2,..., donde At sigue una IID (0, σ2A)ACF de un modelo ARMA(p,q) presenta muchos coeficientesdistintos de cero ( AR model)PACF de un modelo ARMA(p,q) presenta muchos coeficientesdistintos de cero ( MA model)

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 38 / 52

  • Modelos ARMA, AR and MA

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 39 / 52

  • ACF and PACF I

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 40 / 52

  • ACF and PACF II

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 41 / 52

  • ACF and PACF III

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 42 / 52

  • ACF and PACF IV

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 43 / 52

  • ACF and PACF V

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 44 / 52

  • ACF and PACF VI

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 45 / 52

  • ACF and PACF VII

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 46 / 52

  • ACF and PACF VIII

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 47 / 52

  • ACF and PACF IX

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 48 / 52

  • Identificación y selección del modelo

    Comprobar la significatividad de los coeficientes:Para valores significativos de ψ, se sugiere AR(p)Para valores significativos de θ, se sugiere MA(q)Si no se presenta significatividad: ruido blanco

    Check ACF y PACF, para determinar el valor de p y qSi ACF es significativo y tiende a cero (AR), si corta indica MA(q)Si PACF es significativo y tiende a cero (MA), si corta indica AR(p)Si ACF y PACF es significativo y tiende a cero: ARMA

    Debe considerarse como un proceso iterativo. De especifico ageneral.Los datos reales raramente se comportan como nuestrosmodelos indican. Supuestos de modelo lineal, estacionario y deltipo ARMA.

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 49 / 52

  • Estimación y Diagnóstico del modelo

    La estimación del modelo es compleja y no tiene soluciónesanalíticas cerradas para p,q, I. Maximum Likehood methods,methods of moments...Construir estimaciones para los residuos (errores)Modelo correcto: Residuos reales serán ruido blanco y AFC nosignificativa.Modelo incorrecto: Residuos reales NO serán ruido blanco:correlación. Si ACF significativa en k = 2, MA(1), si decaepaulatinamente AR(2).Valor mínimo de los test AIC/BIC/SBIC presenta la mejorselección del modelo

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 50 / 52

  • Predicción de series temporales

    La importancia de la selección del modelo: Nos provee con unmodelo que encaja con los datos observados y1, y2, ...,yT y nospermite predecir los valores futuros de la serie yT+1, yT+2, ...,yT+s. La idea es que el modelo genera datos dentro de lamuestra y despues, entonces las prediciones se pueden realizarvia extrapolación.Se necesita una regla o un mecanismo para generar la predicción.

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 51 / 52

  • Algoritmo de análisis de series temporales

    Comprobar que la serie Yt no es ruido blanco (E non-cero)Comprobar que Yt es estacionaria i .e., I(0)

    Si no: Hacer que sea estacionaria i.e., dYt , log(YT ), I(1),I(2)

    Computar ACF y PACFComputar posibles modelos, AR(0),AR(1)...MA(0),MA(1),...ARMA(0,0), ARMA(1,1)...Comparar AIC/BIC/SBIC valoresSeleccionar modelo con valor menor en el paso anteriorComputar ACF y PACF y comprobar que se ajusta al modeloseleccionadoComputar ACF y PACF de los errores/residuos.Comprobar que los residuos/errores son ruido blancoPredecir valores futuros para Yt

    Alba Del Villar (UPNA) Series Temporales Noviembre 2017 52 / 52

    Repaso conceptos básicosAnálisis de Series TemporalesMetodos clásicos de análisis de series temporalesProcesos estocásticosModelos AR, MA, ARMA, ARIMAEstrategia Box and JonkinsPredicción de series temporalesAlgoritmo de análisis de series temporales


Recommended