Introducción a modelos ARIMA

En alguno casos, cuandos nos enfrentamos a diferentes series temporales puede ocurrir situaciones en las cuales la serie de interés no posee un comportamiento estacionario en covarianza, debido a que éstas pueden poseer estructuras de tendencia, estacionalidad o variabilidad no constante, que hacen que los métodos de ajuste de modelos ARMA no sea adecuado.

Debido a lo anterior, en ocasiones la respuesta a tales estructuras, es emplear transformaciones que permitan llevar a la serie temporal a una estructura estacionaria, para así poder modelarla.

Operador de diferencias

El operador de diferencias denotado por el simbolo $\Delta$, es aquel que calcula la diferencia entre la serie original y la serie rezagada un periodo, tal que si se requiere calcula la primera diferencia del $Y_t$, entonces se simbolizamos esta como $\Delta Y_t$,y la calculamos como la diferencia entre $Y_t$ con $Y_{t-1}$ para $t=2,\ldots,T$.

Por su parte, la segunda diferencia de $Y_t$, se simboliza por $\Delta^2 Y_t$ y estará dado por la diferencia entre $\Delta Y_t$ y $\Delta Y_{t-1}$ para $t=3,\ldots,T$. en donde se puede observar que \begin{align*} \Delta^2 Y_t & = \Delta(\Delta Y_t) \\ & = \Delta Y_t - \Delta Y_{t-1} \\ & = Y_t- 2(Y_{t-1})+Y_{t-2} \\ & = (1-L)^2 Y_t \end{align*}

siendo $L$ el operador de rezagos explicado en la clase Clase 08. En general, se tendrá que un proceso diferenciado de orden $d$ se simbolizará por $\Delta^d Y_t = $ y estará dado por \begin{align*} \Delta^d Y_t = (1-L)^d Y_t \end{align*}

Además, si al diferenciar una serie temporal $d$ veces, con $d \in \mathbb{Z}^+$, y se obtiene un serie estacionaria como resultado, entonces se podrá decir que el proceso original es homogéneo de orden $d$.

Procesos integrados

Diebold (2007, p. 289) define a los procesos integrados como aquellas series $Y_t$ que no poseen una estructura estacionaria, pero que al ser diferenciadas, obtienen dicha estructura.

Dado lo anterior, se tendrá que si una serie temporal requiere una (1) diferencia para obtener una estructura estacionaria, entonces la serie se denomina como integrada de orden $1$ y se denotará por $I(1)$. En general, si la serie temporal requiere ser diferenciada $d$ veces para obtener una estructura estacionaria, con $d\in \mathbb{Z}^+$, entonces se dirá que la serie se denomina como integrada de orden $d$ y es denotada como $I(d)$.

Modelos autorregresivos integrados de media móvil (ARIMA)

Se dice que una serie de tiempo $\widetilde{Y}_t=Y_t-\mu$ posee una estructura ARIMA(p,d,q) si se tiene que al realizar la $d$-ésima diferencia, se obtiene que $\Delta^d Y_t$posee la estructura de un proceso ARMA estacionario, tal que \begin{align*} \Phi_p (L) \Delta^d \widetilde{Y}_t = \Theta_q (L)\varepsilon_t \end{align*} donde $\Phi_p(z) = 1 - \sum_{j=1}^p\phi_j z^j$ y $\Theta_q(z) = 1 + \sum_{j=1}^q\theta_j z^j$ son los polinomios de rezagos autorregresivo y de medias móviles, respectivamente, cada uno con módulo mayor a 1, $\Delta^d=(1-L)^d$ es el operador de diferencias, con $L$ el operador de rezagos y $\varepsilon_t \sim RB(0, \sigma_{\varepsilon}^2)$.

De acuerdo a lo anterior, se podrán derivar dos casos particulares de los modelos ARIMA(p,d,q). El primero será un proceso en el cual se tiene un orden autorregresivo $p = 0$, en este caso se tendrá lo que se conoce como un proceso integrado de media móvil ARIMA(0,d,q) = IMA(d,q), mientras el segundo será un proceso en el cual se tiene un orden de media móvil $q = 0$, obteniendo lo que se conoce como un proceso autorregresivo integrado ARIMA(p,d,0)=ARI(p,d).

Raices unitarias

Suponga un modelo ARMA(p,q) tal que \begin{align*} \Phi_p (L)\widetilde{Y}_t = \Theta_q (L)\varepsilon_t \end{align*}

con $\varepsilon_t \sim RB(0, \sigma_{\varepsilon}^2)$, entonces, si una de las $p$ raices de la ecuación $\Phi_p(z) = 1 - \sum_{j=1}^p=\phi_j z^j = 0$ es $z = 1$ entonces se tendrá que $Y_t$ tiene una raíz unitaria.

En dicho caso, podremos factorizar el polinomio $\Phi_p(z)$ como $\Phi_p(z) = (1-z)\Phi_{p-1}(z)$, un polinomio de grado $p-1$, obteniendo con ello \begin{align*} \Phi_{p-1}(L)(1-L)\widetilde{Y}_t = \Theta_q (L)\varepsilon_t \end{align*}

Entonces, si $Y_t\sim ARMA(p,q)$ con una raíz unitaria, entonces se tendrá que $\Delta Y_t\sim ARMA(p-1,q)$ o equivalentemente $Y_t\sim ARIMA(p,1,q)$, siendo $d=1$.

Prueba Dickey-Fuller aumentada

Con el fin de identificar si una serie temporal $Y_t$ posee raices unitarias, se introduce la prueba Dickey-Fuller Aumentada, la cual asume que es posible aproximar a $Y_t\sim AR(p)$ asumiendo tres casos, media cero, media diferente de cero y tendencia lineal.

el primer tipo, es un modelo lineal con media cero y sin tendencia lineal con respecto al tiempo. \begin{align*} \Delta Y_t = \gamma Y_{t-1} + \sum_{j=2}^p \phi_j \Delta Y_{T-j+1} + \varepsilon_t \end{align*}

con $\gamma = \phi_1 - 1$. Entonces is hay raices unitarias se cumplirá que $\phi_1 = 1$ o equivalentemente $\gamma=0$.

El segundo tipo, es un modelo lineal con media diferente de cero y sin tendencia lineal respecto al tiempo. \begin{align*} \Delta Y_t = \mu + \gamma Y_{t-1} + \sum_{j=2}^p \phi_j \Delta Y_{T-j+1} + \varepsilon_t \end{align*}

y el tercer tipo, es un modelo lineal con media diferente de cero y con tendencia lineal respecto al tiempo. \begin{align*} \Delta Y_t = \mu + \beta t + \gamma Y_{t-1} + \sum_{j=2}^p \phi_j \Delta Y_{T-j+1} + \varepsilon_t \end{align*}

En general se buscará probar el siguiente juego de hipótesis \begin{align*} H_0: Y_t \text{ posee raices unitarias (no es estacionaria)} \\ H_1: Y_t \text{ no posee raices unitarias (es estacionaria)} \end{align*}

la cual, como se señaló es equivalente a probar \begin{align*} H_0: \gamma = 0 \\ H_1: \gamma < 0 \end{align*}

El estadístico de prueba, se define entonces como \begin{align*} \tau = \frac{\hat{\gamma}}{se(\hat{\gamma})} \end{align*}

siendo $\hat{\gamma}$ el coeficiente estimado, y $se(\hat{\gamma})$ el error estándar del coeficiente estimado. Además, el P-valor de la prueba se define como

con un P-valor dado por \begin{align*} \text{P-valor} = \mathbb{P}(\tau<\tau_\alpha) \end{align*}

La prueba Dickey-Fuller puede realizarse en R, mediante la función adf.test() de la librería aTSA o la función adfTest() de la librería fUnitRoots o la función adf.test() de la librería tseries.

Alternativamente, puede observarse el número de diferencias recomendadas R mediante la función ndiffs de la librería forecast con argumento test="adf".

Prueba Phillips-Perron

La prueba Phillips-Perron puede realizarse en R, mediante la función pp.test de la librería aTSA.

Alternativamente, puede observarse el número de diferencias recomendadas R mediante la función ndiffs de la librería forecast con argumento test="pp".

Prueba Kwiatkowski-Phillips-Schmidt-Shin

La prueba Kwiatkowski-Phillips-Schmidt-Shin puede realizarse en R, mediante la función kpss.test de la librería aTSA.

Alternativamente, puede observarse el número de diferencias recomendadas R mediante la función ndiffs de la librería forecast con argumento test="kpss".

Ajuste de modelo ARIMA

Una vez identificado el orden apropiado de diferenciación, d, asociado a la serie de tiempo $Y_t$, se realiza el mismo procedimiento explicado en la Clase 09 para identificar el orden p y q que posee la serie de diferencias.

Finalmente, identificados satisfactoriamente los ordenes p,d,q del modelo ARIMA, es posible realizar la estimación del modelo ARIMA(p,d,q) para la serie original, mediante el procedimiento explicado en la Clase 09, junto con la validación de los correspondientes supuestos que debe cumplir el modelo ajustado, los cuales se fueron explicados en la Clase 10.

Bibliografía

Diebold, F. (2007). Elements of forecasting. Thomson South-Westem.