Identificación y ajuste de modelos ARMA

Como se señaló previamente, es posible identificar el orden del proceso estocástico que mejor ajusta a una serie de tiempo, mediante el análisis de las funciones de autocorrelación y autocorrelación parcial muestral obtenida a partir de la serie. En donde, como se presentó en la Clase 08, es posible identificar el orden p de un proceso AR(p) mediante su PACF, mientras que el orden q de un proceso MA(q) mediante su ACF. Sin embargo, en el caso de un proceso ARMA(p,q), no es posible identificar los valores p y q por inspección directa de las gráficas de la ACF y PACF muestrales, debido a que el patrón esperado en ambas gráficas posee una forma decreciente.

Adicionalmente, cabe señalar que no siempre es posible identificar correctamente el orden p y q de los modelos AR, MA o ARMA mediante el empleo de la ACF y PACF muestral, y por tanto, el interés se centra en restringir el conjunto de todos los posibles modelos ARMA, a un subconjunto de modelos que en principio pueden representar los rasgos principales de la serie.

Dado lo anterior, a continuación se señalan algunos aspectos a tener en cuenta a la hora de realizar el proceso de identificación:

  • Cuando el proceso sigue un modelo AR(p), se observa que la ACF muestral presenta un patrón de cola decreciente, con decaimiento exponencial y/o sinusoidal, mientras que la PACF muestral presenta un patrón de corte, el cual indica el orden autorregresivo p.
  • Cuando el proceso sigue un modelo MA(q), se observa que la PACF muestral presenta un patrón de cola decreciente, con decaimiento exponencial y/o sinusoidal, mientras que la ACF muestral presenta un patrón de corte, el cual indica el orden de media móvil q.
  • Es conveniente proponer modelos simples que expliquen los rasgos obvios del proceso en su ACF y PACF, comenzando con modelos AR y MA preferiblemente de orden bajo, buscando evitar la identificación inicial de modelos tipo ARMA, ya que, si p$\geq$q$\geq$1, la ACF y la PACF no tienen un patrón general.
  • Una alternativa para identificar la pareja de órdenes (p, q) de un modelo ARMA, consiste en buscar dentro de un rango inicial, por ejemplo p, q = 0, 1, . . . , 10, que minimice alguna función de $\hat{\varepsilon}^2$, como por ejemplo el AIC, BIC o AICC, o mediante la función de autocorrelación extendida (EACF).

Métodos en minimización de criterios de información

Como su nombre lo indica, los métodos de minimización de criterios de información, consisten en tratar de identificar el verdadero orden p y q de los modelos ARMA, a partir de la estimación de diferentes modelos y la minimización de los criterios de información AIC, BIC o AICC.

Estos críterios son calculados a partir de los residuales obtenidos en el ajuste de los modelos. Además, cuando el modelo ARMA verdadero es de orden finito, se tendrá que el orden p y q usando el criterio BIC serán consistentes, es decir, a medida que aumenta el tamaño de la serie, éstos se aproximarán a los ordenes p y q verdaderos. Mientras que, si el modelo ARMA verdadero no es de orden finitos, entonces el AIC, o el AICC será el criterio que conduzca a los ordenes p y q más próximo al verdadero proceso dentro de todos los modelos bajo estudio.

A saber, para el cálculo del AIC, BIC y AICC se tienen las siguientes ecuaciones \begin{align*} AIC & = 2k - 2\text{ ln}(\hat{L}) \\ BIC & = ln(n)k-2ln(\hat{L})\\ AICC & = 2k - 2\text{ ln}(\hat{L}) + \frac{2k^2 + 2k}{n-k-1} \end{align*}

donde, $\hat{L}$ es el valor que maximiza la función de verosimilitud del modelo estimado, $k$ es el número de parámetros en el modelo, $n$ es el número de observaciones.

Para la estimación de un modelo ARMA en R, puede emplearse las función arima() y Arima() de la librería stats y forecast, respectivamente, mientras que, para la estimación de un modelo ARMA en R mediante la minimización del criterio de información e Akaike (AIC), criterio de información Bayesiana (BIC) y/o el criterio de información de Akaike corregido (AICC), es posible emplear la función auto.arima() y armasubsets() de la librería forecast y TSA, respectivamente.

Método de identificación basado en la función de autocorrelación extendida (EACF)

Una alternativa para la identificación de un modelo ARMA, es mediante la función de autocorrelación extendida, la cual posee un desempeño relativamente bueno, cuando el tamaño de la serie de tiempo es grande. Esta función usa el hecho de que si la parte AR de un ARMA fuese conocida, entonces al filtrar de la serie esta componente mediante regresión, se obtendría un proceso MA puro con la propiedad de patrón de corte en su ACF.

Para ellos, Wei (2006, p. 129) señala que se deben estimar los coeficientes AR mediante una sucesión finita de regresiones, en donde, se inicia con un valor p, y se realiza una regresión mediante mínimos cuadrados ordinarios de $\widetilde{Y}_t$ contra sus primeros p rezagos, $\widetilde{Y}{t-1}, \widetilde{Y}{t-2}, \ldots, \widetilde{Y}{t-p}$. \begin{align*} \widetilde{Y}{t} = \sum_{i=1}^p \phi_i^{(0)}\widetilde{Y}{t-i} +\varepsilon_t^{(0)}, \quad \quad t = p + 1, \ldots, T \end{align*} Una vez realizada la estimación, se realiza la evaluación de los residuales $\hat{\varepsilon}_t^{(0)}$para observar si éstos son ruido blanco. Si los residuales $\hat{\varepsilon}_t^{(0)}$, no posee un comportamiento de ruido blando, entonces se realiza el ajuste de un segundo modelo de regresión de $\widetilde{Y}_t$ contra sus primeros p rezagos, $\widetilde{Y}{t-1}, \widetilde{Y}{t-2}, \ldots, \widetilde{Y}{t-p}$ y el rezago de orden uno de los residuales del primer modelo $\hat{e}_{t-1}^{(0)}$. \begin{align*} \widetilde{Y}{t} = \sum_{i=1}^p \phi_i^{(1)}\widetilde{Y}{t-i} + \theta_1^{(1)} \hat{\varepsilon}_{t-1}^{(0)}+\varepsilon_t^{(1)}, \quad \quad t = p + 2, \ldots, T \end{align*} Una vez realizada la estimación, se realiza nuevamente la evaluación de los residuales $\hat{\varepsilon}_t^{(1)}$para observar si éstos son ruido blanco. Si nuevamente se observa que los residuales $\hat{\varepsilon}_t^{(1)}$ de este modelo no son un ruido blanco, se ajusta un tercer modelo de regresión de $\widetilde{Y}_t$ contra los primeros p rezagos, $\widetilde{Y}{t-1}, \widetilde{Y}{t-2}, \ldots, \widetilde{Y}{t-p}$, el rezago de orden uno de los residuales $\hat{\varepsilon}_{t-1}^{(1)}$ y los rezagos de orden dos de los residuales $\hat{e}_{t-2}^{(0)}$. \begin{align*} \widetilde{Y}{t} = \sum_{i=1}^p \phi_i^{(2)}\widetilde{Y}{t-i} + \theta_1^{(2)} \hat{\varepsilon}_{t-1}^{(1)} + \theta_2^{(2)} \hat{\varepsilon}_{t-2}^{(0)} + \varepsilon_t^{(2)} \quad \quad t = p + 3, \ldots, T \end{align*} Este procedimiento se repite indefinidamente hasta que no se halle más información en los residuales de los modelos en la regresión. Si el modelo ARMA es de orden (p,q), entonces serán necesarias q regresiones, de la forma \begin{align*} \widetilde{Y}{t} = \sum_{i=1}^p \phi_i^{(q)}\widetilde{Y}{t-i} + \sum_{i=1}^q \theta_1^{(q)} \hat{\varepsilon}_{t-i}^{(q-i)} + \varepsilon_t^{(q)} \quad \quad t = p + q + 1, \ldots, T \end{align*}

Wei (2006, p. 130) señala que en la práctica el verdadero orden p y q del modelo ARMA(p, q) generalmente se desconocen y deben estimarse, y por ello, se sugiere emplear la propuesta realizada por Tsay and Tiao (1984), la cual consta de la realización de un conjunto general de regresiones iteradas para estimar los ordenes p y q, conocidas como autocorrelación de muestra extendida (EACF). Especificamente, para $m=0,1,2,\ldots,$ el orden del modelo AR, sea $\hat{phi}_i^{(m)}$ con $i = 1,\ldots, m$, los coeficientes estimados para la $j$-ésima regresión AR(m) del proceso ARMA $\widetilde{Y}{t}$. Entonces, defina al $m$-ésimo EACF muestral para el rezago $j$, $\hat{rho}^{(m)}$, de $\widetilde{Y}{t}$ como la función de autocorrelación muestral para la serie transformada \begin{align*} W_{t}^{(j)} = (1 - \hat{\phi}_1^{(j)}L-\ldots- \hat{\phi}_m^{(j)}L^m)\widetilde{Y}_{t} \end{align*}

Con el fin de resumir las autocorrelaciones obtenidas mediante $W{t}^{(j)}$ por las diferentes combinaciones de $j$ y $m$, se presenta una tabla donde el elemento en la fila $m$ y columna $j$ toma el valor del símbolo $\times$ si la autocorrelación muestral de $W$ de orden $j$, $\hat{\rho}_j^{(m)}$es significativamente diferente de cero, es decir, si la autocorrelación para la combinación $m,j$ no muestra un comportamiento de ruido blando y toma el valor de $0$ en caso contrario.

Teóricamente, los órdenes p,q del modelo ARMA tendrán un comportamiento de tríangulo de ceros, con vértice superior izquierdo indicando los correspondientes órdenes del proceso ARMA., aunque en la práctica ésto pocas veces ocurre. Para la estimación de la EACF en R, es posible emplear la función eacf() de la librería TSA.

Representación de tabla EACF

MA
AR 0 1 2 3 \(\vdots\)
0 \(\hat{\rho}_1^{(0)}\) \(\hat{\rho}_1^{(1)}\) \(\hat{\rho}_1^{(2)}\) \(\hat{\rho}_1^{(3)}\) \(\vdots\)
1 \(\hat{\rho}_2^{(0)}\) \(\hat{\rho}_2^{(1)}\) \(\hat{\rho}_2^{(2)}\) \(\hat{\rho}_2^{(3)}\) \(\vdots\)
2 \(\hat{\rho}_3^{(0)}\) \(\hat{\rho}_3^{(1)}\) \(\hat{\rho}_3^{(2)}\) \(\hat{\rho}_3^{(3)}\) \(\vdots\)
3 \(\hat{\rho}_4^{(0)}\) \(\hat{\rho}_4^{(1)}\) \(\hat{\rho}_4^{(2)}\) \(\hat{\rho}_4^{(3)}\) \(\vdots\)
\(\ldots\) \(\ldots\) \(\ldots\) \(\ldots\) \(\ldots\) \(\ddots\)

Representación de tabla EACF para modelo ARMA(1,1)

MA
AR 0 1 2 3 \(\vdots\)
0 \(X\) \(X\) \(X\) \(X\) \(\vdots\)
1 \(X\) 0 0 0 \(\vdots\)
2 \(X\) \(X\) 0 0 \(\vdots\)
3 \(X\) \(X\) \(X\) 0 \(\vdots\)
\(\ldots\) \(\ldots\) \(\ldots\) \(\ldots\) \(\ldots\) \(\ddots\)

Bibliografía

Tsay, R. S., and Tiao, G. C. (1984). Consistent estimates of autoregressive parameters and extended sample autocorrelation function for stationary and nonstationary arma models. Journal of the American Statistical Association, 79(385), 84–96.

Wei, W. (2006). Time series analysis: Univariate and multivariate methods. Pearson Addison Wesley.