Introducción

Una serie de tiempo es una secuencia de observaciones registradas y ordenadas de forma periódica, en intervalos de tiempo igualmente espaciados, tales como, días, meses, semestres, años, entre otros. Estas observaciones son caracterizadas por una variable aleatoria $Y_t$, la cual depende del tiempo $t=1,2,\ldots,T$, y donde el objetivo es modelar el comportamiento de $Y_t$ contra $t$, siendo $T$ el número total de observaciones que se tenga en la serie de tiempo.

Un ejemplo de una serie temporal, se presenta a continuación donde se muestra el % anual del $PIB$ per cápita de Colombia, para un intervalo de tiempo anual que va desde 1961 hasta 2017

Otro ejemplo, se presenta para el material particulado $PM_{10}$ y $PM_{2.5}$ en la ciudad de Medellín para el mes de abril del año 2019, para el cual se realizan los registros en intervalos de una hora

Es de anotar que, para el estudio de series de tiempo, se requiere de procedimientos estadísticos diferentes a los análisis empleados tradicionalmente, debido a la dependencia o correlación existente entre los diferentes puntos observados en el tiempo, la cual no permite suponer que el conjunto de datos sea independiente e idénticamente distribuido, y en consecuencia, se hace necesario el empleo de modelos estadísticos que permitan explicar el comportamiento de variables aleatorias que dependan del tiempo, para así poder realizar inferencia sobre éstas.

Entre los principales objetivos del análisis de series de tiempo, se destaca el comprender, describir e identificar patrones en el comportamiento de las series, evidenciar el efecto de acciones o decisiones pasadas (intervenciones), realizar pronósticos que contribuyan al proceso de toma de decisiones, entre otros.

Pronósticos

Un pronóstico es una predicción de algún evento futuros, que se hace a partir de los datos pasados que se conocen sobre el suceso específico. Generalmente, los pronósticos son empleados en la toma de decisiones, pues permiten disminuir la incertidumbre sobre el futuro, facilitan los procesos de planificación y control.

Métodos de pronóstico

Un factor importante en la realización de pronósticos, es el método de pronóstico que se va a emplear. Según lo planteado por Chase, Jacobs, and Aquilano (2009, pp. 469–470), los pronósticos pueden ser clasificados en cuatro tipos diferentes, los cuales se definen como técnicas cualitativas, análisis de series de tiempo, relaciones causales o econométricas y modelos de simulación.

Técnicas cualitativas

Los pronósticos cualitativos son basados en opiniones subjetivas, en donde, la información empleada para realizar el pronóstico, se obtiene mediante el juicio de un grupo de expertos en el tema, con amplia experiencia en el área de interés, el cual entrega valores o rangos de valores sobre el comportamiento futuro de la variable de estudio. Usualmente este método se emplea cuando la información que se tiene de la variable de interés, es escasa, no puede ser cuantificada o es poco confiable.

Entre las técnicas empleadas para realizar pronósticos subjetivos se destacan

  • Técnicas acumulativas
  • Investigación de mercados
  • Grupos de consenso
  • Analogía histórica
  • Método Delphi

Análisis de series de tiempo

Los pronósticos basados en análisis de series de tiempo, son aquellos que emplean la información histórica de una variable de interés, con el objetivo de descubrir patrones que permitan extrapolar dicha información, para realizar proyecciones hacia el futuro.

Entre las técnicas empleadas para realizar pronósticos mediante análisis de series de tiempo se destacan

  • Promedio móvil simple
  • Promedio móvil ponderado
  • Suavización exponencial
  • Análisis de regresión
  • Técnica Box Jenkins
  • Proyecciones de tendencias

Relaciones causales

Los pronósticos causales, son basados en el hecho de que la serie de tiempo de interés, posee una relación de causa-efecto con una o más variables independientes, que permiten proyectar el comportamiento de la serie de tiempo de interés dado el comportamiento que tengan las variables independientes.

Entre las técnicas empleadas para realizar pronósticos mediante análisis de series de tiempo se destacan

  • Análisis de regresión
  • Modelos econométricos
  • Modelos de entrada/salida
  • Principales indicadores

Modelos de simulación

Los pronósticos basados en modelos de simulación, son aquellos que dependen de un gran número de variables y las relaciones que poseen con factores exógenos, y por tanto, es posible hacer énfasis en la estructura del modelo, mediante la suposición del comportamiento de las variables internas y el ambiente externo para observar cómo afectan éstas a los pronósticos.

Tipos de pronóstico

Una vez definido el método de pronóstico que se desea emplear, es necesario decidir el tipo de pronóstico que se va a realizar, es decir, definir si se desea realizar un pronóstico puntual, por intervalo o de densidad.

Clases de pronóstico

También es necesario definir la clase u horizonte de tiempo para el cual se desea realizar el pronostico. Montgomery, Jennings, and Kulahci (2015, p. 2) señalan que los pronósticos puede ser clasificados en tres horizontes de tiempo

  • Corto plazo: son aquellos que buscan predecir eventos futuros en un horizonte de tiempo pequeño, es decir, días, semanas o meses, y son empleados generalmente para diseñar estrategias o tomar decisiones inmediata.
  • Mediano plazo: son predicciones que se realizan en un horizonte de tiempo un poco más amplio, el cual abarca estimaciones entre 1 y 2 años en el futuro, y se utiliza en general para diseñar presupuestos o procesos de producción y planeación de variables operativas.
  • Largo plazo: son aquellos pronósticos que se extienden a horizontes de tiempo mucho más grandes, puesto que éstos pueden extenderse a muchos años en el futuro, y se emplean en procesos de planificación, programación y proyección de proyectos.

Monitoreo de los pronósticos

Los pronósticos, al igual que otros procesos, requieren de supervisión continua, puesto que, de no supervisar o evaluar su calidad constantemente, éste podría salirse de control y dar resultados erróneos o poco confiable.

Debido a ésto, en Hanke and Wichern (2010) se establece un diagrama de flujo, en el cual se presenta los pasos operativos para el monitoreo del proceso de pronóstico

Componentes de una serie de tiempo

Para el análisis de series de tiempo, y pronostico de las mismas, es necesario realizar una adecuada selección del modelo que se va a emplear, y por ello, es fundamental hacer una precisa identificación de los componentes que conforman la serie, cuya actuación conjunta da como resultado el comportamiendo de la serie original. Estos componentes pueden ser ser divididos en cuatro, a saber, tendencia, estacionalidad, error y fluctuación cíclica.

Para ilustrar el proceso de descomposición, se emplean dos conjuntos de datos. El primer conjuto de datos, se encuentra integrado en la base de R y corresponde al total mensual de pasajeros de líneas aéreas internacionales, para los años 1949 a 1960.

data(AirPassengers)  # Carga base de datos de AirPassengers
AP <- AirPassengers  # Guarda base de datos de AirPassengers

descAP <- stl(AP, s.window = 12)

plot(descAP, main = "Componentes del total de pasajeros de líneas aéreas", col = "chocolate1", 
    lwd = 2)

El segundo conjunto de datos, corresponde a las variaciones porcentual de los ingresos reales totales de hoteles en Colombia entre Junio 2005 y Marzo 2019 Descargar.

### Instalar y cargar librerías install.packages(c('readxl', 'XLConnect'),
### dependencies = T) # Instala librerías
library(readxl)  # Carga librería
library(XLConnect)  # Para descargar archivos online de forma temporal

### Crea archivo temporal para cargar archivo online
temp <- tempfile(fileext = ".xlsx")
dataURL <- "https://github.com/jiperezga/jiperezga.github.io/raw/master/Dataset/ingresorealhoteles2019.xlsx"
download.file(dataURL, destfile = temp, mode = "wb")

datos <- read_xlsx(temp)  # Cargar el archivo
# datos <- read_xlsx(file.choose()) # para buscar archivo guardado en el PC

ingH <- ts(datos$`Variacion  ingresos`, start = c(2005, 7), frequency = 12)  # Transforma observaciones a tipo time-series

descIH <- stl(ingH, s.window = 12)
plot(descIH, main = "Componentes de la variación porcentual de los ingresos reales de hoteles", 
    col = "chocolate1", lwd = 2)



Componente de tendencia

El componente de tendencia se denota por $T_t$, es el componente de la serie que cambia más lentamente y describe el patrón suave que tiene una serie a largo plazo respecto a su nivel promedio (evolución a largo plazo de su media), el cual es caracterizado por un crecimiento o decrecimiento presistente. El comportamiento de la tendencia, puede ser explicado por el crecimiento o cambio de la población, el cambio tecnológico, el crecimiento económico, etc.

Para el caso del total mensual de pasajeros de líneas aéreas internacionales, para los años 1949 a 1960 se tiene que

fechasAP <- seq(as.Date("1949/1/1"), length.out = length(AP), by = "month")  ## Se definen fechas

plot(x = fechasAP, y = descAP$time.series[, 2], main = "Componente de Tendencia para el total 
de pasajeros de líneas aéreas", 
    xlab = "Fecha", ylab = expression(T[t]), col = "chocolate1", type = "l", 
    pch = 19, lwd = 2)

Mientras que, para el caso de las variaciones porcentual de los ingresos reales totales de hoteles en Colombia entre Junio 2005 y Marzo 2019 se tiene que

fechasIH <- seq(as.Date("2005/7/1"), length.out = length(ingH), by = "month")  ## Se definen fechas

plot(x = fechasIH, y = descIH$time.series[, 2], main = "Componente de Tendencia para variación porcentual
de los ingresos reales de hoteles", 
    xlab = "Fecha", ylab = expression(T[t]), col = "chocolate1", type = "l", 
    pch = 19, lwd = 2)

Componente estacional

El componente estacional se denota como $S_t$, es el segundo componente de la serie que cambia más rápidamente y se describe como un patrón que se repite regularmente a través de la serie sobre una base anual. Este comportamiento es debido a factores tales como los consumos o las estaciones climáticas, es decir factores que ocurren con una periodicidad semanal, mensual, trimestral, o semestral.

Es de anotar, que los efectos estacionales son fáciles de entender y se pueden medir explícitamente o incluso se pueden eliminar de la serie de datos, el cual es llamado desestacionalización de la serie.

Para el caso del total mensual de pasajeros de líneas aéreas internacionales, para los años 1949 a 1960 se tiene que

plot(x = fechasAP, y = descAP$time.series[, 1], main = "Componente Estacional para para el total
de pasajeros de líneas aéreas", 
    xlab = "Fecha", ylab = expression(S[t]), col = "chocolate1", type = "l", 
    pch = 19, lwd = 2)
abline(h = 0)

Mientras que, para el caso de las variaciones porcentual de los ingresos reales totales de hoteles en Colombia entre Junio 2005 y Marzo 2019 se tiene que

plot(x = fechasIH, y = descIH$time.series[, 1], main = "Componente Estacional para variación porcentual
de los ingresos reales de hoteles", 
    xlab = "Fecha", ylab = expression(T[t]), col = "chocolate1", type = "l", 
    pch = 19, lwd = 2)

Componente aleatorio, irregular o de error

El componente de error se denota como $\varepsilon_t$, también llamado ruido blanco, es el componente de la serie que cambia más rápidamente y se caracteriza por presentar pequeñas fluctuaciones sobre alrededor de una media y varianza constantes sin ningún patrón aparente. Este fluctuaciones se deben generalmente, a eventos externos impredesibles que sólo ocurre fortuitamente e inciden de forma aislada en un instante del tiempo.

Es de anotar, que este componente es impredecible, pero puede ser modelado como observaciones aleatorias de alguna distribución, tal como lo es, una distribución $N(0,\sigma^2)$.

Para el caso del total mensual de pasajeros de líneas aéreas internacionales, para los años 1949 a 1960 se tiene que

plot(x = fechasAP, y = descAP$time.series[, 3], main = "Componente de Error para el total
de pasajeros de líneas aéreas", 
    xlab = "Fecha", ylab = expression(epsilon[t]), col = "chocolate1", type = "h", 
    pch = 19, lwd = 2)
abline(h = 0)

Mientras que, para el caso de las variaciones porcentual de los ingresos reales totales de hoteles en Colombia entre Junio 2005 y Marzo 2019 se tiene que

plot(x = fechasIH, y = descIH$time.series[, 3], main = "Componente de Error para variación porcentual
de los ingresos reales de hoteles", 
    xlab = "Fecha", ylab = expression(epsilon[t]), col = "chocolate1", type = "h", 
    pch = 19, lwd = 2)
abline(h = 0)

Componente de fluctuación cíclica

El componente de fluctuación cícluca se denota como $C_t$, es el segundo componente de la serie que cambia más lentamente y se caracteriza por presentar patrones de onda en puntos recurrentes en el tiempo con duración más de un año. Este comportamiento es debido por ejemplo a ciclos comerciales que dependen de prosperidad, depresión, recesión y recuperación.

Es de anotar que, los ciclos son el componente más difíciles de pronosticar, debido a que éstos poseen periodos más largos (medida en años) y amplitudes irregulares (diferencias entre altas y bajas) que están lejos de ser constantes, lo cual hace que éstos no sean fijos ni predecibles, y por tanto, las fluctuaciones cíclicas son mezcladas generalmente con el componente de error $\varepsilon$ o se asume que cualquier cíclo es parte de la tendencia $T_t$.

Para el caso de las variaciones porcentual de los ingresos reales totales de hoteles en Colombia entre Junio 2005 y Marzo 2019 se tiene que

Otras componentes

Es de anotar, que además de tener tendencia, estacionalidad, error y fluctuación cíclica, algunas series de tiempo pueden presentar patrones de impulso, rampa o paso

  • Patrón de impulso: Se observa cuando para uno o dos periodos, el proceso presenta un nivel superior o inferior al comportamiento original de la serie.
  • Patrón de rampa: Se observa cuando aparece un cambio de tendencia repentino en el comportamiento constante de la serie, o viceversa.
  • Patrón de paso: Se observa cuando hay cambio permanente en el nivel de la serie.

Bibliografía

Chase, R., Jacobs, F., and Aquilano, N. (2009). Administración de operaciones, producción y cadena de suministros . (12th ed.). McGraw-Hill Interamericana.

Hanke, J., and Wichern, D. (2010). Pronósticos en los negocios (9th ed.). Pearson educación.

Montgomery, D., Jennings, C., and Kulahci, M. (2015). Introduction to time series analysis and forecasting (2nd ed.). John Wiley & Sons.