Qué hace especiales a las series temporales
Una serie temporal es simplemente una secuencia de puntos de datos recopilados a lo largo del tiempo: precios diarios de acciones, cifras mensuales de ventas, lecturas de temperatura por hora o conteos de población anuales. Lo que hace diferentes a los datos de series temporales de otros tipos de datos es que el orden importa. Cada observación está conectada con las anteriores y posteriores. La temperatura de mañana está relacionada con la de hoy. Los ingresos de este mes están influenciados por los del mes pasado.
Esta dependencia temporal viola un supuesto clave de la mayoría de los métodos estadísticos estándar, que requieren que las observaciones sean independientes entre sí. No puedes simplemente aplicar una prueba t o una regresión ordinaria a datos de series temporales sin tener en cuenta que los puntos cercanos están correlacionados. El análisis de series temporales proporciona herramientas especializadas diseñadas exactamente para este tipo de datos.
El diagrama de dispersión anterior muestra datos de ventas mensuales durante un año. Incluso en esta serie corta, puedes ver un movimiento general ascendente a lo largo del tiempo. Identificar estos patrones es el primer paso en el análisis de series temporales.
Tendencias: la dirección a largo plazo
Una tendencia es el movimiento ascendente o descendente a largo plazo en una serie temporal. Si los ingresos de una empresa han estado creciendo de manera constante durante cinco años, ese crecimiento es la tendencia. Las tendencias pueden ser lineales (un aumento constante por una cantidad fija en cada período) o no lineales (crecimiento que se acelera o desacelera con el tiempo).
Identificar la tendencia te ayuda a entender el panorama general y separar la señal del ruido. Un solo mes malo en una tendencia ascendente es muy diferente de un solo mes malo al inicio de una caída sostenida. Los analistas a menudo "eliminan la tendencia" de los datos quitando el componente de tendencia para poder estudiar los patrones restantes, como la estacionalidad y las fluctuaciones aleatorias, con más claridad.
Estacionalidad: patrones que se repiten
La estacionalidad se refiere a patrones regulares y predecibles que se repiten durante un período fijo. Las ventas minoristas se disparan cada diciembre. Las ventas de helado alcanzan su pico en verano. Las membresías de gimnasios se disparan en enero. Estos patrones son impulsados por efectos del calendario, el clima, días festivos o hábitos culturales.
El gráfico anterior muestra dos años de datos con una clara joroba estacional en la mitad de cada año, sugiriendo un pico de verano. Nota que los valores del segundo año son ligeramente más altos que los del primero, indicando una tendencia ascendente combinada con estacionalidad. Separar estos dos componentes es una de las tareas clave en el análisis de series temporales, un proceso llamado descomposición.
La estacionalidad es diferente de un ciclo. Los patrones estacionales tienen un período fijo y conocido (12 meses, 7 días, 4 trimestres). Los ciclos son fluctuaciones a más largo plazo sin período fijo, como los ciclos económicos que podrían durar de tres a diez años. Ambos son patrones reales, pero la estacionalidad es más predecible.
Medias móviles: suavizando el ruido
Los datos brutos de series temporales a menudo son ruidosos. Las fluctuaciones del día a día pueden dificultar ver el patrón subyacente. Una media móvil suaviza los datos reemplazando cada punto con el promedio de sus puntos circundantes. Una media móvil de 7 días, por ejemplo, reemplaza el valor de cada día con el promedio de los 3 días anteriores, el día mismo y los 3 días posteriores.
Las medias móviles son increíblemente populares porque son simples y efectivas. Los analistas financieros las usan para identificar tendencias en precios de acciones. Los epidemiólogos usan medias móviles de 7 días para suavizar los conteos diarios de casos. Los equipos de operaciones las usan para detectar cambios en el tráfico de sitios web. El tamaño de la ventana (cuántos puntos promedias) controla cuánto suavizado obtienes: una ventana más amplia produce una línea más suave pero reacciona más lentamente a cambios reales.
Durante una pandemia, los conteos diarios de casos rebotan bruscamente debido a retrasos en los reportes (menos casos reportados los fines de semana, un aumento los lunes). Una media móvil de 7 días elimina este efecto del día de la semana y revela la verdadera tendencia. Los funcionarios de salud pública confían en las medias móviles en lugar de los conteos diarios para tomar decisiones de política porque los datos suavizados cuentan una historia más clara.
Autocorrelación: cómo hoy se relaciona con ayer
La autocorrelación mide qué tan fuertemente una serie temporal está correlacionada con una versión retrasada de sí misma. Si el valor de hoy está fuertemente relacionado con el de ayer, la serie tiene alta autocorrelación en el retardo 1. Si las ventas de esta semana predicen las de la próxima, hay autocorrelación en el retardo 1 en datos semanales.
La autocorrelación es importante por dos razones. Primero, revela patrones ocultos. Si una serie muestra alta autocorrelación en el retardo 12 en datos mensuales, eso sugiere fuertemente un patrón estacional anual. Segundo, es una entrada crítica para elegir el modelo de pronóstico correcto. Muchos modelos de series temporales, como ARIMA, se construyen directamente sobre la estructura de autocorrelación de los datos.
Un gráfico de autocorrelación (también llamado correlograma) muestra la correlación en cada retardo. Los picos significativos en este gráfico te dicen qué puntos temporales pasados contienen información útil para predecir el futuro. Si solo los primeros retardos son significativos y decaen rápidamente, la serie tiene memoria a corto plazo. Si muchos retardos son significativos, la serie tiene dependencia de largo alcance.
Pronóstico: mirando hacia adelante
El objetivo final de muchos análisis de series temporales es el pronóstico: usar patrones históricos para predecir valores futuros. Los métodos simples incluyen extrapolar la tendencia y el patrón estacional hacia adelante. Métodos más sofisticados como el suavizado exponencial dan más peso a las observaciones recientes, mientras que los modelos ARIMA usan la estructura de autocorrelación para generar predicciones.
Todos los métodos de pronóstico comparten un supuesto fundamental: los patrones observados en el pasado continuarán en el futuro. Esto funciona bien para predicciones a corto plazo pero se vuelve cada vez menos confiable a medida que miras más lejos. Ningún modelo predijo la pandemia de 2020, y ningún método de series temporales anticipará un shock repentino del mercado. Los pronósticos siempre deben incluir intervalos de incertidumbre, y cuanto más lejos en el futuro predices, más amplios deben ser esos intervalos.
Los datos de series temporales son únicos porque el orden de las observaciones importa y los puntos cercanos están relacionados. Los tres componentes principales a buscar son la tendencia (dirección a largo plazo), la estacionalidad (patrones que se repiten) y el ruido (fluctuaciones aleatorias). Las medias móviles suavizan el ruido para revelar patrones, y la autocorrelación revela qué tan fuertemente los valores pasados predicen los futuros. Estos fundamentos son la base de todo pronóstico de series temporales.