Universidad del Valle
Maestría en Analítica e Inteligencia de Negocios
Toma de Decisiones Basadas en los Datos
Descripción del contexto de la ciudad de Cali y su dinámica en la demanda de taxi
Santiago de Cali, capital del departamento del Valle del Cauca, concentra el 49.7 % de los 4 622 132 habitantes del departamento, según datos del Departamento Nacional de Planeación (DNP) para 2023 (Alienta, 2023). La población de Cali se estima en 2.297.230 personas para 2023, con un ligero envejecimiento poblacional (18 % mayores de 60 años) (Alcaldía de Cali, 2023). Como tercer centro urbano más poblado de Colombia, su extensa área metropolitana y su posición estratégica hacia el Pacífico y el interior generan un intenso flujo de transporte diario.
El Masivo Integrado de Occidente (MIO) movilizó 78.055.344 viajes pagos en 2023, reflejo de una recuperación gradual tras la pandemia y una dependencia significativa del transporte público masivo (Alcaldía de Cali, 2025). Paralelamente, la ciudad cuenta con cerca de 16.000 taxis registrados, operados por servicios de tipo básico y de lujo, que representan aproximadamente un taxi por cada 144 habitantes (Alcaldía de Cali, 2022).
A pesar de las mejoras en frecuencia y puntualidad del MIO, solo el 26 % de los caleños lo utilizan como medio principal de transporte, mientras que el 74 % restante opta por modos alternativos (taxis, vehículos particulares, mototaxis, apps de movilidad) (El País, 2024).
Importancia de analizar y predecir la demanda de servicios de taxi para la planificación y gestión del transporte urbano
El análisis y pronóstico de la demanda de servicios de taxi es fundamental para anticipar las necesidades de movilidad en zonas urbanas y optimizar la operación de flotas, permitiendo tomar decisiones basadas en datos históricos y patrones temporales (Liao et al., 2022). Mediante la aplicación de modelos de pronóstico —como ARIMA— las empresas de taxi pueden estimar con precisión cuándo y dónde se concentrará la demanda. Esto ayuda a mitigar problemas de desabastecimiento o exceso de vehículos en determinadas áreas, mejorando la eficiencia operativa y reduciendo pérdidas económicas asociadas al tiempo ocioso de los conductores (Islas Rivera, Rivera Trujillo & Torres Vargas, 2002). Además, la capacidad de predecir la demanda alivia la insuficiente oferta en momentos críticos, garantizando una mejor cobertura del servicio (Gangrade, Pratyush, & Hajela, 2022).
Algunos de los principales beneficios son:
Optimización de la asignación de flotas: Un buen pronóstico de demanda permite ubicar taxis en los “hotspots” —áreas de alta demanda o congestión— correctos antes de que se genere la demanda, reduciendo tiempos muertos y elevando la eficiencia operativa (Liu, Chen, Li, & Zhang, 2020).
Reducción de la congestión urbana: Al equilibrar oferta y demanda, se evitan desplazamientos vacíos y descoordinados que empeoran el tráfico; un modelo predictivo ajustado contribuye a suavizar los picos de congestión (Zhang, Tian, Liu, & Li, 2024).
Mejor servicio al usuario: Anticipar la demanda en eventos especiales, condiciones climáticas o cambios en el flujo laboral mejora la disponibilidad de taxis, incrementa la satisfacción y disminuye los tiempos de espera de los clientes (Zhao et al., 2022).
Planificación estratégica y políticas públicas: Las predicciones respaldadas en datos históricos y variables exógenas (tráfico, clima, calendario) son insumos clave para diseñar tarifas dinámicas, regular licencias y apoyar decisiones de infraestructura vial más sostenibles (Li, Lv, Ma, Wang, & Xu, 2024).
Modelos costo-efectivos: Implementar técnicas como ARIMA, SARIMA o modelos basados en aprendizaje automático permite estimar la demanda con intervalos de confianza, optimizando recursos y reduciendo costos operativos de la flota (Liu, Chen, Li, & Zhang, 2020).
La gestión de la demanda de transporte, tanto en el sector público como privado, es clave para alcanzar objetivos de eficiencia, accesibilidad y sostenibilidad urbana. Incorporar pronósticos de demanda no solo optimiza la operación diaria de los taxis, sino que también facilita la formulación de políticas de gestión del tráfico, contribuyendo a una ciudad más ordenada y con menor impacto ambiental.
Una serie de tiempo es un conjunto de observaciones de una misma variable registradas en instantes sucesivos ordenados cronológicamente. Estas observaciones pueden ser continuas o discretas y suelen analizarse para identificar componentes como tendencia, estacionalidad y ruido ([Tableau, s.f.] (https://www.tableau.com/analytics/what-is-time-series-analysis?)). El objetivo del análisis de series de tiempo es extraer estadísticas y características (por ejemplo, autocorrelación) para comprender la estructura subyacente y modelar el comportamiento futuro (Sigma BI, s.f.). A diferencia de los estudios transversales, las series de tiempo aprovechan la dependencia temporal entre los datos, asumiendo que valores cercanos en el tiempo están más correlacionados.
El modelo ARIMA(p, d, q) combina tres componentes clave:
AR(p) (Autorregresivo): predice el valor actual de una seria temporal como una combinación lineal de sus p valores pasados, mas un término que expresa un error aleatorio.
I(d) (Integración): aplica d diferenciaciones para inducir estacionariedad en la media.
MA(q) (Media móvil): modela el componente actual como media de errores pasados de orden q.
Formalmente, si \(X_t\) es la serie original, se define la serie diferenciada \(Y_t = (1 - L)^d X_t\), y luego:
\[ Y_t = \phi_1 Y_{t-1} + \cdots + \phi_p Y_{t-p} + \varepsilon_t + \theta_1 \varepsilon_{t-1} + \cdots + \theta_q \varepsilon_{t-q}, \]
donde \(\phi_i\) y \(\theta_j\) son parámetros AR y MA, \(\varepsilon_t\) es ruido blanco, y \(L\) es el operador lag.
Los modelos ARIMA se han consolidado como una herramienta de referencia en series temporales gracias a su enfoque sistemático para capturar la dependencia autorregresiva, los efectos de medias móviles y las tendencias en datos históricos. Además, permiten generar pronósticos de corto plazo con intervalos de confianza y adaptarse a distintos patrones temporales, lo que los hace especialmente valiosos para la toma de decisiones operativas y estratégicas (Investopedia, 2024).
Algunas de las principales utilidades de los modelos ARIMA son:
Flexibilidad para diferentes patrones: ARIMA se adapta tanto a series estacionarias como a aquellas con tendencia o estacionalidad (previa diferenciación), siendo por ello un método de referencia en forecasting (Otexts, s.f.).
Pronósticos con intervalos de confianza: Al estimar la varianza de los errores, ARIMA no solo predice valores futuros sino que proporciona bandas de confianza, facilitando la gestión de riesgos (MachineLearningMastery, 2023).
Aplicable en múltiples dominios: Desde la predicción de ventas y demanda de energía hasta tráficos de red y servicios de transporte, ARIMA ha demostrado robustez y precisión en horizontes cortos a medianos (Capital One, 2021).
Base para modelos avanzados: ARIMA sirve como punto de partida para extensiones como SARIMA (con estacionalidad explícita) o ARIMAX (con variables exógenas), integrándose con técnicas de machine learning para mejorar el desempeño (MachineLearningMastery, 2023).
En conjunto, la metodología ARIMA brinda un marco estructurado —identificación, estimación y diagnóstico de modelos— que permite construir pronósticos fiables, optimizar recursos y diseñar estrategias basadas en evidencia histórica.
La serie temporal analizada consta de un total de 321 registros que reportan la cantidad diaria de servicios de taxi solicitados en la ciudad de Cali, abarcando el período comprendido entre el 1 de julio de 2018 y el 17 de mayo de 2019. Este conjunto de datos ofrece información histórica sobre las dinámicas de movilidad asociadas al uso del servicio de taxi durante el periodo señalado, lo cual puede proporcionar elementos relevantes para el análisis y la identificación de diversos fenómenos, tales como:
Eventos y patrones en la demanda del servicio: Se pueden observar picos de demanda durante periodos festivos como Navidad, Año Nuevo y la Feria de Cali. De igual forma, es posible identificar disminuciones abruptas en la demanda, potencialmente asociadas a días feriados o fines de semana.
Estacionalidad semanal: El análisis permite determinar qué días de la semana presentan mayor demanda y si existe una repetición periódica o cíclica de estos comportamientos.
Eventos atípicos: La detección de valores extremos, tanto mínimos como máximos, facilita el estudio de eventos puntuales que podrían haber influido significativamente en la prestación del servicio.
Patrones anómalos: La presencia de comportamientos inusuales puede dar indicios sobre situaciones particulares que afectaron la oferta o la demanda del servicio de taxi.
## [1] "Cinco primeros registros: "
## # A tibble: 6 × 2
## date Servicios
## <dttm> <dbl>
## 1 2018-07-01 00:00:00 2295
## 2 2018-07-02 00:00:00 2362
## 3 2018-07-03 00:00:00 4031
## 4 2018-07-04 00:00:00 4228
## 5 2018-07-05 00:00:00 3893
## 6 2018-07-06 00:00:00 4250
## [1] "Cinco últimos registros: "
## # A tibble: 6 × 2
## date Servicios
## <dttm> <dbl>
## 1 2019-05-12 00:00:00 3933
## 2 2019-05-13 00:00:00 4827
## 3 2019-05-14 00:00:00 4839
## 4 2019-05-15 00:00:00 4388
## 5 2019-05-16 00:00:00 4982
## 6 2019-05-17 00:00:00 779
## Datos de taxis en Cali desde 2018-07-01 hasta 2019-05-17 con 321 observaciones.
## Datos faltantes:
## # A tibble: 1 × 3
## total_na dias_na fechas_na
## <int> <int> <list>
## 1 0 0 <dttm [0]>
No se detectaron valores faltantes en la serie temporal, ni en el total de observaciones ni en los días individuales, lo que garantiza la completitud del conjunto de datos.
## [1] "Días faltantes en la secuencia: 0"
## [1] "Fechas duplicadas: 0"
La serie temporal no presenta días faltantes ni fechas duplicadas, lo que indica una consistencia temporal completa en los datos.
Media | Mediana | Desviación estándar | Mínimo | Máximo |
---|---|---|---|---|
3905.866 | 3869 | 882.7929 | 779 | 7317 |
Durante el periodo analizado, la demanda diaria de taxis en Cali oscila alrededor de las 3900 solicitudes, con variaciones significativas entre días de baja y alta actividad. A continuación, una descripción breve de las métricas principales:
Media (3905.87): Promedio de servicios diarios en el período, indicando el nivel habitual de actividad.
Mediana (3869): Punto central de la distribución, muestra que la mayoría de los días se sitúan cerca del promedio.
Desviación estándar (882.79): Grado de dispersión alrededor de la media; valores altos señalan fluctuaciones significativas en la demanda.
Mínimo (779): Número más bajo de servicios en un día, asociado a jornadas con poca movilidad (festivos, eventos especiales).
Máximo (7317): Número más alto de servicios en un día, vinculados a picos de demanda por ocasiones especiales o restricciones de otros modos de transporte.
Gráfica 1. Histograma de servicios diarios de taxi
El histograma, gráfica 1, muestra que la mayor parte de los días registran entre 3000 y 4500 servicios, con un claro pico de frecuencia alrededor de los 3800–4000. A continuación, se presentan algunas observaciones del histograma:
La distribución es aproximadamente unimodal y ligeramente sesgada a la derecha, debido a unos pocos días con valores muy altos (> 6000).
La concentración central de datos es bastante compacta, lo que concuerda con una desviación estándar de aproximadamente 883 servicios.
En los extremos se aprecian unos cuantos días con demanda muy baja (< 1500) o muy alta (> 6000), que corresponden a festivos o eventos especiales (outliers).
En conjunto, el histograma confirma que la variabilidad diaria es moderada, con la mayor concentración en torno al promedio de ~ 3900 servicios y colas más residuales hacia días de actividad excepcionalmente baja o alta.
Gráfica 2. Servicios de taxi en Cali: serie diaria
La serie diaria de servicios de taxi en Cali (julio 2018–mayo 2019), gráfica 2, muestra varios rasgos claros:
Tendencia levemente creciente: Desde julio hasta diciembre se observa un alza gradual en el promedio diario, pasando de alrededor de 3200–3400 servicios a picos frecuentes por encima de 4000–4 500. Esta tendencia se frena y cae bruscamente en enero (por los festivos de fin de año y vacaciones), para luego estabilizarse y retomar un leve ascenso hacia abril–mayo.
Estacionalidad semanal marcada: La secuencia de picos y valles se repite cada siete días: los domingos suelen ser los días de más baja actividad (~2500–3000 servicios), mientras que de miércoles a viernes se concentran los picos semanales antes de que el ritmo caiga el fin de semana.
Alta volatilidad diaria: Hay fluctuaciones significativas día a día —con amplitudes de ±800–1000 servicios respecto al promedio— que posiblemente reflejan la sensibilidad de la demanda a factores como el clima, la hora del mes y eventos puntuales.
Outliers y eventos especiales: Se identifican episodios aislados de muy baja demanda (<2000 servicios), probablemente en festivos nacionales, así como picos por encima de 6000 servicios en días con eventos especiales.
En conjunto, esta dinámica diaria – combinación de tendencia, estacionalidad semanal y picos extraordinarios – reflejan la complejidad de la serie, así como la importancia de considerar cada uno de estos elementos en el análisis y la interpretación de los datos.
## [1] "Número de outliers detectados: 14"
Gráfica 3. Detección de outliers en la serie diaria
En la tabla 2, se presenta el detalle de los 14 días en que la demanda de taxis se desvió significativamente de la tendencia habitual. Para cada fecha se indica el evento asociado, el número de servicios registrados y un breve comentario sobre la causa probable.
Fecha | Evento | Servicios | Comentario |
---|---|---|---|
2018-08-07 | Batalla de Boyacá | 1491 | Festivo nacional, baja movilidad urbana |
2018-09-22 | Día sin carro y moto en Cali | 7317 | Prohibición de vehículos particulares, alta demanda de taxis |
2018-10-15 | Día de la Raza | 1970 | Festivo movido al lunes, baja movilidad |
2018-12-06 | Víspera de la Inmaculada Concepción | 5885 | Alta movilidad previa al festivo |
2018-12-07 | Día de las Velitas | 6222 | Inicio de festividades navideñas |
2019-01-01 | Año Nuevo | 5930 | Regreso de celebraciones, alta demanda de taxis |
2019-01-07 | Día de los Reyes Magos | 1942 | Festivo, baja movilidad |
2019-03-25 | Día de San José | 1782 | Festivo religioso, baja movilidad |
2019-03-29 | Bloqueos indígenas en la Panamericana | 6366 | Bloqueos, sobrecarga del servicio de taxis |
2019-04-19 | Viernes Santo | 1790 | Mínima actividad comercial y urbana |
2019-04-20 | Sábado de Gloria | 6366 | Baja oferta de transporte masivo |
2019-05-09 | Pre-Día de la Madre | 6232 | Alta movilidad para compras y preparativos |
2019-05-10 | Víspera del Día de la Madre | 5872 | Víspera de celebraciones, alta demanda de taxis |
2019-05-17 | Último registro | 779 | Posible fallo en la captura de datos |
De acuerdo con el análisis descriptivo de la serie, el comportamiento de la demanda de taxis en Cali no es uniforme a lo largo de la semana: factores como la rutina laboral, el ocio de fin de semana y las actividades comerciales generan un patrón cíclico de siete días que se repite con bastante regularidad. Comprender esta estacionalidad semanal permite:
Detectar días de menor o mayor presión sobre la flota.
Planificar la asignación de vehículos para ajustar oferta y demanda.
Identificar oportunidades de optimizar tarifas dinámicas según el día de la semana.
Para entender en detalle cómo varía la demanda de taxis en Cali a lo largo de la semana, se presentan las siguientes visualizaciones complementarias que ilustran este patrón semanal:
Ofrece una visión general, mostrando medianas, rangos intercuartílicos y valores atípicos para cada día de la semana.
Gráfica 4. Boxplot de servicios por día de la semana
El boxplot por día de la semana, gráfica 4, confirma el patrón de variación semanal que se había sugerido en las observaciones previas:
Domingo: es el día de menor demanda, con medianas alrededor de 2800–3000 servicios y muy poca dispersión en el rango bajo, reflejando el descanso dominical.
Lunes–Miércoles: las medianas suben a 4000–4300 y la dispersión crece ligeramente, indicando el inicio de la semana laboral.
Jueves–Viernes: la mediana continúa en ascenso (≈4000–4500), pero el viernes muestra la mayor dispersión y los outliers más extremos hacia valores bajos (pocas salidas) y muy altos (eventos sociales).
Sábado: contra lo que podría pensarse, el sábado no es el pico máximo: la mediana (≈3600) y dispersión son menores que el viernes; eso sugiere que la demanda “de fin de semana” se concentra más en el viernes por la noche que en todo el sábado.
En conjunto, el análisis confirma una estacionalidad semanal clara: se parte de un valle el domingo, sube progresivamente hasta el viernes (pico de actividad y variabilidad) y luego desciende el sábado.
Superpone cada “ciclo” de siete días para mostrar cómo varía la demanda de lunes a domingo a lo largo del tiempo.
Gráfica 5. Subseries por día de la semana
En la gráfica 5 cada línea naranja une los 7 valores diarios de una misma semana, y la línea azul horizontal marca la media de todos los “lunes”, “martes”, etc. Así, se puede ver en un solo gráfico:
Variabilidad intra-semanal: las ondulaciones de cada línea muestran cómo, dentro de cada semana, la demanda sube y baja de un día al siguiente. Observamos que muchas semanas tienen pendientes positivas de lunes a viernes y descensos hacia el fin de semana.
Comparación de semanas: al superponer todas las semanas, vemos que la forma de la curva es bastante consistente semana tras semana, aunque algunas presentan picos más pronunciados (por eventos o festivos) y otras están más planas.
Medias diarias: las barras azules confirman que la demanda media aumenta linealmente desde el lunes (~3800 servicios) hasta el viernes (~4200–4300), para luego caer el sábado (~3750) y más aún el domingo (~2900).
Estabilidad versus volatilidad:
Las semanas tienden a seguir un patrón similar, lo que indica una estacionalidad muy marcada.
Sin embargo, la dispersión de las líneas alrededor de la media es mayor hacia jueves y viernes, reflejando que esos días experimentan más variación (entre semanas tranquilas y semanas de eventos).
En conjunto, el gráfico refuerza la idea de una estacionalidad semanal fuerte: la curva típica de la demanda de taxis se repite de forma robusta cada semana, con un claro aumento hacia el cierre laboral y un descenso en el fin de semana.
Sintetiza el comportamiento típico de la serie, graficando la media de servicios para cada día de la semana.
Gráfica 6. Patrón semanal de demanda diaria de taxis
En la gráfica 6, la curva de demanda promedio por día de la semana revela el ritmo habitual de los servicios de taxi en Cali:
Domingo: la demanda arranca en su nivel más bajo, alrededor de 2900 servicios, reflejando el menor movimiento urbano.
Lunes a viernes: se observa un aumento progresivo, con la media diaria subiendo de ~3900 servicios el lunes hasta el pico de ~4600 servicios el viernes, momento de máxima actividad laboral y social.
Sábado: tras el cierre de semana, la demanda desciende a ~3800 servicios, indicando un alivio en la presión de la flota.
En resumen, los resultados de los tres gráficos confirman una estacionalidad semanal muy marcada, con máxima presión operativa al cierre de la semana laboral y puntos de menor actividad durante el fin de semana, información clave para la toma de decisiones en distribución de flota y gestión de servicios.
A lo largo del análisis exploratorio se ha identificado que la demanda diaria de taxis en Cali combina un nivel de actividad estable alrededor de 3900 servicios con fluctuaciones marcadas en torno a ±900 servicios, impulsadas por días festivos, eventos especiales y la rutina semanal. La estacionalidad semanal es particularmente fuerte: la demanda sube de manera sostenida de lunes a viernes, alcanza su máximo en la antesala del fin de semana y cae drásticamente los sábados y, sobre todo, los domingos. Además, puntos atípicos puntuales se corresponden con feriados nacionales y jornadas extraordinarias (Día sin carro, Velitas, bloqueos, etc.).
En la siguiente sección se aplicará un modelo ARIMA, reconocido por integrar componentes autorregresivos, de diferenciación y de media móvil para generar predicciones de corto plazo basadas en datos históricos.
En muchos escenarios de series de tiempo, especialmente cuando la dinámica de la demanda puede cambiar con el paso de los meses o años, resulta conveniente entrenar el modelo sobre una ventana de datos en lugar de toda la trayectoria histórica. Al enfocarse en un segmento más reciente, se obtiene:
Mayor relevancia de los patrones actuales, ya que los cambios recientes en la conducta del usuario o en las condiciones externas (por ejemplo, nuevas regulaciones o tecnologías de movilidad) quedan mejor reflejados en los datos más cercanos al presente (Milvus, s.f.).
Reducción de ruido asociado a eventos muy antiguos o irregularidades pasadas, favoreciendo una estimación de parámetros más estable y menos sesgada.
Flexibilidad para ajustar tanto la longitud de la ventana como el horizonte de pronóstico (método de “sliding window”), permitiendo calibrar el equilibrio entre precisión histórica y capacidad de adaptación a nuevas tendencias (Zilliz, s.f.).
Para este análisis se propone revisar los estadísticos de cuatro ventanas de tiempo candidatas, cada una con una duración de 180 días. El objetivo es identificar criterios de selección basados en los siguientes aspectos:
Estabilidad estadística: Evaluar ventanas con media y varianza relativamente constantes, evitando aquellas que presenten cambios estructurales abruptos.
Representatividad: Incluir patrones relevantes (por ejemplo, semanales o mensuales) y asegurar un balance adecuado entre días laborales y fines de semana.
Patrones estacionales: Priorizar la presencia de datos recientes útiles para el pronóstico y, si es posible, abarcar ciclos estacionales completos.
Calidad de los datos para el modelo ARIMA: Evitar ventanas con numerosos valores atípicos no justificados y preferir aquellas sin datos faltantes.
En la Tabla 3 se detallan las cuatro ventanas de tiempo candidatas, acompañadas de la justificación correspondiente para cada una.
Ventana | Periodo | Justificación |
---|---|---|
Primeros 180 días | 2018-07-01 a 2018-12-27 | Cubre la fase de arranque, capturando la evolución inicial sin efectos de fin de año completos. Sirve como “benchmark” de estabilidad antes de la temporada alta. |
Últimos 180 días | 2018-11-19 a 2019-05-17 | Refleja la dinámica más reciente, maximizando la relevancia de los patrones actuales.Incluye la temporada navideña y Semana Santa. |
Período intermedio | 2018-09-01 a 2019-02-27 | Equilibra datos antiguos y recientes, cubriendo un semestre que atraviesa fin de año y vacaciones.Permite comparar cambios estructurales alrededor de enero. |
Ventana alternativa | 2018-10-15 a 2019-04-12 | Se alinea con feriados clave (Día de la Raza, Velitas, Semana Santa) y evita posibles sesgos por eventos extremos.Posibilita analizar cómo impactan dichos hitos en la estabilidad de la serie. |
En conjunto, estas cuatro ventanas proporcionan un conjunto diverso de perspectivas sobre la serie —desde el arranque histórico hasta la actualidad, pasando por tramos mixtos y focalizados en eventos— que facilitan la selección de la ventana que mejor combine estabilidad, representatividad estacional y calidad de datos para el posterior ajuste del modelo ARIMA.
Ventana | Inicio | Fin | N | Media | Mediana | Minimo | Maximo | Desviacion | Q1 | Q3 | IQR | Coef_Variacion |
---|---|---|---|---|---|---|---|---|---|---|---|---|
V1. Primeros 180 días | 2018-07-01 | 2018-12-27 | 180 | 3911.21 | 3820.0 | 1491 | 7317 | 865.63 | 3445.50 | 4380.00 | 934.5 | 22.13 |
V2. Últimos 180 días | 2018-11-19 | 2019-05-17 | 180 | 4094.94 | 4142.0 | 779 | 6366 | 939.20 | 3596.50 | 4706.50 | 1110.0 | 22.94 |
V3. Período intermedio | 2018-09-01 | 2019-02-27 | 180 | 4037.63 | 3923.5 | 1942 | 7317 | 854.02 | 3545.50 | 4554.00 | 1008.5 | 21.15 |
V4. Alternativa | 2018-10-15 | 2019-04-12 | 180 | 4092.54 | 4108.0 | 1782 | 6366 | 860.62 | 3651.25 | 4658.25 | 1007.0 | 21.03 |
Con base en las medidas estadísticas resumidas, tabla 4, se realiza un análisis de los criterios de selección definidos previamente:
Estabilidad estadística
Coeficiente de variación (CV): La Ventana 4 (Alternativa) presenta el menor CV (21,03 %), lo que indica una menor variabilidad relativa y mayor estabilidad en los datos. El CV mide la dispersión de los datos en relación con su media, por lo que valores bajos se asocian con mayor consistencia.
Rango intercuartílico (IQR): La Ventana 1 presenta la menor dispersión (IQR = 934,5). Sin embargo, también tiene la media más baja (3911,21), lo cual puede hacerla menos representativa del comportamiento general, a pesar de su consistencia interna.
Representatividad
La Ventana 4 cubre eventos clave y temporadas altas sin incluir valores atípicos extremos, lo que mejora su relevancia y robustez.
En contraste, la Ventana 2 contiene el valor mínimo más extremo (779), lo cual podría distorsionar la estimación del modelo si no es un dato representativo.
Patrones estacionales
Gráficos semanales: La Ventana 4 muestra el patrón semanal más claro y consistente.
Distribuciones (densidades): También presenta la distribución menos sesgada, lo cual es favorable para el modelado estacional.
Adecuación para ARIMA
Relación media/mediana: En la Ventana 4, la diferencia entre media (4092,54) y mediana (4108,0) es de solo 15 unidades, lo que sugiere una distribución simétrica y equilibrada.
Variabilidad (desviación estándar): Con un valor de 860,62, se ubica en un rango intermedio —ni demasiado alta ni baja—, lo cual es adecuado para modelado ARIMA.
Gráfica 7. Series diarias de las ventanas seleccionadas
En la gráfica 7, a primera vista las cuatro series de 180 días presentan dinámicas similares —cada una muestra la estacionalidad semanal y los picos/caídas por festivos—, pero difieren en aspectos clave:
Mayor estabilidad: la Ventana 4 ofrece un tramo más homogéneo, con menos influencia de eventos atípicos de inicio o cierre de serie.
Mayor relevancia histórica: la Ventana 1 muestra la evolución inicial de la demanda, útil si se busca incluir tendencias de arranque.
Datos más recientes: la Ventana 2 es la más actual y refleja el comportamiento más alineado al periodo de pronóstico.
Cobertura mixta: la Ventana 3 equilibra festividades de fin de año y de inicio de año, proporcionando un panorama amplio de estacionalidades clave.
En función de si se prioriza estabilidad, relevancia reciente o amplitud estacional, cada una de estas ventanas puede resultar óptima.
Gráfica 8. Distribución comparativa de servicios por ventanas
El boxplot comparativo, gráfica 8, muestra las diferencias de nivel y dispersión entre las cuatro ventanas de 180 días:
Ventana 1 (jul-dic) presenta la mediana más baja y un rango intercuartílico relativamente estrecho, reflejando la fase inicial de crecimiento de la demanda.
Ventana 2 (nov-may) alcanza la mediana más alta y la mayor amplitud, capturando picos de temporada alta (Navidad, Semana Santa) y también caídas fuertes.
Ventana 3 (sep-feb) y Ventana 4 (oct-abr) muestran medianas intermedias y rangos muy similares, señalando un balance entre datos estables y cambios moderados asociados a efectos estacionales (como feriados o comportamientos de solicitud de servicios en dias festivos).
En conjunto, la comparación sugiere que la Ventana 2 incorpora la mayor intensidad de eventos extremos, mientras que las demás ofrecen distribuciones más homogéneas y representativas de patrones menos sesgados.
Gráfica 9. Densidad de servicios por ventana
La gráfica 9 de densidad compara la distribución detallada de servicios en las cuatro ventanas:
Pico principal en torno a 3800–4200 servicios para todas las ventanas, reflejando el nivel de actividad más frecuente.
Ventana 2 (naranja) presenta la curva más achatada y amplia hacia la derecha, indicando una mayor frecuencia de días con demanda elevada (picos navideños y de Semana Santa).
Ventanas 1 (azul) y 3 (verde) muestran densidades muy parecidas, con una ligera asimetría a la derecha y un “resalto” secundario alrededor de 6000 que captura algunos fines de semana festivos.
Ventana 4 (rojo) tiene la densidad más aplanada en el cuerpo medio y extiende un poco más la cola derecha, sugiriendo cierto énfasis en días de alta demanda sin arrastrar extremos de inicio o fin de serie.
En resumen, la densidad confirma que, aunque todas las ventanas comparten el mismo rango central, la Ventana 2 incorpora la mayor proporción de días de alta demanda, mientras que las Ventanas 1 y 3 ofrecen distribuciones levemente más concentradas y simétricas, y la Ventana 4 muestra un perfil intermedio con un cuerpo central aplanado y una cola derecha algo más alargada, capturando picos ocasionales sin incluir los extremos más pronunciados.
Tras comparar las cuatro candidatas, la Ventana 4 (2018-10-15 a 2019-04-12) se perfila como la más adecuada. A continuación, sus principales fortalezas:
Estabilidad estadística
Coeficiente de variación más bajo: la demanda se mantiene relativamente constante.
Media cercana a la mediana e IQR moderado, lo que indica una distribución equilibrada sin sesgos importantes.
Representatividad de patrones
Incluye los principales eventos de la serie (Día de la Raza, Velitas, Navidad, Semana Santa) sin arrastrar los extremos de inicio o cierre.
Capta ciclos completos de estacionalidad semanal y mensual, ofreciendo una muestra rica en variabilidad relevante.
Ausencia de valores extremos inexplicables
El único mínimo (1970) y máximo (6366) coinciden con fechas festivas identificadas.
Los boxplots muestran menos outliers problemáticos que otras ventanas.
Claridad en los patrones temporales
La serie diaria exhibe una tendencia suave y sin saltos abruptos.
La densidad es la más simétrica entre las cuatro, con una cola derecha controlada.
El patrón semanal se presenta de forma más consistente, facilitando la modelación.
En conjunto, estos atributos hacen de la Ventana 4 la mejor opción para entrenar el modelo ARIMA, al ofrecer un balance óptimo entre estabilidad, representatividad y calidad de los datos.
La construcción de un modelo ARIMA efectivo depende de la correcta selección de sus órdenes: p (autoregresivo), d (diferenciación) y q (media móvil). En este sentido las ordenes del modelo tienen el siguiente significado:
p: Número de rezagos autoregresivos (AR), es decir, cuántos valores pasados se usan para predecir el actual.
d: Número de veces que la serie debe diferenciarse para volverse estacionaria (estable en media y varianza).
q: Número de rezagos del componente de media móvil (MA), es decir, cuántos errores pasados se usan para ajustar el modelo.
La adecuada especificación de estos parámetros es un aspecto fundamental en el análisis de series temporales (Hyndman & Athanasopoulos, 2021, p. 215). Estos parámetros determinan cómo el modelo captura tendencias, estacionalidad y ruido en los datos, influyendo directamente en su capacidad predictiva. En este sentido, mientras que d garantiza estacionaridad, p y q capturan la estructura de dependencia temporal en la serie de tiempo (Hyndman & Athanasopoulos, 2021, capítulo 8.1). Sin embargo, identificarlos requiere un enfoque sistemático que combine pruebas estadísticas (como ADF) y herramientas gráficas de la función de autocorrelación (ACF) y la función de autocorrelación parcial (PACF).
Esta sección detalla los procedimientos basados en pruebas de raíz unitaria (ADF) y análisis de correlación (ACF/PACF) para determinar estos parámetros de manera rigurosa, evitando errores de especificación que comprometan las predicciones (Franses, van Dijk y Opschoor 201,p. 45). De esta manera, se asegura que el modelo se ajuste a las propiedades intrínsecas de la serie temporal analizada.
Determinación de los parámetros d, p y q en modelos ARIMA
1. Parámetro d (Diferenciación)
El objetivo aquí es ver si la serie es estacionaria. Para eso se usa la prueba ADF (Dickey-Fuller Aumentada).
Hipótesis de la prueba ADF:
H₀ (nula) : La serie NO es estacionaria (tiene raíz unitaria).
H₁ (alternativa): La serie ES estacionaria.
Evaluación de acuerdo con el resultado obtenido en la prueba ADF
A. Si el p-valor > 0.05, NO se puede rechazar H₀ ⇒ La serie NO es estacionaria.
B. Si p-valor ≤ 0.05 ⇒ SE rechaza H₀ ⇒ la serie ES estacionaria ⇒ d = 0.
A. Para el primer caso (A), se debe aplicar una diferenciación d ≥ 1 (restar el valor actual con el anterior).
B. Para el segundo caso (B), NO dse debe palicar diferenciacion es decir, d = 0.
En el caso (A), esta operación se repite (si es necesario) hasta que el p-valor sea ≤ 0.05, es decir, hasta que la serie se vuelva estacionaria.
2. Parámetros p y q (estructura AR y MA)
Una vez la serie es estacionaria, se analiza su estructura con dos funciones gráficas:
ACF (Función de Autocorrelación): Ayuda a identificar el parámetro q(MA).
PACF (Función de Autocorrelación Parcial): Ayuda a identificar el parámetro p(AR).
Ambas funciones muestran barras (valores de correlación) y líneas punteadas (límites de significancia). El criterio es:
Si una barra supera esas líneas (±1.96/√n), es significativa.
p (AR): Último lag significativo en el gráfico PACF.
q (MA): Último lag significativo en el gráfico ACF.
Parámetro | Herramienta | Qué se analiza | Criterio de selección | Hipótesis nula (H₀) |
---|---|---|---|---|
p (AR) | PACF | Coeficientes de autocorrelación parcial en los primeros rezagos | Último rezago con coeficiente fuera de bandas de confianza (±1.96/√n) | Coeficiente = 0 (no hay correlación significativa) |
q (MA) | ACF | Coeficientes de autocorrelación total en los primeros rezagos | Último rezago con coeficiente fuera de bandas de confianza (±1.96/√n) | Coeficiente = 0 (no hay correlación significativa) |
En la Tabla 5, se presentan los procedimientos para identificar los órdenes AR (p) y MA (q) de un modelo ARIMA. A continuación, se detallan algunos puntos clave que complementan la información mostrada:
1.96: Es el valor crítico de la distribución normal estándar para un nivel de confianza del 95% (α = 0.05), equivalente al percentil 97.5, ya que se trata de una prueba de dos colas: ±1.96.
√n: Representa la desviación estándar de la distribución de los coeficientes de autocorrelación bajo la hipótesis nula, donde n es el tamaño de la muestra. Este valor es fundamental para determinar el margen de error de los coeficientes en la ACF y PACF.
Resumen general
En la tabla 6, se presenta un resumen sobre el criterio de selección de parámetros ARIMA.
Parámetro | Herramienta | Criterio_Selección |
---|---|---|
d | Prueba ADF | Si p-valor ≤ 0.05 ⇒ d = 0 (serie ya es estacionaria); si no ⇒ diferenciar. |
p (AR) | PACF | Último lag significativo antes del ruido blanco. |
q (MA) | ACF | Último lag significativo antes del ruido blanco. |
1. División de Datos
Se define el Conjunto de Entrenamiento para el período comprendido entre el 15 de octubre de 2018 y el 2 de abril de 2019 (170 días). Este conjunto se utiliza para ajustar el modelo ARIMA a los patrones históricos observados en los datos.
La cobertura temporal total del análisis abarca 180 días, lo cual es un intervalo adecuado para capturar tanto las tendencias como la estacionalidad de la serie temporal.
El Conjunto de Prueba se establece para el período comprendido entre el 3 de abril de 2019 y el 12 de abril de 2019 (10 días), con el objetivo de validar la capacidad predictiva del modelo entrenado en los datos históricos.
## Tipo Inicio Fin Días
## 1 Entrenamiento 2018-10-15 2019-04-02 170
## 2 Prueba 2019-04-03 2019-04-12 10
2. Pruebas de Estacionariedad
Prueba | Valor | Resultado |
---|---|---|
ADF | 0.2555210 | No estacionaria |
KPSS | 0.3064756 | No estacionaria |
En la tabla 7 se presentan los resultados de la prueba de estacionariedad.
1. Prueba ADF (Augmented Dickey-Fuller):
Valor p = 0.2555210:
Con p > 0.05, no se rechaza H₀, por lo tanto, la serie NO es estacionaria según la ADF .Esto implica que la serie tiene raíz unitaria (H₀ no rechazada), lo que se asocia con la presencia de tendencias. Esta condición justifica la aplicación de diferenciación (d=1) para lograr estacionariedad.
2. Prueba KPSS (Kwiatkowski–Phillips–Schmidt–Shin):
Valor del estadístico = 0.3064756:
Este valor debe compararse con un valor crítico. Si el valor del estadístico es mayor que el valor crítico, se rechaza H₀ → la serie NO es estacionaria.
Los valores críticos de referencia para la prueba KPSS, según (Kwiatkowski et al. 1992), son los siguientes:
Para un nivel de significancia del 10%: 0.119
Para un nivel de significancia del 5% (más utilizado): 0.146
Para un nivel de significancia del 1% (más estricto): 0.216
El valor del KPSS= 0.306, es superior al valor crítico del 5% (0.146), lo que confirma con una alta significancia estadística la NO estacionariedad de la serie. Esto permite concluir que la serie requiere al menos una diferenciación (d = 1), para lograr la estacionariedad, como paso previo a ajustar un modelo ARIMA.
3. Transformación de la Serie
En este apartado, se aborda el proceso de transformación de la serie temporal para asegurar su estacionariedad. Para ello, se aplica una diferenciación de primer orden (d = 1), que tiene como objetivo eliminar tendencias lineales y estabilizar la media y la varianza de la serie.
3.1. Verificación de estacionaridad de la serie transformada
Prueba | Valor | Resultado |
---|---|---|
ADF (diferenciada) | 0.0100000 | Estacionaria |
KPSS (diferenciada) | 0.0436394 | Estacionaria |
De acuerdo con los resultados presentados en la tabla 8, al aplicar las pruebas de estacionariedad a la serie transformada, el resultado de la prueba ADF muestra un p-valor de 0.01, lo que permite concluir que la serie es estacionaria (p-valor < 0.05 → rechazo de la hipótesis nula (H₀) de no estacionariedad).
En cuanto a la prueba KPSS, se obtiene un valor estadístico de 0.043, el cual se encuentra muy por debajo de los umbrales definidos previamente. Esto permite concluir que la serie es estacionaria (estadístico < valor crítico → no rechazo de la hipótesis nula (H₀) de estacionariedad).
Ambas pruebas coinciden en que la serie transformada es estacionaria después de aplicar una diferenciación con d = 1. Con esto, se procede a la identificación de los órdenes p (AR) y q (MA) para completar la especificación del modelo ARIMA(p, d, q) usando d = 1 (ya que una diferenciación fue suficiente).
3.2. Visualización gráfica de la serie transformada
Se presenta la gráfica de la serie transformada para evaluar su estacionariedad mediante la observación de la media, tendencia y varianza.
1. Media (Línea Roja Horizontal)
Se espera una media constante (la serie oscila aleatoriamente alrededor de la línea roja):
Si la serie cruza frecuentemente la línea roja sin desviaciones prolongadas → Media estable (buen indicio de estacionariedad).
Si hay períodos donde la serie se mantiene por encima/debajo de la media → Tendencia residual (no estacionaria).
2. Tendencia (Línea Naranja - LOESS)
Se espera una línea LOESS plana (sin pendiente clara):
Si la línea naranja es aproximadamente horizontal → Sin tendencia dominante (estacionariedad).
Si se tiene pendiente ascendente/descendente → Tendencia remanente (se requiere más diferenciación).
3. Varianza (Amplitud de Oscilaciones)
Se esperan oscilaciones con amplitud constante a lo largo del tiempo:
Si los picos/valle son similares en magnitud → Varianza estable.
Si la volatilidad aumenta/disminuye con el tiempo → Heterocedasticidad.
## Estadístico Valor
## 1 Media 15.47337
## 2 Varianza 852862.65554
## 3 Tendencia_LOESS (inicial) 182.29090
Gráfica 10. Serie Diferenciada (d=1)
A partir de la gráfica 10 de la serie transformada, se pueden hacer las siguientes observaciones:
Tendencia visual: La línea LOESS (naranja) muestra una ligera pendiente descendente al inicio (valor inicial: 182,29), pero rápidamente se estabiliza en torno al eje cero, lo cual sugiere que no hay una tendencia persistente en la serie diferenciada. Esto favorece la estacionariedad en media.
Media cercana a cero: El valor de la media (15,47) está próximo a cero, coherente con lo esperado tras una primera diferenciación. Aunque no es exactamente cero, está dentro de un rango tolerable para considerar que la media es constante.
Varianza constante: La varianza es alta (852862,66), pero al inspeccionar visualmente la gráfica, no se observan cambios drásticos en la dispersión a lo largo del tiempo. Esto sugiere estabilidad en la varianza, lo cual es clave para la estacionariedad.
Ruido blanco aparente: La serie muestra oscilaciones alrededor de la media, con fluctuaciones aparentemente aleatorias, lo que es indicio de un comportamiento similar al ruido blanco, condición que puede ser deseable tras la diferenciación.
Estacionalidad eliminada: En comparación con la serie original, aquí no se observan patrones repetitivos claros por semana o mes, lo que indica que la diferenciación fue efectiva para eliminar la estacionalidad y hacer la serie más estacionaria.
En resumen, el análisis visual y estadístico indica que la serie diferenciada exhibe propiedades de estacionariedad, como una media aproximadamente constante, una varianza estable y la ausencia de tendencias sistemáticas.
4. Identificación de Parámetros ARIMA (p y q)
Se presentan a continuación los gráficos para ACF Y PACF, para la identificación de los parámetros ARIMA:
ACF (Función de Autocorrelación): para identificar q (parte MA)
PACF (Función de Autocorrelación Parcial): para identificar p (parte AR)
Gráfica 11. Función de Autocorrelación (ACF) y de Autocorrelación Parcial (PACF)
A continuación, se presentan las observaciones derivadas de los gráficos de la función de autocorrelación (ACF) y autocorrelación parcial (PACF), para identificar los posibles parámetros p y q para el modelo ARIMA:
Gráfico ACF (q - MA):
Se busca un corte en la ACF:
Se puede notar que lag 1 (–0.251) y lag 2 (–0.292) están ambos fuera de banda.
A partir de lag 3 (0.128) la ACF ya entra dentro de las bandas o decae rápidamente.
Esto sugiere q = 2 (un MA(2)), pues la ACF corta después de rezago 2.
Gráfico PACF (p - AR):
Se busca un corte en la PACF:
Aquí el único rezago que claramente supera la banda de confianza (aprox. ±0.18) es lag 2 (PACF ≈ –0.378).
Lag 1 (–0.251) también está fuera de banda, pero lag 2 es el que tiene mayor magnitud y ambos preceden al resto de signos aleatorios.
Esto apuntaría a considerar p = 2 (un AR(2)), porque la PACF no se “corta” hasta después del rezago 2.
Adicionalmente, se observa un pico pronunciado en el rezago 7, con un valor de ACF ≈ 0.459 y un PACF ≈ 0.200 en el mismo rezago. Esto sugiere la posibilidad de incluir un componente estacional, con órdenes potenciales de P = 0 o 1 y Q = 1.
En este sentido, se propone comenzar con la configuración ARIMA(2, 1, 2), ARIMA(0, 1, 1) y ARIMA(1, 1, 1) . Posteriormente, se compararán los valores de AIC/BIC y los errores de predicción para seleccionar el modelo que mejor se ajuste a los datos.
Para seleccionar el modelo ARIMA más adecuado, se aplicó una estrategia combinada:
Determinación del orden de diferenciación (d) con la función ndiffs().
Modelo automático mediante auto.arima(), explorando múltiples combinaciones de parámetros (p,d,q) optimizados por AICc.
Modelo manual ARIMA(1,d,1), basado en el análisis de la función de autocorrelación (ACF) y autocorrelación parcial (PACF).
Comparación de modelos mediante AIC, AICc y BIC, seleccionando el que presentó el menor AICc como modelo final.
Elementos técnicos y teóricos
La función auto.arima permite seleccionar automáticamente el mejor modelo ARIMA para una serie de tiempo, identificando los parámetros óptimos (p,d,q) mediante la minimización del AICc (Criterio de Información de Akaike Corregido). Este criterio busca la combinación que equilibre la bondad de ajuste y la parsimonia del modelo (Hyndman & Athanasopoulos, 2018).
El AICc es especialmente útil para series de tiempo cortas, ya que ajusta el AIC estándar considerando el tamaño de la muestra y el número de parámetros (Burnham & Anderson, 2004). Como señalan (Hyndman y Khandakar, 2008), “un valor más bajo de AICc indica un mejor ajuste, y diferencias mayores a 2 unidades entre modelos sugieren que uno es significativamente superior”. La salida típica es un objeto ARIMA con órdenes óptimos (ej.: ARIMA(1,1,1)).
Para la selección manual de modelos, se emplean métricas como el AIC (Criterio de Información de Akaike) y el BIC (Criterio de Información Bayesiano), accesibles mediante funciones como accuracy(). Ambos criterios evalúan la bondad de ajuste pero penalizan modelos complejos para evitar sobreajuste (Box et al., 2015).
La diferencia clave radica en la severidad de la penalización: “el BIC impone una penalización más fuerte que el AIC, lo que tiende a favorecer modelos más simples” (Kuha, 2004). Al igual que con el AICc, valores más bajos indican mejores modelos, y diferencias significativas (e.g., >10 unidades en BIC) pueden justificar la selección de uno sobre otro (Raftery, 1995).
Sin embargo, la relación entre estos criterios y la precisión predictiva (accuracy) requiere cautela. Aunque un AIC o BIC bajo sugiere un mejor equilibrio entre ajuste y complejidad, “no garantiza una mayor precisión en pronósticos, ya que estos criterios pueden priorizar la simplicidad sobre la exactitud” (Claeskens & Hjort, 2008). Por ello, la literatura recomienda complementar su análisis con validación cruzada o pruebas de pronóstico (Hyndman & Athanasopoulos, 2018).
En general se puede decir que:
Los resultados esperados de este análisis:
Regla rápida:
##
## ARIMA(0,0,0) with zero mean : 3319.408
## ARIMA(0,0,0) with non-zero mean : 2788.817
## ARIMA(0,0,1) with zero mean : 3132.724
## ARIMA(0,0,1) with non-zero mean : 2754.569
## ARIMA(0,0,2) with zero mean : 3025.559
## ARIMA(0,0,2) with non-zero mean : 2756.422
## ARIMA(0,0,3) with zero mean : 2986.211
## ARIMA(0,0,3) with non-zero mean : 2753.504
## ARIMA(0,0,4) with zero mean : 2922.618
## ARIMA(0,0,4) with non-zero mean : 2754.718
## ARIMA(0,0,5) with zero mean : 2888.554
## ARIMA(0,0,5) with non-zero mean : 2749.373
## ARIMA(1,0,0) with zero mean : 2807.801
## ARIMA(1,0,0) with non-zero mean : 2755.229
## ARIMA(1,0,1) with zero mean : Inf
## ARIMA(1,0,1) with non-zero mean : 2756.196
## ARIMA(1,0,2) with zero mean : Inf
## ARIMA(1,0,2) with non-zero mean : 2748.053
## ARIMA(1,0,3) with zero mean : Inf
## ARIMA(1,0,3) with non-zero mean : 2755.273
## ARIMA(1,0,4) with zero mean : Inf
## ARIMA(1,0,4) with non-zero mean : 2755.748
## ARIMA(2,0,0) with zero mean : 2799.513
## ARIMA(2,0,0) with non-zero mean : 2757.206
## ARIMA(2,0,1) with zero mean : Inf
## ARIMA(2,0,1) with non-zero mean : 2755.985
## ARIMA(2,0,2) with zero mean : Inf
## ARIMA(2,0,2) with non-zero mean : 2747.758
## ARIMA(2,0,3) with zero mean : Inf
## ARIMA(2,0,3) with non-zero mean : 2742.841
## ARIMA(3,0,0) with zero mean : Inf
## ARIMA(3,0,0) with non-zero mean : 2750.619
## ARIMA(3,0,1) with zero mean : Inf
## ARIMA(3,0,1) with non-zero mean : 2752.676
## ARIMA(3,0,2) with zero mean : Inf
## ARIMA(3,0,2) with non-zero mean : Inf
## ARIMA(4,0,0) with zero mean : Inf
## ARIMA(4,0,0) with non-zero mean : 2752.685
## ARIMA(4,0,1) with zero mean : Inf
## ARIMA(4,0,1) with non-zero mean : 2754.851
## ARIMA(5,0,0) with zero mean : Inf
## ARIMA(5,0,0) with non-zero mean : 2754.521
##
##
##
## Best model: ARIMA(2,0,3) with non-zero mean
De acuerdo con los resultados obtenidos, el mejor modelo encontrado automáticante es: ARIMA(2,0,3).
Comparación de Criterios
## Modelo AIC AICc BIC
## 1 ARIMA(2,1,2) 2736.283 2736.802 2755.063
## 2 ARIMA(0,1,1) 2746.052 2746.198 2755.442
## 3 ARIMA(1,1,1) 2740.025 2740.269 2752.544
## 4 ARIMA automático 2742.150 2742.841 2764.100
A continuación, se realiza una comparación de los criterios obtenidos de forma manual para ARIMA(2,1,2), ARIMA(0,1,1), ARIMA(1,1,1) y el modelo automático previamente identificado como ARIMA(2,0,3):
Modelo con mejor desempeño (ajuste): El modelo ARIMA(2,1,2) obtuvo el mejor resultado en los indicadores AIC (2736.28) y AICc (2736.80), lo que sugiere un buen ajuste a los datos históricos. Esto indica que es el modelo que mejor captura la dinámica de la serie, siendo seleccionado como el modelo final.
Modelo automático como alternativa eficiente: El modelo automático previamente identificado mediante auto.arima() fue ARIMA(2,0,3) con media distinta de cero. Aunque fue seleccionado automáticamente como el mejor candidato por el algoritmo, su desempeño (AICc = 2747.76) fue inferior al del modelo manual ARIMA(2,1,2). No obstante, representa una alternativa válida, especialmente al proponer una estructura estacionaria (d = 0), lo cual puede ser útil en contextos donde se prefiera evitar la diferenciación o reducir la transformación de los datos originales.
Modelos más simples descartados: Los modelos manuales ARIMA(0,1,1) y ARIMA(1,1,1) mostraron un desempeño inferior en todos los criterios evaluados (AIC, AICc y BIC). A pesar de su simplicidad, no ofrecen una ventaja significativa en términos de ajuste o eficiencia, por lo que no se recomienda su uso.
En general, el modelo ARIMA(2,1,2) puede considerarse como el más adecuado al priorizar la precisión en el ajuste. Por otro lado, aunque el modelo automático ARIMA(2,0,3) no fue el más adecuado en esta ocasión, sigue siendo una herramienta útil para validar decisiones y explorar configuraciones alternativas de forma rápida y automatizada.
## Series: train_numeric
## ARIMA(2,1,2) with drift
##
## Coefficients:
## ar1 ar2 ma1 ma2 drift
## -0.1720 -0.1107 -0.3768 -0.3742 2.9243
## s.e. 0.2846 0.1398 0.2805 0.2538 11.7684
##
## sigma^2 = 600651: log likelihood = -1362.14
## AIC=2736.28 AICc=2736.8 BIC=2755.06
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE ACF1
## Training set 16.87501 761.2169 606.9927 -3.229253 16.34416 0.8511244 0.0176797
De acuerdo con el resultado obtenido, en la selección del modelo ARIMA(2,1,2) with drift, se consideran los siguientes aspectos:
Precisión del modelo: El modelo presenta un AIC de 2736.28, AICc de 2736.80 y BIC de 2755.06, lo que lo posiciona como el modelo con el mejor ajuste en comparación con los demás modelos evaluados. Estos valores bajos de AIC y AICc indican que el modelo ofrece un buen balance entre la complejidad y el ajuste a los datos de entrenamiento.
Complejidad del modelo: El modelo ARIMA(2,1,2) incluye 2 coeficientes autorregresivos (AR), 2 coeficientes de medias móviles (MA) y un término de drift. Aunque no es el modelo más complejo, la cantidad de coeficientes es razonable y los errores estándar de los coeficientes son relativamente pequeños, lo que sugiere que las estimaciones son estables.
Desempeño en entrenamiento: Las métricas de error en el conjunto de entrenamiento muestran resultados aceptables:
RMSE: 761.22
MAE: 606.99
MAPE: 16.34%
Estos valores indican un margen de error razonable en la predicción de los valores históricos, con un desempeño adecuado para modelos de series temporales.
ACF1 cercano a 0 (0.0177): El valor de la autocorrelación de primer orden (ACF1) es cercano a cero, lo que indica que los residuos del modelo no presentan una autocorrelación significativa, un resultado deseable para la validez del modelo.
Consideración del drift: El término de drift tiene un valor de 2.9243 con un error estándar de 11.7684. Aunque el valor es relativamente bajo, su error estándar es alto en comparación con su magnitud, lo que sugiere que su significancia estadística podría ser baja. Esto podría indicar que el drift no aporta un valor sustancial al modelo y puede requerir una evaluación adicional.
En general se puede concluir que el modelo ARIMA(2,1,2) es una buena elección si el objetivo principal es maximizar el ajuste histórico, dado su buen desempeño en los criterios de AIC, AICc y BIC. Ahora, se procederá a realizar las predicciones y evaluar su rendimiento en términos de pronóstico.
Entendiendo los residuos como las diferencias entre los valores observados y los predichos por un modelo de regresión, la evaluación de estos residuos permite determinar si el modelo es adecuado y si se cumplen los supuestos subyacentes. Esto se logra mediante la función checkresiduals() en R, que realiza tres diagnósticos esenciales para verificar si los residuos del modelo ARIMA se comportan como ruido blanco (es decir, si no queda información no explicada en ellos). Estos diagnósticos incluyen la verificación de supuestos como la normalidad, la homocedasticidad (varianza constante de los residuos) y la independencia de los residuos.”
Los componentes clave del análisis son los siguientes:
A) Gráfico de Residuos
Presentan:
Se buscan:
B) ACF (Autocorrelación de Residuos)
Presentan:
Se buscan:
C) Test Ljung-Box
Propósito:
Hipótesis:
Interpretación:
D) Relación Entre Estos Componentes
E) Proceso diagnóstico
El análisis de residuos ayuda a evaluar si el modelo ARIMA ha capturado correctamente la estructura de la serie temporal.
Gráfica 12. Diagnóstico de Residuos
A continuación, se presentan los principales diagnósticos realizados a los residuos (gráfica 12) para verificar si se cumplen los supuestos de estacionariedad y ruido blanco:
Residuos vs Tiempo: Los residuos oscilan alrededor de cero sin mostrar una tendencia clara, lo que sugiere que son estacionarios y que el modelo ha capturado adecuadamente la estructura de la serie temporal.
ACF de Residuos (Autocorrelación): La presencia de autocorrelación en los primeros rezagos sugiere que el modelo podría no haber capturado completamente la dependencia temporal, aunque no necesariamente implique un fallo grave. La autocorrelación en los residuos indica una oportunidad para mejorar el ajuste del modelo” (Macmillan, 2025).
Distribución de Residuos: El histograma muestra una forma aproximadamente simétrica, cercana a una distribución normal, lo cual es favorable para los supuestos del modelo.
QQ Plot: Los puntos del gráfico QQ siguen en gran medida la línea recta, lo que sugiere que los residuos se distribuyen aproximadamente de forma normal, con ligeras desviaciones en los extremos (colas).
## Resultado de la prueba Ljung-Box:
##
## Box-Ljung test
##
## data: residuos
## X-squared = 39.26, df = 10, p-value = 2.286e-05
##
##
## Resultado de la prueba de normalidad (Shapiro-Wilk):
##
## Shapiro-Wilk normality test
##
## data: residuos
## W = 0.99379, p-value = 0.6895
A continuación, se presentan los resultados de las pruebas estadísticas realizadas para evaluar los residuos del modelo:
Prueba de Ljung-Box:
El valor-p = 2.286e-05 es significativamente menor que 0.05.
Interpretación: Se rechaza la hipótesis nula de independencia de los residuos. Esto sugiere que persiste autocorrelación significativa y que pueden quedar patrones no capturados por el modelo.
Prueba de normalidad (Shapiro-Wilk):
W = 0.99379, valor-p = 0.6895.
Interpretación: No se rechaza la hipótesis nula de normalidad, es decir, los residuos pueden considerarse aproximadamente normales.
Finalmente, se presentan las conclusiones generales derivadas de la evaluación de los residuos:
Normalidad: Los residuos muestran un comportamiento cercano a la normalidad, lo cual es favorable.
Autocorrelación: Hay evidencia significativa de autocorrelación en los residuos, lo que indica que el modelo puede necesitar ajustes.
Recomendación:
De acuerdo con el alcance del modelo, se sugiere la revisión del orden del modelo ARIMA, considera incorporar variables adicionales (AR o MA), o bien transformar los datos para capturar mejor la dependencia serial.
En el caso de este estudio se pueden plantear las siguientes razones para trabajar con este modelo, a pesar de que la prueba de Ljung-Box sugiere la presencia de autocorrelación en los residuos (valor-p = 2.286e-05), teniendo en cuenta que el objetivo es la predicción a corto plazo (10 días):
1. Estabilidad y estacionariedad aparente en los residuos: El gráfico de residuos vs tiempo muestra que los residuos oscilan de forma estable en torno a cero, sin patrones sistemáticos visibles. Esto indica que el modelo ha capturado bien la tendencia y la estacionalidad de la serie, lo cual es esencial para una buena predicción.
2. Autocorrelación moderada: Aunque la prueba de Ljung-Box es significativa, el gráfico ACF muestra que la mayoría de los rezagos están dentro de los límites de confianza, lo que sugiere que la autocorrelación no es severa. En contextos prácticos, una ligera autocorrelación puede ser tolerable si el modelo es estable y los errores no muestran estructura fuerte.(Hyndman & Athanasopoulos,2018)
3. Distribución aproximadamente normal de los residuos: La prueba de normalidad de Shapiro-Wilk (p = 0.6895) indica que no se puede rechazar la hipótesis de normalidad. Esto respalda la validez de los intervalos de predicción y proporciona confianza en las predicciones generadas por el modelo.
4. Simplicidad y utilidad del modelo actual: El modelo actual ha sido validado parcialmente a través de diagnósticos gráficos y estadísticos. Introducir ajustes adicionales podría aumentar la complejidad del modelo sin mejorar sustancialmente su capacidad predictiva, especialmente a corto plazo. Un modelo más complejo, con un mayor número de parámetros, corre el riesgo de sobreajustarse, particularmente cuando se cuenta con pocos datos, como es el caso en este análisis. Por otro lado, un modelo más sencillo tiene una mayor capacidad de generalización frente a nuevos datos (FasterCapital, s.f.).
Conclusión: En resumen, considerando que los residuos no presentan patrones sistemáticos evidentes, la autocorrelación es moderada y no dominante, y los residuos son aproximadamente normales, se decide optar por el uso del modelo actual ARIMA(2,1,2) para la predicción de los próximos 10 días, sin realizar ajustes adicionales al orden del modelo.
En esta sección se presenta el uso de la función forecast() para generar predicciones a corto plazo, aplicando el modelo ARIMA(2,1,2) previamente ajustado sobre la serie de datos correspondiente al número de servicios diarios de taxi.
Se definió un horizonte de pronóstico de 10 días, específicamente del 3 al 12 de abril de 2019 (h = 10). Este horizonte de pronóstico se refleja tanto en la visualización gráfica como en la tabla 9 de resultados.
Además, se establecieron intervalos de confianza del 95%. Junto con el valor central del pronóstico (estimación puntual), se presentan los límites inferior y superior de este intervalo, los cuales definen el rango dentro del cual se espera que se encuentren los valores reales con un 95% de confianza.
Gráfica 13. Pronóstico ARIMA – Ventana 2018-10-15 a 2019-04-12
Seguidamente, en la gráfica 13 de pronóstico se pueden observar las siguientes características:
La línea azul representa la serie de entrenamiento, que cubre el período comprendido entre octubre 15 de 2018 y el 2 de abril de 2019.
La línea verde muestra la predicción puntual generada por el modelo ARIMA para los 10 días siguientes, es decir entre el 3 y el 12 de abril de 2019.
La línea naranja corresponde a los valores reales del período de prueba, permitiendo una comparación directa con el pronóstico.
La banda sombreada en gris representa los valores del intervalo de confianza del 95%. En general, se observa que todos los valores reales (prueba) se mantienen dentro del rango de confianza, lo que sugiere que el modelo captura razonablemente la dinámica de la serie, aunque presenta una ligera subestimación en los días de mayor demanda.
Fecha | Real | Pronóstico | Límite Inferior (95%) | Límite Superior (95%) |
---|---|---|---|---|
2019-04-03 | 4,726 | 4,112.84 | 2593.836 | 5631.845 |
2019-04-04 | 4,372 | 4,125.48 | 2459.026 | 5791.940 |
2019-04-05 | 4,752 | 4,179.32 | 2510.309 | 5848.325 |
2019-04-06 | 3,706 | 4,172.41 | 2478.981 | 5865.835 |
2019-04-07 | 2,831 | 4,171.39 | 2448.223 | 5894.556 |
2019-04-08 | 4,181 | 4,176.08 | 2428.396 | 5923.764 |
2019-04-09 | 3,908 | 4,179.14 | 2407.095 | 5951.179 |
2019-04-10 | 4,294 | 4,181.84 | 2385.314 | 5978.372 |
2019-04-11 | 4,239 | 4,184.79 | 2364.201 | 6005.379 |
2019-04-12 | 4,700 | 4,187.73 | 2343.433 | 6032.037 |
La tabla 9 presenta el desempeño del pronóstico en el periodo de prueba (3–12 abril 2019), mostrando los valores reales, los pronosticados y sus límites de confianza al 95 %. A partir de estos datos se extraen las siguientes conclusiones:
Cobertura de los intervalos de confianza: Todos los valores reales quedan contenidos dentro de sus correspondientes límites inferiores y superiores (por ejemplo, el real de 4726 servicios el 3 abril se sitúa entre 2 594 y 5632), lo que indica que el modelo captura adecuadamente la variabilidad histórica y ofrece un intervalo de predicción fiable.
Rango de los intervalos: Los límites de confianza oscilan entre aproximadamente [2343 – 6032] servicios. Esta amplitud refleja la alta volatilidad de la demanda diaria y su estacionalidad semanal, así como la incertidumbre inherente al pronóstico de corto plazo.
Tendencia de los pronósticos vs. datos reales:
En días de alta demanda (4726 vs. 4113 el 3 abril; 4700 vs. 4188 el 12 abril), el modelo tiende a subestimar ligeramente el volumen real.
En días de baja demanda (2831 vs. 4171 el 7 abril), el pronóstico sobreestima la caída, manteniéndose cerca de la media general de entrenamiento.
Estas diferencias muestran un sesgo leve hacia la media histórica, típico en modelos ARIMA que priorizan la estabilidad frente a valores extremos.
Estabilidad de los pronósticos: La serie de pronósticos es notablemente constante (entre 4112 y 4188), reiterando que el modelo capta la tendencia central del periodo de entrenamiento y suaviza los movimientos abruptos, lo cual puede ser útil en planificación operativa, aunque implica menor reactividad a picos puntuales.
Error absoluto típico: Las discrepancias absolutas entre real y pronóstico varían entre unos 200 servicios (p.ej. 4372 – 4125 = 247 el 4 abril) y ~1340 servicios (p.ej. 2831 – 4171 = –1340 el 7 abril). Esto sugiere que el error medio diario se sitúa en el rango de 500–800 servicios, compatible con la desviación estándar de la demanda original (~883).
En conjunto, estos resultados apuntan a que el modelo ARIMA, con sus predicciones y bandas de incertidumbre, ofrece una buena cobertura probabilística y una tendencia central robusta, aunque con un sesgo hacia la media que tiende a suavizar los picos y valles extremos. Esto es apropiado para escenarios de planificación donde se prioriza la fiabilidad sobre la precisión exacta de cada día.
Para evaluar el desempeño del modelo ARIMA ajustado, se calcularon diversas métricas de precisión tanto para el conjunto de entrenamiento como para el conjunto de prueba. La tabla 10 presenta las métricas de desempeño del modelo ARIMA ajustado, tanto para el conjunto de entrenamiento como para el conjunto de prueba. Estas métricas incluyen el error medio (ME), la raíz del error cuadrático medio (RMSE), el error absoluto medio (MAE), el porcentaje de error medio (MPE), el error absoluto porcentual medio (MAPE), el error de escala media (MASE) y la autocorrelación de los residuos (ACF1).
ME | RMSE | MAE | MPE | MAPE | MASE | ACF1 | |
---|---|---|---|---|---|---|---|
Training set | 16.875011 | 761.2169 | 606.9927 | -3.229253 | 16.34416 | 0.1484839 | 0.0176797 |
Test set | 3.797639 | 559.4957 | 419.3845 | -2.129824 | 11.24419 | 0.1025908 | NA |
A partir de los resultados presentados en la tabla 10, se pueden extraer las siguientes observaciones:
1. Conjunto de entrenamiento:
ME (Error Medio): 16.875. Aunque positivo, este valor es muy bajo en relación con la magnitud de los datos, lo que sugiere que no hay un sesgo sistemático fuerte en los errores.
RMSE (Raíz del Error Cuadrático Medio): 761.217. Esta métrica penaliza más fuertemente los errores grandes, y su valor relativamente alto refleja la variabilidad natural de la serie temporal.
MAE (Error Absoluto Medio): 606.993. Representa el promedio de las desviaciones absolutas entre los valores observados y pronosticados. Al ser inferior al RMSE, indica que la mayoría de los errores no son extremos.
MAPE (Porcentaje de Error Absoluto Medio): 16.34. Esto significa que, en promedio, el modelo se equivoca en un 16.3% respecto al valor real, lo cual es aceptable para datos de alta variabilidad como los analizados.
MASE (Error Absoluto Escalado): 0.148. Un MASE menor a 1 sugiere que el modelo es más preciso que un modelo de referencia basado en pronósticos ingenuos (métodos simples y basicos de pronóstico).
ACF1: 0.018. El valor cercano a cero indica que los errores no están autocorrelacionados, lo cual es deseable y sugiere que el modelo no deja patrones sin explicar.
2. Conjunto de prueba:
ME: 3.798. Muy cercano a cero, lo que muestra un buen equilibrio sin sobrestimar ni subestimar de forma sistemática en el período de prueba.
RMSE: 559.496. Es más bajo que en el entrenamiento, lo que puede deberse a la menor variabilidad de los datos en el horizonte de pronóstico.
MAE: 419.385. Una reducción frente al entrenamiento, lo cual indica que el modelo logró mantener una precisión aceptable en datos no vistos.
MAPE: 11.24. Representa un buen nivel de precisión, con errores medios porcentuales por debajo del 12%, lo cual se considera un desempeño sólido.
MASE: 0.103. Mejor aún que en el conjunto de entrenamiento, lo que refuerza la idea de que el modelo pronostica mejor que un enfoque naïve que utiliza el último valor observado como pronóstico para el próximo periodo.
ACF1: No disponible para el conjunto de prueba, ya que este se evalúa sobre un conjunto limitado de observaciones, lo que impide estimar adecuadamente la autocorrelación del residuo.
En conclusión, de manera general, el modelo ARIMA demuestra un buen desempeño tanto en el conjunto de entrenamiento como en el de prueba. La baja magnitud de los errores y los valores aceptables de MAPE y MASE indican que el modelo es fiable para pronósticos de corto plazo. Además, la ausencia de autocorrelación en los errores del entrenamiento sugiere que la mayoría de los patrones de la serie fueron capturados correctamente.
A continuación, se presenta un resumen integrado de los hallazgos más relevantes, que abarca desde la exploración inicial de la demanda de taxis hasta la selección y diagnóstico del modelo ARIMA:
Durante la exploración de la serie (julio 2018–mayo 2019) se detectó:
Un nivel medio de ~3906 servicios diarios (mediana 3869) con desviación estándar alta (~883), periodos de mínima demanda en festivos (“Batalla de Boyacá”, “Día de la Raza”, “Viernes Santo”) y picos en jornadas especiales (“Día sin carro”, “Velitas”).
Una estacionalidad semanal muy pronunciada: el mínimo dominical (~2900) y el máximo de viernes (~4600) se repiten consistentemente, con lunes–viernes en ascenso y fin de semana en descenso.
Unos 14 outliers asociados en su mayoría a feriados y eventos locales, y solo un último punto (17-may) con probable fallo de registro.
Para la selección de la ventana de entrenamiento se evaluaron cuatro tramos de 180 días, optando por la Ventana 4 (15-oct-2018 a 12-abr-2019), que combina:
Estabilidad (coeficiente de variación más bajo y mezclas de media/mediana equilibradas).
Representatividad de los principales eventos sin arrastrar extremos no explicables.
Distribución simétrica con cola derecha moderada, menos outliers problemáticos.
Al diagnosticar la ACF/PACF de la serie diferenciada, se identificó para la parte no estacional un ARIMA(2,1,2) (picos en lag 1–2 de PACF y ACF) y un componente estacional semanal (p,1,1) (pico en lag 7) con p = 0 y p = 1.
En la comparación de modelos, ARIMA(2,1,2) obtuvo el AIC más bajo (2736.28) frente a ARIMA(1,1,1), ARIMA(0,1,1) y auto.arima().
Los residuos del modelo final:
Oscilan alrededor de cero sin tendencia visible, con distribución aproximada a la normal (Shapiro–Wilk p=0.6895).
Sin embargo, la prueba de Ljung–Box (p=2.29×10⁻⁵) rechaza la independencia, indicando autocorrelación remanente y oportunidad de mejora.
Finalmente, en el pronóstico a 10 días (3–12 abril 2019):
Todos los valores reales cayeron dentro de los intervalos de confianza 95% [2343–6032], validando cobertura probabilística.
El RMSE en test (559.5) y MAPE (11.24%) muestran un error moderado pero competitivo (MASE < 1) frente a pronóstico naïve .
El modelo tiende a suavizar extremos, subestimando picos y sobrestimando valles, lo cual puede considerarse un sesgo conservador.
En síntesis, el análisis exploratorio y de pronóstico confirma que el modelo ARIMA(2,1,2) es adecuado para la ventana seleccionada (15-oct-2018 a 12-abr-2019), con buena cobertura de incertidumbre y desempeño global aceptable, aunque con margen de ajuste fino para eliminar la autocorrelación residual.
En este apartado se analizan las discrepancias entre las expectativas iniciales del análisis y los resultados reales obtenidos:
1. Contraste entre expectativas y resultados
Estacionariedad tras diferenciación:
Expectativa: Una primera diferencia (d = 1) bastaría para eliminar tendencia y estacionalidad.
Hallazgo: Aunque la media se centró en cero y la tendencia quedó aplanada, persistió autocorrelación residual—en particular a rezago semanal—y la prueba de Ljung–Box indicó dependencia significativa en los residuos.
Simplicidad del modelo:
Expectativa: Un ARIMA(1,1,1) podría capturar la dinámica principal dada la aparente caída en lag 1 de ACF/PACF.
Hallazgo: La comparación de AIC favoreció al modelo más complejo ARIMA(2,1,2) (AIC = 2736.28) por delante de (1,1,1), (0,1,1) y el modelo automático.
Precisión de los intervalos de confianza
Expectativa: Se preveía un rango de CI relativamente ajustado (~±500 servicios).
Hallazgo: Los intervalos resultaron amplios ([2343 – 6032]), reflejando la alta volatilidad de la demanda diaria y la incertidumbre intrínseca al horizonte de 10 días.
2. Lecciones aprendidas
Importancia de modelar la estacionalidad explícitamente: La permanencia de patrones semanales tras diferenciación muestra que es esencial usar un componente estacional (p. ej., SARIMA) en lugar de confiar solo en diferencias no estacionales.
Diagnóstico riguroso de residuos: La prueba de Ljung–Box (p < 0.001) confirma que, además de la distribución normal de residuos (Shapiro–Wilk p = 0.6895), es crucial evaluar la independencia para asegurar que no queden dependencias no capturadas.
Sesgo hacia la media: El modelo tiende a suavizar picos y valles—subestima extremos altos y sobreestima extremos bajos—lo cual es inherente a ARIMA y debe ponderarse según el uso: planificación de flota (donde se prefiere robustez) vs. respuesta en tiempo real (donde interesa la reactividad).
Selección de ventana de entrenamiento: La elección de una ventana de 180 días equilibró relevancia reciente y diversidad estacional, pero eliminar información de otros ciclos (por ejemplo, temporadas similares de años previos) puede limitar la capacidad de generalización del modelo.
En resumen, esta discusión evidencia las discrepancias entre lo esperado y lo observado, resalta la necesidad de incluir un componente estacional explícito y destaca la importancia de realizar diagnósticos adicionales (tanto de normalidad como de independencia) antes de adoptar un modelo ARIMA univariante sin reservas.
A continuación se presentan las principales implicaciones para la gestión del transporte en Cali, ilustrando de qué manera el uso del modelo ARIMA puede apoyar cada área operacional y estratégica:
Asignación dinámica de flota: El pronóstico diario y semanal permite anticipar con antelación las zonas de mayor demanda, de modo que la empresa pueda redistribuir su flota de taxis de forma proactiva, reduciendo tiempos de espera y kilómetros vacíos. Al integrar el modelo en un sistema de gestión, se pueden generar alertas automáticas cuando la demanda supere ciertos umbrales, habilitando —por ejemplo— el envío de refuerzos desde bases periféricas.
Optimización de tarifas y políticas de incentivos: Con estimaciones fiables de picos y valles de demanda, es posible implementar tarifación dinámica: ofrecer descuentos en días de baja demanda y tarifas premium en periodos críticos, equilibrando oferta y demanda y mejorando la rentabilidad. Asimismo, se pueden diseñar bonos o incentivos para conductores en turnos de alta presión (viernes) y estimular descansos durante los días de menor actividad (domingos).
Planificación de mantenimiento y recursos humanos: Sabiendo con antelación los periodos continuos de baja actividad (festivos religiosos, fines de semana), la empresa puede programar el mantenimiento preventivo de vehículos y la rotación de personal, evitando interrumpir el servicio en momentos de alta demanda y maximizando la disponibilidad en horarios críticos.
Integración con plataformas móviles y apps: La observación clave de integrar modelos de predicción con apps de movilidad es fundamental: al compartir el pronóstico de demanda con plataformas de transporte público y ride-hailing, se fortalece la respuesta coordinada en eventos masivos (ferias, días festivos), desviando usuarios según capacidad disponible y reduciendo la congestión.
Mejora de la experiencia del usuario: Ofrecer a los pasajeros tiempos de espera estimados basados en el pronóstico —visible en aplicaciones móviles— incrementa la confianza y la percepción de servicio, además de reducir la incertidumbre en la toma de decisión de usar taxi frente a otros modos de transporte.
Soporte a la toma de decisiones de política pública: Las autoridades municipales pueden usar los pronósticos para ajustar medidas como pico y placa, programar días sin carro y coordinar el transporte público y de taxis en periodos de alta concurrencia, optimizando la movilidad urbana y la calidad del aire.
Reducción de costos operativos y emisiones: Al minimizar recorridos vacíos y optimizar rutas según la demanda pronosticada, se reduce el consumo de combustible y las emisiones de CO₂, apoyando los objetivos de sostenibilidad de la ciudad y generando ahorros en costos operativos.
En conjunto, el modelo ARIMA no solo ofrece un pronóstico puntual y sus intervalos de confianza, sino que, al integrarse en sistemas de gestión y aplicaciones móviles, brinda la base para una operación más eficiente, adaptable y centrada en el usuario, capaz de responder de manera coordinada y ágil a las dinámicas de demanda de Cali.
A pesar de su robustez y simplicidad, el modelo ARIMA evaluado presenta varias restricciones importantes en el contexto de la demanda de taxis en Cali:
Linealidad y univariedad: ARIMA asume relaciones lineales en los datos y solo utiliza información de la propia serie histórica, sin incorporar variables exógenas (p. ej., clima, eventos, tarifas) que pueden influir en la demanda de taxis.
Estacionalidad monoperiódica: Aunque se incluyó diferenciación estacional semanal, ARIMA captura solo un ciclo fijo (s = 7). Cualquier estacionalidad múltiple (mensual, anual) o cambios en el patrón estacional a lo largo del tiempo no quedan modelados adecuadamente.
Supuestos de estacionariedad y normalidad: El éxito de ARIMA depende de que la serie sea estacionaria tras diferenciación y que los residuos sean ruido blanco con distribución normal. La prueba de Ljung–Box evidenció autocorrelación remanente, lo que indica violaciones al supuesto de independencia , y los ligeros desvíos en el QQ-plot apuntan a colas más pesadas de lo ideal.
Sensibilidad a outliers y cambios estructurales: ARIMA es vulnerable a valores atípicos y rupturas de nivel. Aunque se ha detectado y explicado gran parte de los outliers, cualquier evento futuro inesperado (bloqueos, fallos de datos) podría degradar la precisión del modelo sin intervención manual.
Ventana de datos fija: El uso de una ventana de 180 días garantiza relevancia, pero descarta información histórica valiosa de ciclos anteriores (p. ej., mismas fechas en años previos). Esto puede inducir sesgo cuando patrones de demanda cambian estacionalmente entre años.
Limitaciones de pronóstico a corto plazo: ARIMA está optimizado para horizontes breves; su error crece con el plazo de pronóstico y no adapta dinámicamente la estructura del modelo en tiempo real sin recalibración manual.
Para superar estas limitaciones y fortalecer la capacidad predictiva, se proponen las siguientes estrategias:
Modelos SARIMA para estacionalidad múltiple:
El modelo SARIMA \((p,d,q)(P,D,Q)_s\) permite modelar simultáneamente la parte no estacional (p,d,q) y la parte estacional (P,D,Q) con periodo \(s\) (por ejemplo, semanal (s=7), mensual (s=12)).
Al probar SARIMA es posible capturar más fielmente los ciclos semanales y potenciales variantes mensuales o anuales sin recurrir a modelos híbridos más complejos.
Modelos híbridos y no lineales:
Incorporación de variables exógenas (SARIMAX/ARIMAX):
Optimización de ventana y validación dinámica:
Implementación en tiempo real y monitoreo continuo:
Integración con sistemas móviles y gestión multimodal:
Durante el análisis exploratorio se identificó un nivel medio de ~3900 servicios diarios con alta dispersión (±900 servicios), marcados patrones semanales (mínimo dominical y pico viernes) y valores extremos asociados a festivos y eventos locales. La elección de una ventana de entrenamiento de 180 días, centrada en un tramo representativo de 15-oct-2018 a 12-abr-2019, permitió equilibrar relevancia reciente y estabilidad estadística. Tras diferenciar la serie (d=1) y examinar ACF/PACF, se detectaron órdenes no-estacionales p=2, q=2 y un componente MA estacional en lag 7, dando origen al modelo ARIMA(2,1,2).
La comparación entre candidatos mostró que ARIMA(2,1,2) minimizó AIC (2736.28) frente a ARIMA(1,1,1), ARIMA(0,1,1) y auto.arima(). El diagnóstico de residuos indicó normalidad aceptable (Shapiro–Wilk p=0.69) pero autocorrelación remanente (Ljung–Box p<0.001), sugiriendo futuras mejoras con SARIMA o modelos híbridos. En el pronóstico a 10 días, todos los valores reales cayeron dentro del CI 95% (2343–6032), y el error en test (RMSE≈560, MAPE≈11%, MASE<1) confirmó un buen desempeño del modelo.
En síntesis, el modelo ARIMA(2,1,2) proporciona una base robusta para pronósticos de corto plazo en la demanda de taxis en Cali, reflejando la variabilidad histórica y los ciclos semanales, aunque con un sesgo conservador en picos y valles que podría pulirse mediante modelos estacionales explícitos (SARIMA) o técnicas no lineales (ARIMAX, TBATS).