SERIES DE TIEMPO
Análisis exploratorio
INTRODUCCIÓN.
Para esta primer tarea, nos basaremos en el archivo Series de Tiempo proporcionado en clase para la obtención de los datos y darnos una idea de cómo realizar el análisis requerido.
Resumir la información mediante valores de tendencia central, dispersión de datos u otras medidas, por ejemplo, medias, medianas, modas, cuantiles,varianza, frecuencias.
Encontrar valores outlier y analizar un posible tratamiento a estos
Ver el comportamiento de los datos mediante gráficas.
Describir en sus palabras el comportamiento de los serie de tiempo y dar una explicación a los datos respecto a la periodicidad y tendencia (Por ejemplo, si gráficamente en diciembre hay más incendios es posiblemente por la implementación de luminaria)
Consumo de energía electrica domestica (CONELDO)
Para esta base de datos nosotros llenamos manualmente los registros con info de INEGI correspondientes al consumo eléctrico domestico total en miles de millones de watts/hora en el territorio mexicano, desde enero 2009 hasta diciembre 2017.
CONELDO=c(2861, 2833, 2686, 2798, 3123, 3232, 3377, 3545, 3558,
3275, 3079, 2792, 2825, 2769, 2655, 2735, 2996, 3282,
3594, 3544, 3633, 3422, 3220, 2859, 2998, 3062, 2907,
3012, 3349, 3537, 3688, 3632, 3792, 3608, 3274, 3049,
2999, 2990, 2983, 3068, 3279, 3440, 3636, 3670, 3835,
3605, 3436, 3126, 3126, 3120, 2905, 2992, 3272, 3524,
3732, 3807, 3793, 3631, 3481, 3203, 3230, 3176, 3005,
3119, 3382, 3543, 3820, 3985, 3950, 3743, 3512, 3211,
3229, 3212, 3043, 3188, 3483, 3678, 3896, 4142, 4190,
4063, 3847, 3482, 3415, 3330, 3063, 3284, 3677, 3964,
4211, 4296, 4310, 4142, 3858, 3591, 3371, 3331, 3297,
3396, 3753, 3967, 4322, 4341, 4398, 4213, 3867, 3509)Al no estar indexado, usamos la función time series que automaticamente indexa y ordena nuestros datos.
CONELDO.ts=ts(CONELDO,start =2009,frequency = 12)
print(CONELDO.ts)## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2009 2861 2833 2686 2798 3123 3232 3377 3545 3558 3275 3079 2792
## 2010 2825 2769 2655 2735 2996 3282 3594 3544 3633 3422 3220 2859
## 2011 2998 3062 2907 3012 3349 3537 3688 3632 3792 3608 3274 3049
## 2012 2999 2990 2983 3068 3279 3440 3636 3670 3835 3605 3436 3126
## 2013 3126 3120 2905 2992 3272 3524 3732 3807 3793 3631 3481 3203
## 2014 3230 3176 3005 3119 3382 3543 3820 3985 3950 3743 3512 3211
## 2015 3229 3212 3043 3188 3483 3678 3896 4142 4190 4063 3847 3482
## 2016 3415 3330 3063 3284 3677 3964 4211 4296 4310 4142 3858 3591
## 2017 3371 3331 3297 3396 3753 3967 4322 4341 4398 4213 3867 3509
Una vez teniendo nuestros datos en un formato listo para ser manipulado, comenzamos por darnos una idea de qué está pasando con los consumos históricos del periodo 2009 - 2017.
Análisis de valores de tendencia central
summary(CONELDO)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2655 3120 3406 3438 3699 4398
Recordemos que la información mostrada está en relación de miles de millones de Watts por hora. ie:
\[ 1,000,000,000 \cdot Wh \]
Por otra parte nos gustaría saber en qué fechas se dieron los consumos mínimos y máximos.
CONELDO.ts == max(CONELDO.ts)## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2009 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2010 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2011 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2012 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2013 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2014 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2015 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2016 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2017 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE TRUE FALSE FALSE FALSE
CONELDO.ts == min(CONELDO.ts)## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2009 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2010 FALSE FALSE TRUE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2011 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2012 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2013 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2014 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2015 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2016 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
## 2017 FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE
- Min: Marzo 2010
- Max: Septiembre 2017
Dispersión de datos
Por otra parte veamos el comportamiento histórico de nuesra serie de datos ordenados:
ggplot(CONELDO.base, aes(x = time, y = CONELDO)) + #Se inicializa la gráfica
geom_line(color = 'steelblue') + #Se declara una gráfica de línea
labs(x = 'Tiempo', y = 'Miles de millones Watts/h',
title = 'Serie de Consumo Energía Eléctrica doméstica')De este gráfico podemos notar un tendencia creciente anual en el consumo eléctrico de los mexicanos.
Se aprecia que en los meses de