Analisis basico de series de tiempo
Para este analisis usaremos datos de las busquedas de “navidad” que se han hecho en google desde 2004 hasta 2021
library(readr)
navidad <- read_csv("navidadb.csv", show_col_types = FALSE)
View(navidad)
Grafiquemos los datos
plot.default(navidad)
Para tratar este vector como una serie de tiempo, usaremos el comando ts (time series object)
navidad.ts <- ts(navidad, start=c(2004,1), frequency = 12)
frequency = 12 meses es un anio (un ciclo) start = inicio enero de 2004
print(navidad.ts)
## Mes navidad
## Jan 2004 1 3
## Feb 2004 2 2
## Mar 2004 3 1
## Apr 2004 4 2
## May 2004 5 1
## Jun 2004 6 1
## Jul 2004 7 1
## Aug 2004 8 1
## Sep 2004 9 2
## Oct 2004 10 5
## Nov 2004 11 33
## Dec 2004 12 100
## Jan 2005 13 4
## Feb 2005 14 2
## Mar 2005 15 1
## Apr 2005 16 1
## May 2005 17 1
## Jun 2005 18 1
## Jul 2005 19 2
## Aug 2005 20 2
## Sep 2005 21 4
## Oct 2005 22 5
## Nov 2005 23 29
## Dec 2005 24 85
## Jan 2006 25 4
## Feb 2006 26 1
## Mar 2006 27 2
## Apr 2006 28 2
## May 2006 29 1
## Jun 2006 30 2
## Jul 2006 31 2
## Aug 2006 32 1
## Sep 2006 33 2
## Oct 2006 34 5
## Nov 2006 35 26
## Dec 2006 36 77
## Jan 2007 37 4
## Feb 2007 38 2
## Mar 2007 39 1
## Apr 2007 40 1
## May 2007 41 1
## Jun 2007 42 1
## Jul 2007 43 1
## Aug 2007 44 1
## Sep 2007 45 2
## Oct 2007 46 4
## Nov 2007 47 22
## Dec 2007 48 70
## Jan 2008 49 4
## Feb 2008 50 1
## Mar 2008 51 1
## Apr 2008 52 1
## May 2008 53 1
## Jun 2008 54 1
## Jul 2008 55 2
## Aug 2008 56 1
## Sep 2008 57 2
## Oct 2008 58 4
## Nov 2008 59 22
## Dec 2008 60 70
## Jan 2009 61 4
## Feb 2009 62 2
## Mar 2009 63 2
## Apr 2009 64 2
## May 2009 65 1
## Jun 2009 66 1
## Jul 2009 67 1
## Aug 2009 68 2
## Sep 2009 69 2
## Oct 2009 70 4
## Nov 2009 71 21
## Dec 2009 72 72
## Jan 2010 73 5
## Feb 2010 74 3
## Mar 2010 75 2
## Apr 2010 76 2
## May 2010 77 2
## Jun 2010 78 1
## Jul 2010 79 2
## Aug 2010 80 2
## Sep 2010 81 4
## Oct 2010 82 5
## Nov 2010 83 19
## Dec 2010 84 65
## Jan 2011 85 9
## Feb 2011 86 10
## Mar 2011 87 6
## Apr 2011 88 2
## May 2011 89 1
## Jun 2011 90 1
## Jul 2011 91 2
## Aug 2011 92 1
## Sep 2011 93 2
## Oct 2011 94 4
## Nov 2011 95 20
## Dec 2011 96 72
## Jan 2012 97 8
## Feb 2012 98 7
## Mar 2012 99 5
## Apr 2012 100 2
## May 2012 101 2
## Jun 2012 102 2
## Jul 2012 103 2
## Aug 2012 104 2
## Sep 2012 105 3
## Oct 2012 106 4
## Nov 2012 107 20
## Dec 2012 108 67
## Jan 2013 109 6
## Feb 2013 110 4
## Mar 2013 111 3
## Apr 2013 112 2
## May 2013 113 2
## Jun 2013 114 1
## Jul 2013 115 1
## Aug 2013 116 2
## Sep 2013 117 2
## Oct 2013 118 4
## Nov 2013 119 21
## Dec 2013 120 75
## Jan 2014 121 6
## Feb 2014 122 3
## Mar 2014 123 3
## Apr 2014 124 2
## May 2014 125 1
## Jun 2014 126 1
## Jul 2014 127 2
## Aug 2014 128 2
## Sep 2014 129 2
## Oct 2014 130 5
## Nov 2014 131 24
## Dec 2014 132 83
## Jan 2015 133 6
## Feb 2015 134 2
## Mar 2015 135 2
## Apr 2015 136 2
## May 2015 137 1
## Jun 2015 138 1
## Jul 2015 139 5
## Aug 2015 140 2
## Sep 2015 141 3
## Oct 2015 142 5
## Nov 2015 143 26
## Dec 2015 144 93
## Jan 2016 145 5
## Feb 2016 146 3
## Mar 2016 147 2
## Apr 2016 148 1
## May 2016 149 1
## Jun 2016 150 1
## Jul 2016 151 1
## Aug 2016 152 2
## Sep 2016 153 3
## Oct 2016 154 5
## Nov 2016 155 26
## Dec 2016 156 79
## Jan 2017 157 5
## Feb 2017 158 2
## Mar 2017 159 2
## Apr 2017 160 1
## May 2017 161 1
## Jun 2017 162 1
## Jul 2017 163 2
## Aug 2017 164 2
## Sep 2017 165 3
## Oct 2017 166 5
## Nov 2017 167 25
## Dec 2017 168 77
## Jan 2018 169 5
## Feb 2018 170 2
## Mar 2018 171 2
## Apr 2018 172 1
## May 2018 173 1
## Jun 2018 174 1
## Jul 2018 175 1
## Aug 2018 176 2
## Sep 2018 177 3
## Oct 2018 178 5
## Nov 2018 179 26
## Dec 2018 180 71
## Jan 2019 181 4
## Feb 2019 182 2
## Mar 2019 183 1
## Apr 2019 184 1
## May 2019 185 1
## Jun 2019 186 1
## Jul 2019 187 1
## Aug 2019 188 2
## Sep 2019 189 3
## Oct 2019 190 5
## Nov 2019 191 26
## Dec 2019 192 68
## Jan 2020 193 4
## Feb 2020 194 2
## Mar 2020 195 1
## Apr 2020 196 1
## May 2020 197 1
## Jun 2020 198 1
## Jul 2020 199 1
## Aug 2020 200 2
## Sep 2020 201 3
## Oct 2020 202 5
## Nov 2020 203 27
## Dec 2020 204 72
## Jan 2021 205 5
## Feb 2021 206 2
## Mar 2021 207 1
## Apr 2021 208 1
## May 2021 209 1
## Jun 2021 210 1
## Jul 2021 211 2
## Aug 2021 212 4
## Sep 2021 213 3
## Oct 2021 214 5
Ahora que tenemos una variable que es un objeto orientado a tiempo, podemos tener una grafica
plot(navidad.ts)
Ahora haremos una comparacion interanual de las busquedas de “navidad” en google
boxplot(navidad.ts ~ cycle(navidad.ts))
Entendamos los ciclos de las busquedas de “navidad” en google
cycle(navidad.ts)
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004 1 2 3 4 5 6 7 8 9 10 11 12
## 2005 1 2 3 4 5 6 7 8 9 10 11 12
## 2006 1 2 3 4 5 6 7 8 9 10 11 12
## 2007 1 2 3 4 5 6 7 8 9 10 11 12
## 2008 1 2 3 4 5 6 7 8 9 10 11 12
## 2009 1 2 3 4 5 6 7 8 9 10 11 12
## 2010 1 2 3 4 5 6 7 8 9 10 11 12
## 2011 1 2 3 4 5 6 7 8 9 10 11 12
## 2012 1 2 3 4 5 6 7 8 9 10 11 12
## 2013 1 2 3 4 5 6 7 8 9 10 11 12
## 2014 1 2 3 4 5 6 7 8 9 10 11 12
## 2015 1 2 3 4 5 6 7 8 9 10 11 12
## 2016 1 2 3 4 5 6 7 8 9 10 11 12
## 2017 1 2 3 4 5 6 7 8 9 10 11 12
## 2018 1 2 3 4 5 6 7 8 9 10 11 12
## 2019 1 2 3 4 5 6 7 8 9 10 11 12
## 2020 1 2 3 4 5 6 7 8 9 10 11 12
## 2021 1 2 3 4 5 6 7 8 9 10
Componentes estructurales de una serie de tiempo:
Serie observada = Tendencia + Efecto Estacional + Residuos
navidad.ts.desc <- decompose(navidad.ts)
plot(navidad.ts.desc, xlab = "Year")
Estabilizacion de la varianza
Antes de hacer la estabilizacion de varianza transformaremos nuestra seire a una logaritmica
plot(log(navidad.ts))
Eliminacion de tendencia
x <- log(navidad.ts)
dif1.x <- diff(x)
plot(dif1.x)
Eliminacion de la estacionalidad
dif12.dif1.x <- diff(dif1.x, lag = 12)
plot(dif12.dif1.x)
Las funciones de autocovarianza y autocorrelaciones
y = dif12.dif1.x
acf(y)
En base al analisis que hemos hecho se puede notar que las veces en las que estas busquedas se elevan drasticamente siempre son fechas de diciembre debido a que en ese mes comienza la epoca navideña y es una de las cosas que mas les interesa a la gente en esa temporada, mientras que el resto del año al no ser una temporada navideña obviamente va a haber un interes bastante bajo hacia esta, y asi como ocurre con la busqueda de “navidad” se puede deducir que el comportamiento sera similar con otras epocas del año como halloween o el dia de las madres.