*Aquí podremos observar cómo es que se comportan las navegaciones acerca del tema “DÍA DE LAS MADRES” a lo largo del tiempo. Estos datos están recopilados desde el año 2004 hasta la actualidad.
#Importamos los datos
library(readr)
madress <- read_csv("madress.csv")
## Rows: 213 Columns: 1
## -- Column specification --------------------------------------------------------
## Delimiter: ","
## chr (1): 1
##
## i Use `spec()` to retrieve the full column specification for this data.
## i Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(madress)
#Gráficamos los datos
plot(madress)
## Warning in xy.coords(x, y, xlabel, ylabel, log): NAs introducidos por coerción
Como podemos observar en la gráfica de arriba encontramos los datos algo desordenados, sin mucho sentido simplemente que de arriba no sobrepasan los 100 y de abajo no sobrepasan los 220-230. Básicamente lo que encontramos en esta tabla son las búsquedas sobre las palabras “DÍA DE MADRES” en el navegador antes mencionado “Google”.
Necesitamos crear un vector númerico en una serie de tiempo el cual ordene los datos con forme a los años y meses desde 2004-2021.
madd.ts <- ts(madress, start = c (2004, 1), frequency = 12)
#Mostramos los datos ordenados
print(madd.ts)
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004 3 12 15 23 16 3 2 2 3 3 2 3
## 2005 3 16 17 28 12 1 1 1 3 1 1 3
## 2006 3 16 13 24 3 3 1 1 1 3 3 12
## 2007 3 18 14 20 3 1 1 1 1 1 1 3
## 2008 12 12 11 21 3 1 1 1 1 3 1 3
## 2009 12 16 6 17 3 1 1 1 3 1 3 3
## 2010 3 16 10 19 3 1 1 1 1 1 1 3
## 2011 3 16 4 25 18 3 3 1 3 1 3 3
## 2012 3 16 8 25 16 3 3 1 3 1 1 3
## 2013 3 12 7 22 16 3 3 1 3 1 1 3
## 2014 3 12 6 29 12 3 3 1 3 1 1 3
## 2015 3 16 9 33 12 3 3 1 1 1 1 3
## 2016 3 16 8 5 12 3 3 3 3 3 1 3
## 2017 3 16 6 35 12 3 3 1 3 3 1 3
## 2018 3 12 6 32 3 3 3 1 3 1 1 3
## 2019 3 16 31 30 3 3 3 3 3 1 3 3
## 2020 3 3 18 26 12 1 1 1 3 1 1 3
## 2021 3 12 27 34 12 3 3 3 3
Aquí podemos observar directamente la cantidad de búsquedas sobre el tema durante los últimos 17 años.
Posteriormente se crea la variable (que es un objeto orientado a tiempo). Dentro de la gráfica de abajo se muestra cómo es que se comportan las búsquedas de (Día de la Madre) durante el lapso de tiempo anteriormente mencionado.
plot(madd.ts)
Como logramos observar, se encuentra un patron en cierta temporada de los años en el cuál baja, para posteriormente subir.
Posteriormente haremos una comparación interanual para lograr observar con mayor claridad este patron generado del cuál se hablo en el texto anterior.
boxplot(madd.ts ~ cycle(madd.ts))
Del lado izquierdo podemos observar las cantidades de búsquedas y de la parte inferior se encuentran todos los meses de todos los años agrupados.
Podemos observar claramente que el mes que se mantiene más elevado es en abril. Con base en una investigación por internet encontre que el 13 de abril de 1922El periodista y fundador de Exélsior “Rafael Alducin” lanzó una convocatoría nacional para elegir una fecha especial para rendir homenaje de afecto y respeto a las madres mexicanas. Es por estó que en el mes de abril se tiene el más alto porcentaje de búsquedas, las personas búscan estos temas, por otra parte trantándose de una suposición opino que también puede ser una parte debido a que las personas tratan de adelantar las compras o eventos que vayan a realizar.
De esta manera se comporta el uso del navegador Google sobre la frase “DÍA DE LA MADRE” del 2004-actualidad
cycle(madd.ts)
## Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec
## 2004 1 2 3 4 5 6 7 8 9 10 11 12
## 2005 1 2 3 4 5 6 7 8 9 10 11 12
## 2006 1 2 3 4 5 6 7 8 9 10 11 12
## 2007 1 2 3 4 5 6 7 8 9 10 11 12
## 2008 1 2 3 4 5 6 7 8 9 10 11 12
## 2009 1 2 3 4 5 6 7 8 9 10 11 12
## 2010 1 2 3 4 5 6 7 8 9 10 11 12
## 2011 1 2 3 4 5 6 7 8 9 10 11 12
## 2012 1 2 3 4 5 6 7 8 9 10 11 12
## 2013 1 2 3 4 5 6 7 8 9 10 11 12
## 2014 1 2 3 4 5 6 7 8 9 10 11 12
## 2015 1 2 3 4 5 6 7 8 9 10 11 12
## 2016 1 2 3 4 5 6 7 8 9 10 11 12
## 2017 1 2 3 4 5 6 7 8 9 10 11 12
## 2018 1 2 3 4 5 6 7 8 9 10 11 12
## 2019 1 2 3 4 5 6 7 8 9 10 11 12
## 2020 1 2 3 4 5 6 7 8 9 10 11 12
## 2021 1 2 3 4 5 6 7 8 9
##DESCOMPOSICIÓN DE LA SERIE DE TIEMPO
Por esta parte vamos a encontrar la descomposición de la serie de tiempo 2004-2021 la cual hemos utilizado.
madd.ts.desc <- decompose(madd.ts)
plot(madd.ts.desc, xlab = "Year")
Podemos ver que por parte de la observación mantiene un patron, en la tendencia encontramos que ha tenido sus caidas y sus aumentos, en la parte de la estanción encontramos un ciclo el cual se ha ido repitiendo con el paso del tiempo al igual que por las secuelas en la mayor parte del tiempo estas se mantienen en ciertos niveles.
Aquí se creara la serie de tiempo en logarítmica y se observará su comportamiento con el paso del tiempo
plot(log(madd.ts))
Como logramos observar el comportamiento que tiene la navegación no es exponencial, no mantiene un tipo de tendencia, simplemente mantiene un patro en ciertas temporadas de año.
Aún que no hayamos obtenido una tendencia clara, eliminaremos la tendencia para lograr observar como se comporta
x <- log(madd.ts)
dif1.x <- diff(x)
plot(dif1.x)
Logramos apreciar con claridad los grandes aumentos y decrementos que se obtienen con el paso del tiempo los cuales no generan una gran impresión de cambio, simplemente se crean con similitud con el paso de los años.
Por otra parte también se eliminó la estacionalidad para lograr observar las diferencias estacionales.
dif12.dif1.x <- diff(dif1.x, lag = 12)
plot(dif12.dif1.x)
Sin tenes la estacionalidad se logra apreciar con mayor claridad que anterior al año 2015 las navegaciones se mantuvieron un poco bajas y no tuvieron aumentos o decrementos considerables como otros rangos de tiempo.
Por último se necesita observar la autocovarianza y las autocorrelaciones que se tienen en la navegación de estas palabras, para esto utilizaremos un correlograma.
y = dif12.dif1.x
acf(y)
Y como podemos observar en la mayor parte de la zona no se tienen muchas correlaciónes, simplemente son unas pocas las que podemos encontrar.
CONCLUSIÓN:
En conclusión personal me pareció sumamente importante todo lo anterior visto y realizado ya que me generó muchisímo conocimiento que en un futuro seguro utilizaré para darle más claridad a temas de interés. Por otra parte me gustaría mencionar que la navegación que se ha generado a lo largo de los años acerca de “Día de la Madre” se mantiene por los mismos rangos generalmente. En cierto periodo de tiempo ha tenido baja de navegación pero la mayor parte del tiempo se ha mantenido en un patron y un ciclo constante, cabe mencionar que me impresionó un poco el mes en el que se generaron la mayor parte de las navegaciones pues arrojó en el mes de “ABRIL” pero con base a investigación pude llegar a la conclusión de que probablemente el lanzamiento de la convocatoria del festejo de dicho día y el periodizar las compras u actividades que se quieran realizar son los principales factores por el cuál se mantiene la mayor parte de las búsquedas en Abril.