La plataforma digital de servicios QUIX desea atraer más usuarios. Para ello invertirá en pauta digital, permitiendo determinar las horas en la que las diferentes redes sociales tienen mayor afluencia de usuarios, con el fin de pautar los anuncios de la plataforma a los potenciales usuarios. Este prodecimeinto es de vital importancia ya que permite identificar los princiapales rangos horarios en los que se debe invertir el dinero, maximizando la exposición ante usuarios potenciales.
Se cuenta con una base de datos que hace referencia a la conexión de usuarios en un periodo de tiempo. Se desea extraer la información más relevante y eliminar los datos que no aportan información.
Podemos observar que la base de datos se encuentra conformada por 5 variables, de las cuales Id_usuario, Calificadora y Correo no aportan información representativa para la solución de la problemática porpuesta, por lo tanto, se prodece a eliminarlas y a transformar la variable Fecha.Consulta, con el fin de crear nuevas variables temporales con relación al día y hora de conexión.
Examinamos la información disponible:
## ï..id_usuario Calificadora Correo Fecha.Consulta Estado.usuario
## 1 c2290d89dfc4 Buró de Crédito gmail.com 19/01/21 9:20 ACTIVO
## 2 8d24ef1d52d8 Buró de Crédito gmail.com 19/01/21 8:28 ACTIVO
## 3 a5120d2c47fa Buró de Crédito gmail.com 17/01/21 13:36 ACTIVO
## 4 5a5d70893606 Buró de Crédito edubc.mx 20/01/21 9:27 ACTIVO
## 5 4a2082948031 Buró de Crédito gmail.com 21/01/21 14:26 ACTIVO
## 6 41a54ce08fae Buró de Crédito oitlook.com 18/01/21 16:13 ACTIVO
## Fecha de consulta Dia Hora Estado
## 1 19/01/21 9:20 martes 9.333333 ACTIVO
## 2 19/01/21 8:28 martes 8.466667 ACTIVO
## 3 17/01/21 13:36 domingo 13.600000 ACTIVO
## 4 20/01/21 9:27 miércoles 9.450000 ACTIVO
## 5 21/01/21 14:26 jueves 14.433333 ACTIVO
## 6 18/01/21 16:13 lunes 16.216667 ACTIVO
El objetivo principal de la actividad es establecer los rangos horarios con mayor conexión de los usuarios en las redes sociales, buscando determinar qué día y hora de la semana existe un mayor tráfico de usuarios.
## intervaloshorarios
## [0,2] (2,4] (4,6] (6,8] (8,10] (10,12] (12,14] (14,16] (16,18] (18,20]
## 336 123 63 121 281 345 402 414 453 485
## (20,22] (22,24]
## 529 470
## hora dias Usuarios
## 1 [0,2] domingo 43
## 2 [0,2] jueves 12
## 3 [0,2] lunes 37
## 4 [0,2] martes 50
## 5 [0,2] miércoles 19
## 6 [0,2] sábado 53
Ahora bien, procederemos a evaluar estadásticamente la cantidad de personas conectadas por día y hora. Para ello, emplearemos el Histograma de frecuencias.
Por otro lado, para evaluar el rango horario se emplea una función básica de densidad, donde se puede observar que el rango horario con mayor conexión es de 6 pm a 11 pm, siendo las 9 pm la hora de mayor afluencia. En promedio, el número de personas conectadas por hora es de 168 personas, siendo el horario de la mañana de 1am a 9 am la de menor conexión.
## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 2 row(s) containing missing values (geom_path).
La recolección de los datos ocurrió por un periodo de 36 días entre el 21/12/2020 y el 25/01/2021. El número de conexiones muestra una tendencia con distribución lognormal con la cola hacia la derecha, es decir, en los últimos días de diciembre hubo una muy baja conexión a la red social, mientras que en enero las conexiones fueron aumentando progresivamente hasta alcanzar su máximo en la tercera semana.
Primera fecha de recolección de los datos:
## [1] "2020-12-21"
Última fecha de recolección de los datos:
## [1] "2021-01-25"
A continuación, se procede a verificar el comportamiento de los datos bajo una ciclicidad semanal con respecto a cada rango horario.
La siguiente grafica, representa la cantidad de usuarios activos en las redes sociales por cada intervalo horario de 2 horas. Se puede observar que, la mayor cantidad de usuarios conectados se encuentran distribuidos los dias Jueves y Lunes en los horarios de las 6 pm a 11 pm.
por otro lado, la siguiente grafica representa la frecuencia absoluta de los usuarios activos de las redes sociales con respecto a cada intervalo de conexion. De igual manera, se puede observar como el dia jueves posee la mayor afluencia de usuarios en los horarios de 6:00 pm a 11:00pm.
Otro aspecto a resaltar es el poco trafico de usuarios entre las 04:00 am y 06:00 am, lo cual es logico ya que en estos hararios la mayoria de personas se encuentran descansando.
Par finallizar, se construye un Mapa de calor que representa de forma mas clara y contundente la alfuencia de usuarios en las redes sociales. Con base a esto, podemos establecer con facilidad que, el mejor rango horario para hacer la pauta publicitaria son los dias jueves de 18:00 pm a 20:00 pm, esperando un alcance de 114 usuarios.
En conclusión, de acuerdo a los datos disponibles, se ha propuesto analizar la problematica desde un punto de vista descriptivo y analitico, con el fin de entregar una informacion detallada, solida y simpleficada del problema con respecto a la distribucion del presupuesto para la pauta publicitaria en redes sociales.
se han propuesto diferentes diagramas para la interpretacion de la afluencia de usuarios en diferentes rangos horarios. En el diagrama de calor, es posible identificar claramente los rangos horarios con mayor y menor afluencia, ademas, se puede estimar la cantidad de usuarios a los que se pretende alcanzar en cada rango horario.
Debido la poca disponibilidad de los datos a través de los años, no podemos determinar una estacionalidad de las variables, esto no solo para determinar que dia de la semana es mejor para pautar, sino tambien cual es el mejor mes .