Planteamiento del problema

La plataforma digital de servicios QUIX desea atraer más usuarios. Para ello invertirá en pauta digital, permitiendo determinar las horas en la que las diferentes redes sociales tienen mayor afluencia de usuarios, con el fin de pautar los anuncios de la plataforma a los potenciales usuarios. Este prodecimeinto es de vital importancia ya que permite identificar los princiapales rangos horarios en los que se debe invertir el dinero, maximizando la exposición ante usuarios potenciales.

Se cuenta con una base de datos que hace referencia a la conexión de usuarios en un periodo de tiempo. Se desea extraer la información más relevante y eliminar los datos que no aportan información.

Exploración de los datos

Podemos observar que la base de datos se encuentra conformada por 5 variables, de las cuales Id_usuario, Calificadora y Correo no aportan información representativa para la solución de la problemática porpuesta, por lo tanto, se prodece a eliminarlas y a transformar la variable Fecha.Consulta, con el fin de crear nuevas variables temporales con relación al día y hora de conexión.

Examinamos la información disponible:

##   ï..id_usuario      Calificadora      Correo Fecha.Consulta Estado.usuario
## 1  c2290d89dfc4 Buró de Crédito   gmail.com  19/01/21 9:20         ACTIVO
## 2  8d24ef1d52d8 Buró de Crédito   gmail.com  19/01/21 8:28         ACTIVO
## 3  a5120d2c47fa Buró de Crédito   gmail.com 17/01/21 13:36         ACTIVO
## 4  5a5d70893606 Buró de Crédito    edubc.mx  20/01/21 9:27         ACTIVO
## 5  4a2082948031 Buró de Crédito   gmail.com 21/01/21 14:26         ACTIVO
## 6  41a54ce08fae Buró de Crédito oitlook.com 18/01/21 16:13         ACTIVO
##   Fecha de consulta       Dia      Hora Estado
## 1     19/01/21 9:20    martes  9.333333 ACTIVO
## 2     19/01/21 8:28    martes  8.466667 ACTIVO
## 3    17/01/21 13:36   domingo 13.600000 ACTIVO
## 4     20/01/21 9:27 miércoles  9.450000 ACTIVO
## 5    21/01/21 14:26    jueves 14.433333 ACTIVO
## 6    18/01/21 16:13     lunes 16.216667 ACTIVO

El objetivo principal de la actividad es establecer los rangos horarios con mayor conexión de los usuarios en las redes sociales, buscando determinar qué día y hora de la semana existe un mayor tráfico de usuarios.

## intervaloshorarios
##   [0,2]   (2,4]   (4,6]   (6,8]  (8,10] (10,12] (12,14] (14,16] (16,18] (18,20] 
##     336     123      63     121     281     345     402     414     453     485 
## (20,22] (22,24] 
##     529     470
##    hora      dias Usuarios
## 1 [0,2]   domingo       43
## 2 [0,2]    jueves       12
## 3 [0,2]     lunes       37
## 4 [0,2]    martes       50
## 5 [0,2] miércoles       19
## 6 [0,2]    sábado       53

Análisis Exploratorío de los Datos.

Ahora bien, procederemos a evaluar estadásticamente la cantidad de personas conectadas por día y hora. Para ello, emplearemos el Histograma de frecuencias.

Por otro lado, para evaluar el rango horario se emplea una función básica de densidad, donde se puede observar que el rango horario con mayor conexión es de 6 pm a 11 pm, siendo las 9 pm la hora de mayor afluencia. En promedio, el número de personas conectadas por hora es de 168 personas, siendo el horario de la mañana de 1am a 9 am la de menor conexión.

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.
## Warning: Removed 2 row(s) containing missing values (geom_path).

La recolección de los datos ocurrió por un periodo de 36 días entre el 21/12/2020 y el 25/01/2021. El número de conexiones muestra una tendencia con distribución lognormal con la cola hacia la derecha, es decir, en los últimos días de diciembre hubo una muy baja conexión a la red social, mientras que en enero las conexiones fueron aumentando progresivamente hasta alcanzar su máximo en la tercera semana.

Primera fecha de recolección de los datos:

## [1] "2020-12-21"

Última fecha de recolección de los datos:

## [1] "2021-01-25"

A continuación, se procede a verificar el comportamiento de los datos bajo una ciclicidad semanal con respecto a cada rango horario.

La siguiente grafica, representa la cantidad de usuarios activos en las redes sociales por cada intervalo horario de 2 horas. Se puede observar que, la mayor cantidad de usuarios conectados se encuentran distribuidos los dias Jueves y Lunes en los horarios de las 6 pm a 11 pm.

por otro lado, la siguiente grafica representa la frecuencia absoluta de los usuarios activos de las redes sociales con respecto a cada intervalo de conexion. De igual manera, se puede observar como el dia jueves posee la mayor afluencia de usuarios en los horarios de 6:00 pm a 11:00pm.

Otro aspecto a resaltar es el poco trafico de usuarios entre las 04:00 am y 06:00 am, lo cual es logico ya que en estos hararios la mayoria de personas se encuentran descansando.

Par finallizar, se construye un Mapa de calor que representa de forma mas clara y contundente la alfuencia de usuarios en las redes sociales. Con base a esto, podemos establecer con facilidad que, el mejor rango horario para hacer la pauta publicitaria son los dias jueves de 18:00 pm a 20:00 pm, esperando un alcance de 114 usuarios.

Resultados

En conclusión, de acuerdo a los datos disponibles, se ha propuesto analizar la problematica desde un punto de vista descriptivo y analitico, con el fin de entregar una informacion detallada, solida y simpleficada del problema con respecto a la distribucion del presupuesto para la pauta publicitaria en redes sociales.

se han propuesto diferentes diagramas para la interpretacion de la afluencia de usuarios en diferentes rangos horarios. En el diagrama de calor, es posible identificar claramente los rangos horarios con mayor y menor afluencia, ademas, se puede estimar la cantidad de usuarios a los que se pretende alcanzar en cada rango horario.

Debido la poca disponibilidad de los datos a través de los años, no podemos determinar una estacionalidad de las variables, esto no solo para determinar que dia de la semana es mejor para pautar, sino tambien cual es el mejor mes .

Bibliografía

https://stackoverflow.com/questions/10705328/extract-hours-and-seconds-from-posixct-for-plotting-purposes-in-r

http://www.sthda.com/english/wiki/be-awesome-in-ggplot2-a-practical-guide-to-be-highly-effective-r-software-and-data-visualization

https://ggplot2.tidyverse.org/reference/theme.html