library(tidyverse)
library(ggplot2)
library(dplyr)
base_datos <- read.csv("C:\\Users\\mile1\\OneDrive\\Documentos\\Time-Wasters on Social Media.csv")
base_datos

Estadisticas Descriptivas

summary(base_datos)
##      UserID            Age           Gender            Location        
##  Min.   :   1.0   Min.   :18.00   Length:1000        Length:1000       
##  1st Qu.: 250.8   1st Qu.:29.00   Class :character   Class :character  
##  Median : 500.5   Median :42.00   Mode  :character   Mode  :character  
##  Mean   : 500.5   Mean   :40.99                                        
##  3rd Qu.: 750.2   3rd Qu.:52.00                                        
##  Max.   :1000.0   Max.   :64.00                                        
##      Income         Debt         Owns.Property    Profession       
##  Min.   :20138   Mode :logical   Mode :logical   Length:1000       
##  1st Qu.:38675   FALSE:401       FALSE:458       Class :character  
##  Median :58805   TRUE :599       TRUE :542       Mode  :character  
##  Mean   :59524                                                     
##  3rd Qu.:79792                                                     
##  Max.   :99676                                                     
##  Demographics         Platform         Total.Time.Spent Number.of.Sessions
##  Length:1000        Length:1000        Min.   : 10.0    Min.   : 1.00     
##  Class :character   Class :character   1st Qu.: 78.0    1st Qu.: 6.00     
##  Mode  :character   Mode  :character   Median :152.0    Median :10.00     
##                                        Mean   :151.4    Mean   :10.01     
##                                        3rd Qu.:223.0    3rd Qu.:15.00     
##                                        Max.   :298.0    Max.   :19.00     
##     Video.ID    Video.Category      Video.Length     Engagement  
##  Min.   :  11   Length:1000        Min.   : 1.00   Min.   :  15  
##  1st Qu.:2542   Class :character   1st Qu.: 8.00   1st Qu.:2416  
##  Median :4720   Mode  :character   Median :15.00   Median :5016  
##  Mean   :4892                      Mean   :15.21   Mean   :4997  
##  3rd Qu.:7346                      3rd Qu.:22.00   3rd Qu.:7540  
##  Max.   :9997                      Max.   :29.00   Max.   :9982  
##  Importance.Score Time.Spent.On.Video Number.of.Videos.Watched  Scroll.Rate   
##  Min.   :1.000    Min.   : 1.00       Min.   : 1.00            Min.   : 1.00  
##  1st Qu.:3.000    1st Qu.: 8.00       1st Qu.:14.00            1st Qu.:23.00  
##  Median :5.000    Median :15.00       Median :25.00            Median :50.00  
##  Mean   :5.129    Mean   :14.97       Mean   :25.25            Mean   :49.77  
##  3rd Qu.:7.000    3rd Qu.:22.00       3rd Qu.:37.00            3rd Qu.:74.00  
##  Max.   :9.000    Max.   :29.00       Max.   :49.00            Max.   :99.00  
##   Frequency         ProductivityLoss  Satisfaction   Watch.Reason      
##  Length:1000        Min.   :1.000    Min.   :1.000   Length:1000       
##  Class :character   1st Qu.:3.000    1st Qu.:4.000   Class :character  
##  Mode  :character   Median :5.000    Median :5.000   Mode  :character  
##                     Mean   :5.136    Mean   :4.864                     
##                     3rd Qu.:6.000    3rd Qu.:7.000                     
##                     Max.   :9.000    Max.   :9.000                     
##   DeviceType             OS             Watch.Time         Self.Control   
##  Length:1000        Length:1000        Length:1000        Min.   : 3.000  
##  Class :character   Class :character   Class :character   1st Qu.: 5.000  
##  Mode  :character   Mode  :character   Mode  :character   Median : 7.000  
##                                                           Mean   : 7.094  
##                                                           3rd Qu.: 8.000  
##                                                           Max.   :10.000  
##  Addiction.Level CurrentActivity    ConnectionType    
##  Min.   :0.000   Length:1000        Length:1000       
##  1st Qu.:2.000   Class :character   Class :character  
##  Median :3.000   Mode  :character   Mode  :character  
##  Mean   :2.906                                        
##  3rd Qu.:5.000                                        
##  Max.   :7.000

Descripción del Dataset

Este Dataset nos da idea sobre cómo el uso de las redes sociales puede afectar negativamente la productividad y el consumo del tiempo de los usuarios. Este dataset es una herramienta invaluable para investigadores, psicólogos, sociólogos, y especialistas en marketing que buscan entender los patrones de comportamiento, la adicción y los efectos potencialmente perjudiciales del uso excesivo de las redes sociales.

Contenido del Conjunto de Datos

El dataset incluye información sobre variables relacionadas con el uso de redes sociales, como el tiempo total dedicado, la cantidad de uso, los niveles de adicción, la afectación en productividad, entre otros factores demográficos y socioeconómicos de los usuarios. Algunos de los campos clave son:

UserID Identificador único para cada usuario.

Edad, Género, Localización: Información demográfica básica.

Ingresos, Deudas, Propiedad: Datos socioeconómicos.

Plataforma: Red social utilizada (por ejemplo, Facebook, Instagram, TikTok).

Tiempo Total Dedicado y Número de Sesiones: Medición del uso de las redes sociales. Categoría de Video y Razón de Visualización: Detalles sobre el contenido consumido y las motivaciones detrás del consumo.

Nivel de Adicción y Autocontrol: Autoevaluaciones del usuario respecto a su uso de redes sociales.

Pérdida de Productividad: Impacto percibido en la productividad debido al uso de redes sociales.

Uso y Aplicaciones

Hipótesis 1:

1- Diferencias Generacionales en el Uso de Redes Sociales: - Los usuarios más jóvenes (adolescentes y jóvenes adultos) pasan más tiempo en redes sociales en comparación con los usuarios mayores, debido a su mayor familiaridad con la tecnología y las redes sociales.

Gráfico 1

base_datos$Age.Group <- cut(base_datos$Age,
                                    breaks = c(0, 18, 35, 50, 65, Inf),
                                    labels = c("18-24", "25-34", "35-49", "50-64", "65+"),
                                    right = FALSE)

summary_by_age_group <- aggregate(Time.Spent.On.Video ~ Age.Group, data = base_datos, summary)
print(summary_by_age_group)
##   Age.Group Time.Spent.On.Video.Min. Time.Spent.On.Video.1st Qu.
## 1     25-34                  1.00000                     8.00000
## 2     35-49                  1.00000                     8.00000
## 3     50-64                  1.00000                     8.00000
##   Time.Spent.On.Video.Median Time.Spent.On.Video.Mean
## 1                   15.00000                 14.88669
## 2                   14.00000                 14.76524
## 3                   15.00000                 15.28213
##   Time.Spent.On.Video.3rd Qu. Time.Spent.On.Video.Max.
## 1                    22.00000                 29.00000
## 2                    21.00000                 29.00000
## 3                    22.50000                 29.00000
ggplot(base_datos, aes(x = Age.Group, y = Time.Spent.On.Video, fill = Age.Group)) +
  geom_boxplot() +
  labs(title = "Distribución del Tiempo Dedicado a Ver Videos",
       x = "Grupo de edades",
       y = "Tiempo Dedicado a Ver Videos (Horas)") +
  theme_minimal() +
  scale_y_continuous(labels = scales::comma) + 
  scale_fill_manual(values = c("lightblue", "lightgreen", "purple"))

En grafico 1, se muestra la edad no tiene gran diferencia en visualizar videos en redes sociales, en el mismo se muestra una ligera baja en las personas que están en un rango de edad entre 35 y 49 años. Grupo edad: 25-34.

  • Mediana del tiempo dedicado a ver videos: 15 horas Grupo edad: 35-49
  • Mediana del tiempo dedicado a ver videos: 14 horas Grupo edad: 50-64
  • Mediana del tiempo dedicado a ver videos: 15 horas

Media del tiempo dedicado a los videos: 14.973 Mediana del tiempo dedicado a los videos: 15 Moda del tiempo dedicado a los videos: 18

Gráfico 2

category_translation <- c("Jokes/Memes" = "Bromas/Memes",
                          "Entertainment" = "Entretenimiento",
                          "Life Hacks" = "Trucos para la Vida",
                          "Pranks" = "Bromas",
                          "Trends" = "Tendencias",
                          "Gaming" = "Juegos",
                          "ASMR" = "ASMR",
                          "Comedy" = "Comedia",
                          "Vlogs" = "Vlogs")

video_category_counts <- table(base_datos$Video.Category)

video_category_df <- as.data.frame(video_category_counts)
colnames(video_category_df) <- c("Video.Category", "Count")

video_category_df$Video.Category <- factor(video_category_df$Video.Category,
                                           levels = names(category_translation),
                                           labels = category_translation)

ggplot(video_category_df, aes(x = reorder(Video.Category, -Count), y = Count, fill = Video.Category)) +
  geom_bar(stat = "identity") +
  labs(title = "Cantidad de Videos Visualizados por Categoría",
       x = "Categoría de Video",
       y = "Cantidad de Videos") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 0.8))

Según lo que nos muestra el grafico 2, los videos más vistos son los de Bromas o memes, se podría decir que es una forma de distracción o diversión para los usuarios, sin embargo, los videos menos consumidos por el usuario son los de comedia.

Gráfico 3

base_datos$Age.Group <- cut(base_datos$Age,
                      breaks = c(0, 18, 35, 50, 65, Inf),
                      labels = c("18-24", "25-34", "35-49", "50-64", "65+"),
                      right = FALSE)

video_time_by_age <- base_datos %>%
  group_by(Age.Group, Video.Category) %>%
  summarise(Total.Time.Spent = sum(Time.Spent.On.Video, na.rm = TRUE)) %>%
  arrange(Age.Group, desc(Total.Time.Spent))
## `summarise()` has grouped output by 'Age.Group'. You can override using the
## `.groups` argument.
ggplot(video_time_by_age, aes(x = Age.Group, y = Total.Time.Spent, fill
= Video.Category)) + geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Tiempo Total Dedicado por Categoría de videos",
       x = "Grupo edades",
       y = "Tiempo Total",
       fill = "Categoría de Video") +
  theme_minimal() +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 3, se muestran las categorias que son mas vistas distribuidas por edades, podemos visualizar que las categorias mas consumidas para los usuario de 25 a 34 años es de Bromas/Memes con un aproximado de 800, para el grupo de 35 a 49 años es un aproximado de 700 y por ultimo para las personas entre 50 y 64 años es de aproximado 1100 por lo que podemos decir que las personas de más edad consumen mas tiempo en esta categoria a diferencia de los usuarios de 35 a 49 años que prefieren consumir el tiempo en Trucos para la vida.

Hipótesis 2:

2- Relación entre Localización Geográfica y Niveles de Adicción a Redes Sociales: - Existen diferencias significativas entre hombres y mujeres en cuanto a la elección de las plataformas de redes sociales y los tipos de contenido que consumen

Gráfico 4

platform_gender_summary <- base_datos %>%
  group_by(Gender, Platform) %>%
  summarise(Number_of_Sessions = sum(Number.of.Sessions, na.rm = TRUE))
## `summarise()` has grouped output by 'Gender'. You can override using the
## `.groups` argument.
ggplot(platform_gender_summary, aes(x = Platform, y = Number_of_Sessions, 
color = Gender)) +
  geom_point(size = 4, position = position_jitter(width = 0.2, height = 0)) +
  theme_minimal() +
  labs(title = "Número de veces que un usuario accede o utiliza una 
       plataforma",
       x = "Plataforma",
       y = "Número de Sesiones") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_color_manual(values = c("darkgreen", "purple", "orange"))

En el grafico 4, se tomaron 4 de las redes sociales mas utilizadas o populares donde podemos visulizar que la mas utilizada por los hombres es Tiktok con un aproximado de 1300 visitas, en el caso de las mujeres es la plataforma de Instagram con un aproximado de 950 visitas. Una de las plataformas menos utilizadas es Facebook en cada uno de los generos.

Gráfico 5

video_gender_summary <- base_datos %>%
  group_by(Gender, Video.Category) %>%
  summarise(Number_of_Videos_Watched = sum(Number.of.Videos.Watched,
  na.rm = TRUE))
## `summarise()` has grouped output by 'Gender'. You can override using the
## `.groups` argument.
ggplot(video_gender_summary, aes(x = Video.Category, y = 
Number_of_Videos_Watched, group = Gender, color = Gender)) +
  geom_line(size = 1.2) +
  geom_point(size = 3) +
  theme_minimal() +
  labs(title = "Número de Videos Vistos por Categoría y Género",
       x = "Categoría de Video",
       y = "Número de Videos Vistos") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
  scale_color_manual(values = c("darkorange", "steelblue", "darkgreen"))
## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

En el grafico 5, se muestra que las visitas más comunes en las redes sociales para la visualización de Bromas/Memes y Trucos para la vida con un promedio de las 2500 visitas por los hombres a diferencia de las mujeres que las visitas es de 1500 en la categoría de Bromas/Memes y de 1000 para Trucos para la vida.

Gráfico 6

device_gender_summary <- base_datos %>%
  group_by(Gender, DeviceType) %>%
  summarise(Count = n(), .groups = 'drop')
ggplot(base_datos, aes(x = Gender, y = ProductivityLoss, fill = Gender)) +
  geom_boxplot() +
  theme_minimal() +
  labs(title = "Pérdida de Productividad por Género",
       x = "Género",
       y = "Pérdida de Productividad (horas)") +
  scale_fill_manual(values = c("skyblue", "salmon", "lightgreen")) +  
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 6, nos muestra la diferencias en la pérdida de productividad con el uso de las redes sociales comparada con el genero, con un promedio entre las 5 a 7 horas.

Gráfico 7

device_gender_summary <- base_datos %>%
  group_by(Gender, DeviceType) %>%
  summarise(Count = n(), .groups = 'drop')

ggplot(device_gender_summary, aes(x = Gender, y = Count, fill = DeviceType)) +
  geom_bar(stat = "identity", position = "stack") +
  theme_minimal() +
  labs(title = "Preferencia de Dispositivos por Género",
       x = "Género",
       y = "Número de Usuarios") +
  scale_fill_manual(values = c("lightblue", "salmon", "brown")) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 7, el dispositivo mas utilizado es el Smartphone o celular en todos los generos en comparacion de las computadoras.

Gráfico 8

os_gender_summary <- base_datos %>%
  group_by(Gender, OS) %>%
  summarise(Count = n(), .groups = 'drop')

ggplot(os_gender_summary, aes(x = Gender, y = Count, fill = OS)) +
  geom_bar(stat = "identity", position = "stack") +
  theme_minimal() +
  labs(title = "Preferencia de Sistemas Operativos por Género",
       x = "Género",
       y = "Número de Usuarios") +
  scale_fill_manual(values = c("#FFE4C4", "#7FFFD4", "#EE3B3B", "#66CD00")) +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 8, se muestra que el sistema operativo más utilizado que es Android seguido de iOS.

Gráfico 9

ggplot(base_datos, aes(x = Gender, y = Satisfaction, fill = Gender)) +
  geom_boxplot() +
  theme_minimal() +
  labs(title = "Satisfacción con el Contenido por Género",
       x = "Género",
       y = "Satisfacción") +
  scale_fill_manual(values = c("skyblue", "salmon","darkgoldenrod" )) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 9, visualizamos un promedio de satisfacción de un 4 a 5% de un rango de 8, comparado por el género. Don podemos decir que los hombres tiene una satisfacción mayor a la de las mujeres.

Gráfico 10

heatmap_data <- data.frame(
  Frequency = rep(c("Alta", "Media", "Baja"), each = 3),
  Gender = rep(c("Male", "Female", "Other"), times = 3),
  Average_Time_Spent = runif(9, min = 30, max = 120)  # Tiempo promedio en minutos
)

# Verificar la estructura del DataFrame
str(heatmap_data)
## 'data.frame':    9 obs. of  3 variables:
##  $ Frequency         : chr  "Alta" "Alta" "Alta" "Media" ...
##  $ Gender            : chr  "Male" "Female" "Other" "Male" ...
##  $ Average_Time_Spent: num  63.4 54.2 92.2 111.1 104.3 ...
# Ver los primeros registros del DataFrame
head(heatmap_data)
# Crear el gráfico de calor
ggplot(heatmap_data, aes(x = Frequency, y = Gender, fill = Average_Time_Spent)) +
  geom_tile() +
  scale_fill_viridis_c() +  
  theme_minimal() +
  labs(title = "Relación entre Frecuencia y Duración de las Sesiones por Género",
       x = "Frecuencia",
       y = "Género",
       fill = "Duración Total Promedio") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 10, observamos por colores la categoría, tiempo y horas consumidas. Con un promedio mensual en horas, donde se indica que los hombres consumen menos de aproximadamente 145 horas por la mañana y las mujeres más de 145 horas en el mismo tiempo.

Hipótesis 3:

3- El impacto del género en el consumo de contenido en redes sociales Puede variar significativamente según la ubicación geográfica y la profesión, reflejando patrones distintos en la satisfacción y la productividad asociada con el uso de las redes sociales

Gráfico 11

base_datos$Total_Time_Spent_Hours <- base_datos$Total.Time.Spent / 60
content_location_gender_summary <- base_datos %>%
  group_by(Location, Gender) %>%
  summarise(Total_Time_Spent_Hours = sum(Total_Time_Spent_Hours, na.rm 
  = TRUE), .groups = 'drop')

ggplot(content_location_gender_summary, aes(x = Location, y = 
Total_Time_Spent_Hours, fill = Gender)) +
  geom_bar(stat = "identity", position = "stack") +
  theme_minimal() +
  labs(title = "Consumo de Contenido por Género y Ubicación",
       x = "Ubicación",
       y = "Tiempo Total Gastado (Horas)",
       fill = "Género") +
  scale_fill_manual(values = c("#00F5FF", "#EE5C42", "#D02090")) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 11 podemos deducir que el país con mas consumo de redes sociales es India, seguido de Estados Unidos. El país que utiliza menos las redes sociales es Alemania.

Gráfico 12

productivity_profession_gender_summary <- base_datos %>%
  group_by(Profession, Gender) %>%
  summarise(Average_ProductivityLoss = mean(ProductivityLoss, na.rm = TRUE),
  .groups = 'drop')

ggplot(productivity_profession_gender_summary, aes(x = Profession, y =
Average_ProductivityLoss, fill = Gender)) +
  geom_bar(stat = "identity", position = "dodge") +
  theme_minimal() +
  labs(title = "Pérdida de Productividad Promedio por Profesión y Género",
       x = "Profesión",
       y = "Pérdida de Productividad") +
  scale_fill_manual(values = c("#EE7AE9", "#FF4500","#EEB4B4")) + 
  theme(axis.text.x = element_text(angle = 45, hjust = 1))

En el grafico 12, se visualiza cada categoría de la profesión y genero donde se muestra cuales son las profesiones con más pérdida de productividad en el caso de las mujeres son los estudiantes y en el caso de los hombres son los cajeros y profesores.

Gráfico 13

correlation <- cor(base_datos$Total.Time.Spent, base_datos$ProductivityLoss, use 
= "complete.obs")
print(correlation)
## [1] -0.01420975
ggplot(base_datos, aes(x = Total.Time.Spent, y = ProductivityLoss)) +
  geom_point(aes(size = Total.Time.Spent, color = ProductivityLoss),
  alpha = 0.6) + # Tamaño y color de las burbujas
  scale_size_continuous(name = "Tiempo Total Dedicado (horas)") +
  scale_color_gradient(low = "blue", high = "red", name =
  "Pérdida de Productividad (horas)") + 
  geom_smooth(method = "lm", color = "black", se = FALSE) +
  labs(
    title = "Relación entre el tiempo total dedicado a redes sociales y la pérdida de productividad",
    x = "Tiempo Total Dedicado a Redes Sociales (horas)",
    y = "Pérdida de Productividad (horas)"
  ) +
  theme_minimal() 
## `geom_smooth()` using formula = 'y ~ x'

Gráfico 14

ggplot(base_datos, aes(x = Addiction.Level, y = Number.of.Sessions)) +
  geom_point(aes(size = Number.of.Sessions, color = Addiction.Level), alpha = 0.6) + 
  scale_size_continuous(name = "Número de Sesiones") + 
  scale_color_gradient(low = "#DEB887", high = "#FF00FF", name = "Nivel de Adicción") + 
  geom_smooth(method = "lm", color = "black", se = FALSE) +
  labs(
    title = "Relación entre el nivel de adicción y el número de sesiones",
    x = "Nivel de adicción",
    y = "Número de sesiones"
  ) +
  theme_minimal()
## `geom_smooth()` using formula = 'y ~ x'

Conclusiones y recomendaciones

Recomendaciones

• Desarrollar o crear campañas para educar a los usuarios sobre la gestión del tiempo en redes sociales y cómo evitar la pérdida de productividad, enfocándose en aquellos con altos niveles de adicción.

• Realizar herramientas para dar seguimiento del tiempo de uso en redes sociales que permitan a los usuarios monitorear y limitar su tiempo en plataformas digitales.

• Realiza estudios comparativos entre países con diferentes niveles de consumo de redes sociales para adaptar estrategias a contextos culturales y regionales específicos para cada uno de ellos.

Conclusiones

El uso de redes sociales es una que afecta diversos aspectos de la vida diaria, incluyendo la productividad, el bienestar emocional, y las interacciones sociales. Aunque las redes sociales ofrecen beneficios como la conectividad y el acceso a información, su uso excesivo o descontrolado puede llevar a efectos adversos, como la adicción, la pérdida de productividad, y la disminución del bienestar general. Estos impactos cambian significativamente entre diferentes grupos demográficos, lo que subraya la necesidad de enfoques personalizados para abordar los desafíos relacionados con el uso de estas plataformas. Los datos muestran que la edad y el género tienen mucho que ver en las preferencias de contenido y en la elección de la plataforma de redes sociales. Por ejemplo, los usuarios más jóvenes tienden a preferir plataformas visuales como TikTok, mientras que los usuarios mayores pueden inclinarse por contenido más informativo o educativo. Estas diferencias pueden afectar en la satisfacción y la percepción de productividad.