base_datos <- read.csv("C:\\Users\\mile1\\OneDrive\\Documentos\\Time-Wasters on Social Media.csv")
base_datos## UserID Age Gender Location
## Min. : 1.0 Min. :18.00 Length:1000 Length:1000
## 1st Qu.: 250.8 1st Qu.:29.00 Class :character Class :character
## Median : 500.5 Median :42.00 Mode :character Mode :character
## Mean : 500.5 Mean :40.99
## 3rd Qu.: 750.2 3rd Qu.:52.00
## Max. :1000.0 Max. :64.00
## Income Debt Owns.Property Profession
## Min. :20138 Mode :logical Mode :logical Length:1000
## 1st Qu.:38675 FALSE:401 FALSE:458 Class :character
## Median :58805 TRUE :599 TRUE :542 Mode :character
## Mean :59524
## 3rd Qu.:79792
## Max. :99676
## Demographics Platform Total.Time.Spent Number.of.Sessions
## Length:1000 Length:1000 Min. : 10.0 Min. : 1.00
## Class :character Class :character 1st Qu.: 78.0 1st Qu.: 6.00
## Mode :character Mode :character Median :152.0 Median :10.00
## Mean :151.4 Mean :10.01
## 3rd Qu.:223.0 3rd Qu.:15.00
## Max. :298.0 Max. :19.00
## Video.ID Video.Category Video.Length Engagement
## Min. : 11 Length:1000 Min. : 1.00 Min. : 15
## 1st Qu.:2542 Class :character 1st Qu.: 8.00 1st Qu.:2416
## Median :4720 Mode :character Median :15.00 Median :5016
## Mean :4892 Mean :15.21 Mean :4997
## 3rd Qu.:7346 3rd Qu.:22.00 3rd Qu.:7540
## Max. :9997 Max. :29.00 Max. :9982
## Importance.Score Time.Spent.On.Video Number.of.Videos.Watched Scroll.Rate
## Min. :1.000 Min. : 1.00 Min. : 1.00 Min. : 1.00
## 1st Qu.:3.000 1st Qu.: 8.00 1st Qu.:14.00 1st Qu.:23.00
## Median :5.000 Median :15.00 Median :25.00 Median :50.00
## Mean :5.129 Mean :14.97 Mean :25.25 Mean :49.77
## 3rd Qu.:7.000 3rd Qu.:22.00 3rd Qu.:37.00 3rd Qu.:74.00
## Max. :9.000 Max. :29.00 Max. :49.00 Max. :99.00
## Frequency ProductivityLoss Satisfaction Watch.Reason
## Length:1000 Min. :1.000 Min. :1.000 Length:1000
## Class :character 1st Qu.:3.000 1st Qu.:4.000 Class :character
## Mode :character Median :5.000 Median :5.000 Mode :character
## Mean :5.136 Mean :4.864
## 3rd Qu.:6.000 3rd Qu.:7.000
## Max. :9.000 Max. :9.000
## DeviceType OS Watch.Time Self.Control
## Length:1000 Length:1000 Length:1000 Min. : 3.000
## Class :character Class :character Class :character 1st Qu.: 5.000
## Mode :character Mode :character Mode :character Median : 7.000
## Mean : 7.094
## 3rd Qu.: 8.000
## Max. :10.000
## Addiction.Level CurrentActivity ConnectionType
## Min. :0.000 Length:1000 Length:1000
## 1st Qu.:2.000 Class :character Class :character
## Median :3.000 Mode :character Mode :character
## Mean :2.906
## 3rd Qu.:5.000
## Max. :7.000
Este Dataset nos da idea sobre cómo el uso de las redes sociales puede afectar negativamente la productividad y el consumo del tiempo de los usuarios. Este dataset es una herramienta invaluable para investigadores, psicólogos, sociólogos, y especialistas en marketing que buscan entender los patrones de comportamiento, la adicción y los efectos potencialmente perjudiciales del uso excesivo de las redes sociales.
El dataset incluye información sobre variables relacionadas con el uso de redes sociales, como el tiempo total dedicado, la cantidad de uso, los niveles de adicción, la afectación en productividad, entre otros factores demográficos y socioeconómicos de los usuarios. Algunos de los campos clave son:
UserID Identificador único para cada usuario.
Edad, Género, Localización: Información demográfica básica.
Ingresos, Deudas, Propiedad: Datos socioeconómicos.
Plataforma: Red social utilizada (por ejemplo, Facebook, Instagram, TikTok).
Tiempo Total Dedicado y Número de Sesiones: Medición del uso de las redes sociales. Categoría de Video y Razón de Visualización: Detalles sobre el contenido consumido y las motivaciones detrás del consumo.
Nivel de Adicción y Autocontrol: Autoevaluaciones del usuario respecto a su uso de redes sociales.
Pérdida de Productividad: Impacto percibido en la productividad debido al uso de redes sociales.
Uso y Aplicaciones
1- Diferencias Generacionales en el Uso de Redes Sociales: - Los usuarios más jóvenes (adolescentes y jóvenes adultos) pasan más tiempo en redes sociales en comparación con los usuarios mayores, debido a su mayor familiaridad con la tecnología y las redes sociales.
base_datos$Age.Group <- cut(base_datos$Age,
breaks = c(0, 18, 35, 50, 65, Inf),
labels = c("18-24", "25-34", "35-49", "50-64", "65+"),
right = FALSE)
summary_by_age_group <- aggregate(Time.Spent.On.Video ~ Age.Group, data = base_datos, summary)
print(summary_by_age_group)## Age.Group Time.Spent.On.Video.Min. Time.Spent.On.Video.1st Qu.
## 1 25-34 1.00000 8.00000
## 2 35-49 1.00000 8.00000
## 3 50-64 1.00000 8.00000
## Time.Spent.On.Video.Median Time.Spent.On.Video.Mean
## 1 15.00000 14.88669
## 2 14.00000 14.76524
## 3 15.00000 15.28213
## Time.Spent.On.Video.3rd Qu. Time.Spent.On.Video.Max.
## 1 22.00000 29.00000
## 2 21.00000 29.00000
## 3 22.50000 29.00000
ggplot(base_datos, aes(x = Age.Group, y = Time.Spent.On.Video, fill = Age.Group)) +
geom_boxplot() +
labs(title = "Distribución del Tiempo Dedicado a Ver Videos",
x = "Grupo de edades",
y = "Tiempo Dedicado a Ver Videos (Horas)") +
theme_minimal() +
scale_y_continuous(labels = scales::comma) +
scale_fill_manual(values = c("lightblue", "lightgreen", "purple"))En grafico 1, se muestra la edad no tiene gran diferencia en visualizar videos en redes sociales, en el mismo se muestra una ligera baja en las personas que están en un rango de edad entre 35 y 49 años. Grupo edad: 25-34.
Media del tiempo dedicado a los videos: 14.973 Mediana del tiempo dedicado a los videos: 15 Moda del tiempo dedicado a los videos: 18
category_translation <- c("Jokes/Memes" = "Bromas/Memes",
"Entertainment" = "Entretenimiento",
"Life Hacks" = "Trucos para la Vida",
"Pranks" = "Bromas",
"Trends" = "Tendencias",
"Gaming" = "Juegos",
"ASMR" = "ASMR",
"Comedy" = "Comedia",
"Vlogs" = "Vlogs")
video_category_counts <- table(base_datos$Video.Category)
video_category_df <- as.data.frame(video_category_counts)
colnames(video_category_df) <- c("Video.Category", "Count")
video_category_df$Video.Category <- factor(video_category_df$Video.Category,
levels = names(category_translation),
labels = category_translation)
ggplot(video_category_df, aes(x = reorder(Video.Category, -Count), y = Count, fill = Video.Category)) +
geom_bar(stat = "identity") +
labs(title = "Cantidad de Videos Visualizados por Categoría",
x = "Categoría de Video",
y = "Cantidad de Videos") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 0.8))Según lo que nos muestra el grafico 2, los videos más vistos son los de Bromas o memes, se podría decir que es una forma de distracción o diversión para los usuarios, sin embargo, los videos menos consumidos por el usuario son los de comedia.
base_datos$Age.Group <- cut(base_datos$Age,
breaks = c(0, 18, 35, 50, 65, Inf),
labels = c("18-24", "25-34", "35-49", "50-64", "65+"),
right = FALSE)
video_time_by_age <- base_datos %>%
group_by(Age.Group, Video.Category) %>%
summarise(Total.Time.Spent = sum(Time.Spent.On.Video, na.rm = TRUE)) %>%
arrange(Age.Group, desc(Total.Time.Spent))## `summarise()` has grouped output by 'Age.Group'. You can override using the
## `.groups` argument.
ggplot(video_time_by_age, aes(x = Age.Group, y = Total.Time.Spent, fill
= Video.Category)) + geom_bar(stat = "identity", position = "dodge") +
labs(title = "Tiempo Total Dedicado por Categoría de videos",
x = "Grupo edades",
y = "Tiempo Total",
fill = "Categoría de Video") +
theme_minimal() +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 3, se muestran las categorias que son mas vistas distribuidas por edades, podemos visualizar que las categorias mas consumidas para los usuario de 25 a 34 años es de Bromas/Memes con un aproximado de 800, para el grupo de 35 a 49 años es un aproximado de 700 y por ultimo para las personas entre 50 y 64 años es de aproximado 1100 por lo que podemos decir que las personas de más edad consumen mas tiempo en esta categoria a diferencia de los usuarios de 35 a 49 años que prefieren consumir el tiempo en Trucos para la vida.
2- Relación entre Localización Geográfica y Niveles de Adicción a Redes Sociales: - Existen diferencias significativas entre hombres y mujeres en cuanto a la elección de las plataformas de redes sociales y los tipos de contenido que consumen
platform_gender_summary <- base_datos %>%
group_by(Gender, Platform) %>%
summarise(Number_of_Sessions = sum(Number.of.Sessions, na.rm = TRUE))## `summarise()` has grouped output by 'Gender'. You can override using the
## `.groups` argument.
ggplot(platform_gender_summary, aes(x = Platform, y = Number_of_Sessions,
color = Gender)) +
geom_point(size = 4, position = position_jitter(width = 0.2, height = 0)) +
theme_minimal() +
labs(title = "Número de veces que un usuario accede o utiliza una
plataforma",
x = "Plataforma",
y = "Número de Sesiones") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
scale_color_manual(values = c("darkgreen", "purple", "orange"))En el grafico 4, se tomaron 4 de las redes sociales mas utilizadas o populares donde podemos visulizar que la mas utilizada por los hombres es Tiktok con un aproximado de 1300 visitas, en el caso de las mujeres es la plataforma de Instagram con un aproximado de 950 visitas. Una de las plataformas menos utilizadas es Facebook en cada uno de los generos.
video_gender_summary <- base_datos %>%
group_by(Gender, Video.Category) %>%
summarise(Number_of_Videos_Watched = sum(Number.of.Videos.Watched,
na.rm = TRUE))## `summarise()` has grouped output by 'Gender'. You can override using the
## `.groups` argument.
ggplot(video_gender_summary, aes(x = Video.Category, y =
Number_of_Videos_Watched, group = Gender, color = Gender)) +
geom_line(size = 1.2) +
geom_point(size = 3) +
theme_minimal() +
labs(title = "Número de Videos Vistos por Categoría y Género",
x = "Categoría de Video",
y = "Número de Videos Vistos") +
theme(axis.text.x = element_text(angle = 45, hjust = 1)) +
scale_color_manual(values = c("darkorange", "steelblue", "darkgreen"))## Warning: Using `size` aesthetic for lines was deprecated in ggplot2 3.4.0.
## ℹ Please use `linewidth` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
En el grafico 5, se muestra que las visitas más comunes en las redes sociales para la visualización de Bromas/Memes y Trucos para la vida con un promedio de las 2500 visitas por los hombres a diferencia de las mujeres que las visitas es de 1500 en la categoría de Bromas/Memes y de 1000 para Trucos para la vida.
device_gender_summary <- base_datos %>%
group_by(Gender, DeviceType) %>%
summarise(Count = n(), .groups = 'drop')
ggplot(base_datos, aes(x = Gender, y = ProductivityLoss, fill = Gender)) +
geom_boxplot() +
theme_minimal() +
labs(title = "Pérdida de Productividad por Género",
x = "Género",
y = "Pérdida de Productividad (horas)") +
scale_fill_manual(values = c("skyblue", "salmon", "lightgreen")) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 6, nos muestra la diferencias en la pérdida de productividad con el uso de las redes sociales comparada con el genero, con un promedio entre las 5 a 7 horas.
device_gender_summary <- base_datos %>%
group_by(Gender, DeviceType) %>%
summarise(Count = n(), .groups = 'drop')
ggplot(device_gender_summary, aes(x = Gender, y = Count, fill = DeviceType)) +
geom_bar(stat = "identity", position = "stack") +
theme_minimal() +
labs(title = "Preferencia de Dispositivos por Género",
x = "Género",
y = "Número de Usuarios") +
scale_fill_manual(values = c("lightblue", "salmon", "brown")) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 7, el dispositivo mas utilizado es el Smartphone o celular en todos los generos en comparacion de las computadoras.
os_gender_summary <- base_datos %>%
group_by(Gender, OS) %>%
summarise(Count = n(), .groups = 'drop')
ggplot(os_gender_summary, aes(x = Gender, y = Count, fill = OS)) +
geom_bar(stat = "identity", position = "stack") +
theme_minimal() +
labs(title = "Preferencia de Sistemas Operativos por Género",
x = "Género",
y = "Número de Usuarios") +
scale_fill_manual(values = c("#FFE4C4", "#7FFFD4", "#EE3B3B", "#66CD00")) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 8, se muestra que el sistema operativo más utilizado que es Android seguido de iOS.
ggplot(base_datos, aes(x = Gender, y = Satisfaction, fill = Gender)) +
geom_boxplot() +
theme_minimal() +
labs(title = "Satisfacción con el Contenido por Género",
x = "Género",
y = "Satisfacción") +
scale_fill_manual(values = c("skyblue", "salmon","darkgoldenrod" )) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 9, visualizamos un promedio de satisfacción de un 4 a 5% de un rango de 8, comparado por el género. Don podemos decir que los hombres tiene una satisfacción mayor a la de las mujeres.
heatmap_data <- data.frame(
Frequency = rep(c("Alta", "Media", "Baja"), each = 3),
Gender = rep(c("Male", "Female", "Other"), times = 3),
Average_Time_Spent = runif(9, min = 30, max = 120) # Tiempo promedio en minutos
)
# Verificar la estructura del DataFrame
str(heatmap_data)## 'data.frame': 9 obs. of 3 variables:
## $ Frequency : chr "Alta" "Alta" "Alta" "Media" ...
## $ Gender : chr "Male" "Female" "Other" "Male" ...
## $ Average_Time_Spent: num 63.4 54.2 92.2 111.1 104.3 ...
# Crear el gráfico de calor
ggplot(heatmap_data, aes(x = Frequency, y = Gender, fill = Average_Time_Spent)) +
geom_tile() +
scale_fill_viridis_c() +
theme_minimal() +
labs(title = "Relación entre Frecuencia y Duración de las Sesiones por Género",
x = "Frecuencia",
y = "Género",
fill = "Duración Total Promedio") +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 10, observamos por colores la categoría, tiempo y horas consumidas. Con un promedio mensual en horas, donde se indica que los hombres consumen menos de aproximadamente 145 horas por la mañana y las mujeres más de 145 horas en el mismo tiempo.
3- El impacto del género en el consumo de contenido en redes sociales Puede variar significativamente según la ubicación geográfica y la profesión, reflejando patrones distintos en la satisfacción y la productividad asociada con el uso de las redes sociales
base_datos$Total_Time_Spent_Hours <- base_datos$Total.Time.Spent / 60
content_location_gender_summary <- base_datos %>%
group_by(Location, Gender) %>%
summarise(Total_Time_Spent_Hours = sum(Total_Time_Spent_Hours, na.rm
= TRUE), .groups = 'drop')
ggplot(content_location_gender_summary, aes(x = Location, y =
Total_Time_Spent_Hours, fill = Gender)) +
geom_bar(stat = "identity", position = "stack") +
theme_minimal() +
labs(title = "Consumo de Contenido por Género y Ubicación",
x = "Ubicación",
y = "Tiempo Total Gastado (Horas)",
fill = "Género") +
scale_fill_manual(values = c("#00F5FF", "#EE5C42", "#D02090")) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 11 podemos deducir que el país con mas consumo de redes sociales es India, seguido de Estados Unidos. El país que utiliza menos las redes sociales es Alemania.
productivity_profession_gender_summary <- base_datos %>%
group_by(Profession, Gender) %>%
summarise(Average_ProductivityLoss = mean(ProductivityLoss, na.rm = TRUE),
.groups = 'drop')
ggplot(productivity_profession_gender_summary, aes(x = Profession, y =
Average_ProductivityLoss, fill = Gender)) +
geom_bar(stat = "identity", position = "dodge") +
theme_minimal() +
labs(title = "Pérdida de Productividad Promedio por Profesión y Género",
x = "Profesión",
y = "Pérdida de Productividad") +
scale_fill_manual(values = c("#EE7AE9", "#FF4500","#EEB4B4")) +
theme(axis.text.x = element_text(angle = 45, hjust = 1))En el grafico 12, se visualiza cada categoría de la profesión y genero donde se muestra cuales son las profesiones con más pérdida de productividad en el caso de las mujeres son los estudiantes y en el caso de los hombres son los cajeros y profesores.
correlation <- cor(base_datos$Total.Time.Spent, base_datos$ProductivityLoss, use
= "complete.obs")
print(correlation)## [1] -0.01420975
ggplot(base_datos, aes(x = Total.Time.Spent, y = ProductivityLoss)) +
geom_point(aes(size = Total.Time.Spent, color = ProductivityLoss),
alpha = 0.6) + # Tamaño y color de las burbujas
scale_size_continuous(name = "Tiempo Total Dedicado (horas)") +
scale_color_gradient(low = "blue", high = "red", name =
"Pérdida de Productividad (horas)") +
geom_smooth(method = "lm", color = "black", se = FALSE) +
labs(
title = "Relación entre el tiempo total dedicado a redes sociales y la pérdida de productividad",
x = "Tiempo Total Dedicado a Redes Sociales (horas)",
y = "Pérdida de Productividad (horas)"
) +
theme_minimal() ## `geom_smooth()` using formula = 'y ~ x'
ggplot(base_datos, aes(x = Addiction.Level, y = Number.of.Sessions)) +
geom_point(aes(size = Number.of.Sessions, color = Addiction.Level), alpha = 0.6) +
scale_size_continuous(name = "Número de Sesiones") +
scale_color_gradient(low = "#DEB887", high = "#FF00FF", name = "Nivel de Adicción") +
geom_smooth(method = "lm", color = "black", se = FALSE) +
labs(
title = "Relación entre el nivel de adicción y el número de sesiones",
x = "Nivel de adicción",
y = "Número de sesiones"
) +
theme_minimal()## `geom_smooth()` using formula = 'y ~ x'
Recomendaciones
• Desarrollar o crear campañas para educar a los usuarios sobre la gestión del tiempo en redes sociales y cómo evitar la pérdida de productividad, enfocándose en aquellos con altos niveles de adicción.
• Realizar herramientas para dar seguimiento del tiempo de uso en redes sociales que permitan a los usuarios monitorear y limitar su tiempo en plataformas digitales.
• Realiza estudios comparativos entre países con diferentes niveles de consumo de redes sociales para adaptar estrategias a contextos culturales y regionales específicos para cada uno de ellos.
Conclusiones
El uso de redes sociales es una que afecta diversos aspectos de la vida diaria, incluyendo la productividad, el bienestar emocional, y las interacciones sociales. Aunque las redes sociales ofrecen beneficios como la conectividad y el acceso a información, su uso excesivo o descontrolado puede llevar a efectos adversos, como la adicción, la pérdida de productividad, y la disminución del bienestar general. Estos impactos cambian significativamente entre diferentes grupos demográficos, lo que subraya la necesidad de enfoques personalizados para abordar los desafíos relacionados con el uso de estas plataformas. Los datos muestran que la edad y el género tienen mucho que ver en las preferencias de contenido y en la elección de la plataforma de redes sociales. Por ejemplo, los usuarios más jóvenes tienden a preferir plataformas visuales como TikTok, mientras que los usuarios mayores pueden inclinarse por contenido más informativo o educativo. Estas diferencias pueden afectar en la satisfacción y la percepción de productividad.