Descripción de Base de Datos

Row

Dark Side of Social Media

El conjunto de datos ofrece una visión detallada del comportamiento y la participación de los usuarios con las plataformas de redes sociales en Estados Unidos, país con un alto consumo de estas plataformas. Captura varios atributos, como la edad, género, profesión, y la plataforma utilizada, así como el tiempo total invertido, la frecuencia de uso, y las categorías de contenido vistas. Estos datos pueden ayudar a analizar el impacto de las redes sociales en el tiempo y la productividad de los usuarios, proporcionando información valiosa para investigadores, mercadólogos y científicos sociales interesados en entender las sutilezas del consumo de redes sociales en Estados Unidos.

Fuente: Riaz, Muhammad Roshan. “Dark Side of Social Media.” Kaggle, 8 July 2024, www.kaggle.com/datasets/muhammadroshaanriaz/time-wasters-on-social-media?resource=download.

Variables:

  • Age: La edad del usuario. (Cuantitativa, Continua)

  • Gender: El género del usuario. (Cualitativa, Nominal)

  • Profession: La profesión o título del trabajo del usuario. (Cualitativa, Nominal)

  • Platform: La plataforma de redes sociales utilizada por el usuario (por ejemplo, Facebook, Instagram, TikTok). (Cualitativa, Nominal)

  • Total Time Spent: El tiempo total que el usuario ha pasado en la plataforma. (Cuantitativa, Continua)

  • Video Category: La categoría del video visto (por ejemplo, Entretenimiento, Videojuegos, Bromas, Vlog). (Cualitativa)

  • Scroll Rate: Las veces que un usuario desplaza el contenido. (Cuantitativa, Continua)

  • Frequency: Con qué frecuencia el usuario inicia sesión en la plataforma. (Cualitativa)

  • Watch Reason: La razón por la que el usuario vio el video (por ejemplo, Entretenimiento, Información). (Cualitativa, Nominal)

  • Watch Time: La hora específica del día en que el usuario vio el video. (Cualitativa)

  • Current Activity: La actividad en la que el usuario estaba involucrado antes de usar la plataforma. (Cualitativa, Nominal)

Medidas de tendencia central

Table continues below
UserID Age Gender Profession
Min. : 1.0 Min. :18.00 Length:1000 Length:1000
1st Qu.: 250.8 1st Qu.:29.00 Class :character Class :character
Median : 500.5 Median :42.00 Mode :character Mode :character
Mean : 500.5 Mean :40.99 NA NA
3rd Qu.: 750.2 3rd Qu.:52.00 NA NA
Max. :1000.0 Max. :64.00 NA NA
Table continues below
Platform Total Time Spent Video Category Scroll Rate
Length:1000 Min. : 10.0 Length:1000 Min. : 1.00
Class :character 1st Qu.: 78.0 Class :character 1st Qu.:23.00
Mode :character Median :152.0 Mode :character Median :50.00
NA Mean :151.4 NA Mean :49.77
NA 3rd Qu.:223.0 NA 3rd Qu.:74.00
NA Max. :298.0 NA Max. :99.00
Frequency Watch Reason Watch Time CurrentActivity
Length:1000 Length:1000 Length:1000 Length:1000
Class :character Class :character Class :character Class :character
Mode :character Mode :character Mode :character Mode :character
NA NA NA NA
NA NA NA NA
NA NA NA NA

Variable: Total Time Spent vs Profession

Row

Grafico de cajas y bigotes

Row —————————————————————————–

Interpretación

Un gráfico de cajas y bigotes visualiza la distribución del tiempo diario en redes sociales. La caja muestra un rango intercuartílico (IQR) entre 78 y 223 minutos, y la mediana en 151-152 minutos. Los bigotes se extienden hasta los valores más extremos (10 a 298 minutos), excluyendo valores atípicos. En este caso, se observa un outlier en el extremo inferior, alrededor de 10 minutos.

Row

Grafico de barras

Row —————————————————————————–

Interpretación

El estudio muestra un alto consumo de redes sociales en todas las profesiones analizadas, siguiendo una tendencia de Estados Unidos, aunque con variaciones según la ocupación. Cashiers, trabajadores de oficios y artistas destacan por su mayor tiempo en redes, probablemente debido a la naturaleza menos demandante de sus empleos. En contraste, ingenieros y personal de servicio dedican menos tiempo, posiblemente por jornadas laborales más intensivas que limitan el uso recreativo de estas plataformas.

Variable: Total Time Spent vs Gender y Platform

Row

Grafico de Barras Gender

Row —————————————————————————–

Interpretación

El análisis de datos muestra una leve diferencia en el tiempo promedio dedicado a redes sociales entre hombres y mujeres, siendo el consumo de los hombres ligeramente superior. Sin embargo, la categoría “otros”, aunque es un grupo minoritario, reporta el tiempo promedio más alto, lo cual sugiere hábitos intensos de consumo. Factores como la búsqueda de comunidades afines y la exploración de identidades digitales podrían influir en este grupo, destacando la necesidad de estudios más detallados sobre su uso de redes sociales.

Row

Grafico de barras Platform

Row —————————————————————————–

Interpretación

La gráfica revela que los usuarios estadounidenses prefieren las plataformas de vídeo, especialmente las de contenido corto, con TikTok a la cabeza, seguido por YouTube, indicando una demanda de consumo rápido y entretenido. Facebook muestra menor tiempo de uso, posiblemente por su madurez y la competencia emergente. Instagram se ubica entre estos extremos, manteniéndose popular gracias a su combinación de fotos y videos cortos que atrae a una audiencia diversa.

Tabla Cruzada

Row

Video Category Vs Watch Reason

Boredom Entertainment Habit Procrastination
ASMR 26 16 31 6
Comedy 9 8 16 2
Entertainment 27 30 36 9
Gaming 36 29 40 14
Jokes/Memes 41 46 65 27
Life Hacks 42 43 55 22
Pranks 36 26 29 19
Trends 31 28 33 8
Vlogs 29 38 34 13

Interpretación:

  • Jokes/Memes y Life Hacks: Son las categorías más vistas, motivadas por hábitos y entretenimiento

  • Comedy: Menor frecuencia de visualización, con la categoria más vista hábito

  • Trends y entretenimiento: Presentan un consumo más equilibrado entre razones como el hábito.

  • Procrastinación: Aunque es menos común que el entretenimiento, aburrimiento y hábito, es notable en categorías como memes y life hacks

Gráfica de Barras Apiladas

Correlación

Row

Matriz de Correlación entre Variables Cuantitativas

  Age Total Time Spent Scroll Rate
Age 1 -0.004166 -0.01877
Total Time Spent -0.004166 1 0.004211
Scroll Rate -0.01877 0.004211 1

Interpretación:

Age y Total Time Spent: Correlación de -0.004, lo que indica que prácticamente no hay relación entre la edad y el tiempo total invertido en redes sociales.

Age y Scroll Rate: Correlación de -0.019, lo que sugiere una relación negativa muy débil; la edad no influye significativamente en la tasa de desplazamiento.

Total Time Spent y Scroll Rate: Correlación de 0.004, también muy cercana a 0, indicando que el tiempo invertido y la tasa de desplazamiento no tienen una relación significativa.

Gráfico de dispersión entre variables cuantitativas

Conclusiones

Row

Conclusiones del Trabajo:

  • Tiempo promedio en redes sociales: La mitad de los usuarios consume aproximadamente 152 minutos al día en redes sociales y en promedio se consume 151 minutos

  • Impacto de la profesión: Profesiones como “Cajeros”, “Trabajadores manuales” y “Artistas” muestran un uso más elevado de redes sociales, mientras que “Ingenieros” y “Personal de servicio” reportan un menor tiempo invertido.

  • Diferencias por género: Los hombres pasan ligeramente más tiempo en redes sociales que las mujeres, y la categoría “otros” muestra un consumo notablemente elevado, posiblemente debido a factores sociales específicos de este grupo.

  • Preferencia de plataformas: TikTok y YouTube dominan en popularidad, señalando una preferencia por contenido de video corto y entretenimiento rápido. Facebook tiene un menor tiempo de consumo.

  • Correlación : No existe una correlación significativa entre las tres variables, esto sugiere que cambios en la edad, el tiempo total gastado y la tasa de desplazamiento son independientes entre sí en este caso

  • Razones para ver videos: Las categorías “Memes” y “Life Hacks” son las más populares, motivadas principalmente por entretenimiento y hábito, mientras que la procastinación es la razón menos común para consumir contenido en redes sociales

###.

---
title: "Informe Final Estadística"
author: "María José Cabrera, Juliana Murillo y Santiago Solanilla"
date: "2024-10-16"
output: 
  flexdashboard::flex_dashboard:
    orientation: rows
    social: menu
    source_code: embed 
---

```{r setup base de datos}
library(flexdashboard)
library(readr)
Base_de_datos_3_ <- read_delim("Base de datos (3).csv", 
    delim = ";", escape_double = FALSE, trim_ws = TRUE)
```

```{r setup, include=FALSE}
library(corrplot)
library(ggplot2)
library(kableExtra)
library(summarytools)
library(tidyr)
library(modeest)
library(pander)
library(knitr)
library(PerformanceAnalytics)
```


Descripción de Base de Datos
=====================================================================================
Row
-----------------------------------------------------------------------------

### Dark Side of Social Media

El conjunto de datos ofrece una visión detallada del comportamiento y la participación de los usuarios con las plataformas de redes sociales en Estados Unidos, país con un alto consumo de estas plataformas. Captura varios atributos, como la edad, género, profesión, y la plataforma utilizada, así como el tiempo total invertido, la frecuencia de uso, y las categorías de contenido vistas. Estos datos pueden ayudar a analizar el impacto de las redes sociales en el tiempo y la productividad de los usuarios, proporcionando información valiosa para investigadores, mercadólogos y científicos sociales interesados en entender las sutilezas del consumo de redes sociales en Estados Unidos.

**Fuente:** 
Riaz, Muhammad Roshan. “Dark Side of Social Media.” Kaggle, 8 July 2024, www.kaggle.com/datasets/muhammadroshaanriaz/time-wasters-on-social-media?resource=download.

**Variables:**


- Age: La edad del usuario. (Cuantitativa, Continua)

- Gender: El género del usuario. (Cualitativa, Nominal)

- Profession: La profesión o título del trabajo del usuario. (Cualitativa, Nominal)

- Platform: La plataforma de redes sociales utilizada por el usuario (por ejemplo, Facebook, Instagram, TikTok). (Cualitativa, Nominal)

- Total Time Spent: El tiempo total que el usuario ha pasado en la plataforma. (Cuantitativa, Continua)

- Video Category: La categoría del video visto (por ejemplo, Entretenimiento, Videojuegos, Bromas, Vlog). (Cualitativa)

- Scroll Rate: Las veces que un usuario desplaza el
contenido. (Cuantitativa, Continua)

- Frequency: Con qué frecuencia el usuario inicia sesión en la plataforma. (Cualitativa)

- Watch Reason: La razón por la que el usuario vio el video (por ejemplo, Entretenimiento, Información). (Cualitativa, Nominal)

- Watch Time: La hora específica del día en que el usuario vio el video. (Cualitativa)

- Current Activity: La actividad en la que el usuario estaba involucrado antes de usar la plataforma. (Cualitativa, Nominal)


### Medidas de tendencia central
```{r medidas}
result <- summary(Base_de_datos_3_)
pander(result)
```

Variable: Total Time Spent vs Profession
=====================================================================================

Row
-----------------------------------------------------------------------------

###  Grafico de cajas y bigotes

![](Grafica1.png)
Row
-----------------------------------------------------------------------------

### Interpretación

Un gráfico de cajas y bigotes visualiza la distribución del tiempo diario en redes sociales. La caja muestra un rango intercuartílico (IQR) entre 78 y 223 minutos, y la mediana en 151-152 minutos. Los bigotes se extienden hasta los valores más extremos (10 a 298 minutos), excluyendo valores atípicos. En este caso, se observa un outlier en el extremo inferior, alrededor de 10 minutos.

Row
-----------------------------------------------------------------------------


### Grafico de barras

![](Grafica2.png)
Row
-----------------------------------------------------------------------------

### Interpretación

El estudio muestra un alto consumo de redes sociales en todas las profesiones analizadas, siguiendo una tendencia de Estados Unidos, aunque con variaciones según la ocupación. Cashiers, trabajadores de oficios y artistas destacan por su mayor tiempo en redes, probablemente debido a la naturaleza menos demandante de sus empleos. En contraste, ingenieros y personal de servicio dedican menos tiempo, posiblemente por jornadas laborales más intensivas que limitan el uso recreativo de estas plataformas.


Variable: Total Time Spent vs Gender y Platform
=====================================================================================

Row
-----------------------------------------------------------------------------

###  Grafico de Barras Gender

![](Grafica4.png)
Row
-----------------------------------------------------------------------------

### Interpretación

El análisis de datos muestra una leve diferencia en el tiempo promedio dedicado a redes sociales entre hombres y mujeres, siendo el consumo de los hombres ligeramente superior. Sin embargo, la categoría "otros", aunque es un grupo minoritario, reporta el tiempo promedio más alto, lo cual sugiere hábitos intensos de consumo. Factores como la búsqueda de comunidades afines y la exploración de identidades digitales podrían influir en este grupo, destacando la necesidad de estudios más detallados sobre su uso de redes sociales.

Row
-----------------------------------------------------------------------------


### Grafico de barras Platform

![](Grafica5.png)
Row
-----------------------------------------------------------------------------

### Interpretación

La gráfica revela que los usuarios estadounidenses prefieren las plataformas de vídeo, especialmente las de contenido corto, con TikTok a la cabeza, seguido por YouTube, indicando una demanda de consumo rápido y entretenido. Facebook muestra menor tiempo de uso, posiblemente por su madurez y la competencia emergente. Instagram se ubica entre estos extremos, manteniéndose popular gracias a su combinación de fotos y videos cortos que atrae a una audiencia diversa.



Tabla Cruzada
=====================================================================================
Row
-----------------------------------------------------------------------------

### Video Category Vs Watch Reason

```{r tablacruzada}
tabla_cruzada <- table(Base_de_datos_3_$`Video Category`,Base_de_datos_3_$`Watch Reason`)
library(knitr)
kable(tabla_cruzada)
```

**Interpretación:**

- **Jokes/Memes y Life Hacks:** Son las categorías más vistas, motivadas por hábitos y entretenimiento

- **Comedy:** Menor frecuencia de visualización, con la categoria más vista hábito

- **Trends y entretenimiento:** Presentan un consumo más equilibrado entre razones como el hábito.

- **Procrastinación:** Aunque es  menos común que el entretenimiento, aburrimiento y hábito, es notable en categorías como memes y life hacks

### Gráfica de Barras Apiladas
```{r barras}
ggplot(Base_de_datos_3_,aes(Base_de_datos_3_$`Video Category`,fill = Base_de_datos_3_$`Watch Reason`))+
  geom_bar()+
  labs(x="Video Category", y= "Frecuencias", fill="Watch Reason")+
  ggtitle("Diagrama de Barras Apiladas: Video Category vs Watch Reason")+theme(axis.text.x = element_text(angle = 45, hjust = 1))
```


Correlación 
=====================================================================================
Row
-----------------------------------------------------------------------------

### Matriz de Correlación entre Variables Cuantitativas

```{r matriz}
correlacion <- cor(Base_de_datos_3_[,c(2,6,8)])
pander(correlacion)

```

**Interpretación:**

**Age y Total Time Spent:** Correlación de -0.004, lo que indica que prácticamente no hay relación entre la edad y el tiempo total invertido en redes sociales.

**Age y Scroll Rate:** Correlación de -0.019, lo que sugiere una relación negativa muy débil; la edad no influye significativamente en la tasa de desplazamiento.

**Total Time Spent y Scroll Rate:** Correlación de 0.004, también muy cercana a 0, indicando que el tiempo invertido y la tasa de desplazamiento no tienen una relación significativa.


### Gráfico de dispersión entre variables cuantitativas

```{r correlacion}
library(PerformanceAnalytics)
correlacion <- cor(Base_de_datos_3_[,c(2,6,8)])
chart.Correlation( Base_de_datos_3_[,c(2,6,8)],histogram = F,pch=16)

```

Conclusiones
=====================================================================================

Row
-----------------------------------------------------------------------------

**Conclusiones del Trabajo:**

- **Tiempo promedio en redes sociales:** La mitad de los usuarios consume aproximadamente 152 minutos al día en redes sociales y en promedio se consume 151 minutos

- **Impacto de la profesión:** Profesiones como "Cajeros", "Trabajadores manuales" y "Artistas" muestran un uso más elevado de redes sociales, mientras que "Ingenieros" y "Personal de servicio" reportan un menor tiempo invertido.

- **Diferencias por género:** Los hombres pasan ligeramente más tiempo en redes sociales que las mujeres, y la categoría "otros" muestra un consumo notablemente elevado, posiblemente debido a factores sociales específicos de este grupo.

- **Preferencia de plataformas:** TikTok y YouTube dominan en popularidad, señalando una preferencia por contenido de video corto y entretenimiento rápido. Facebook tiene un menor tiempo de consumo.

- **Correlación :** No existe una correlación significativa entre las tres variables, esto sugiere que cambios en la edad, el tiempo total gastado y la tasa de desplazamiento son independientes entre sí en este caso

- **Razones para ver videos:** Las categorías "Memes" y "Life Hacks" son las más populares, motivadas principalmente por entretenimiento y hábito, mientras que la procastinación es la razón menos común para consumir contenido en redes sociales

###.

![](idea.png)