library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union

1. Creación de la base de datos

# 1. CREACIÓN DE BASE DE DATOS
# Tema: Hábitos digitales y bienestar en jóvenes universitarios

set.seed(123)  # Para reproducibilidad

# Número de estudiantes
n <- 200

# Variables
ID <- 1:n
Edad <- sample(18:30, n, replace = TRUE)
Sexo <- sample(c("Hombre", "Mujer", "Otro"), n, replace = TRUE, prob = c(0.45, 0.5, 0.05))
Carrera <- sample(c("Psicología", "Sociología", "Economía", "Ciencia Política"), n, replace = TRUE)
Ciudad_nacimiento <- sample(c("Bogotá", "Medellín", "Cali", "Barranquilla", "Bucaramanga"), n, replace = TRUE)

# Horas enteras
Horas_Redes <- sample(0:8, n, replace = TRUE)      # 0 a 8 horas
Horas_Estudio <- sample(0:6, n, replace = TRUE)    # 0 a 6 horas
Estrés <- round(rnorm(n, mean = 6, sd = 2))
Estrés[Estrés < 1] <- 1
Estrés[Estrés > 10] <- 10
Sueño <- round(rnorm(n, mean = 7, sd = 1.5))
Sueño[Sueño < 3] <- 3
Sueño[Sueño > 10] <- 10
Actividad_Física <- sample(c("Sí", "No"), n, replace = TRUE, prob = c(0.6, 0.4))
Satisfacción_Vida <- round(rnorm(n, mean = 7, sd = 1.8))
Satisfacción_Vida[Satisfacción_Vida < 1] <- 1
Satisfacción_Vida[Satisfacción_Vida > 10] <- 10

# Variable derivada (también redondeada a 2 decimales)
Indice_Equilibrio <- round(Horas_Estudio / (Horas_Redes + 1), 2)

# Crear data frame
datos <- data.frame(
  ID,
  Edad,
  Sexo,
  Carrera,
  Ciudad_nacimiento,
  Horas_Redes,
  Horas_Estudio,
  Estrés,
  Sueño,
  Actividad_Física,
  Satisfacción_Vida,
  Indice_Equilibrio
)

# -------------------------------
# 2. EXPORTAR BASE A CSV
# -------------------------------
write.csv(datos, "habitos_digitales.csv", row.names = FALSE)
df <- datos

# Vista previa
head(datos)
##   ID Edad   Sexo          Carrera Ciudad_nacimiento Horas_Redes Horas_Estudio
## 1  1   20 Hombre       Psicología          Medellín           5             5
## 2  2   20  Mujer Ciencia Política              Cali           4             6
## 3  3   27  Mujer       Sociología          Medellín           8             2
## 4  4   19  Mujer       Psicología              Cali           1             5
## 5  5   23 Hombre Ciencia Política              Cali           2             6
## 6  6   28 Hombre Ciencia Política            Bogotá           2             4
##   Estrés Sueño Actividad_Física Satisfacción_Vida Indice_Equilibrio
## 1      8     7               Sí                 9              0.83
## 2      2     9               No                 7              1.20
## 3      5     7               Sí                 7              0.22
## 4      7     8               Sí                 4              2.50
## 5      6     6               Sí                 4              2.00
## 6      6     6               Sí                 8              1.33

Parte 2. Pruebas de Hipótesis con Variables Continuas

1. Horas de sueño: ¿Las personas duermen menos de 7 horas en promedio?

# Hipótesis:
# H0: μ = 7  (duermen 7 horas en promedio)
# H1: μ < 7  (duermen menos de 7 horas)
# Prueba: t de una muestra 

t1 <- t.test(df$Sueño, mu = 7, alternative = "less")

t1
## 
##  One Sample t-test
## 
## data:  df$Sueño
## t = -0.54115, df = 199, p-value = 0.2945
## alternative hypothesis: true mean is less than 7
## 95 percent confidence interval:
##      -Inf 7.123228
## sample estimates:
## mean of x 
##      6.94

Interpretación

El análisis de la variable Sueño muestra un promedio de 6.94 horas diarias, un valor muy cercano a lo recomendado de 7 horas. El resultado del test t indica que no hay evidencia estadísticamente significativa para afirmar que los estudiantes duermen menos de 7 horas en promedio.

Esto sugiere que, en general, los jóvenes universitarios mantienen hábitos de sueño relativamente adecuados, a pesar del uso frecuente de redes sociales y de las exigencias académicas. Aunque el hecho de que el promedio esté apenas por debajo del umbral saludable, puede decirnos que hay una tendencia a la ligera privación de sueño, posiblemente asociada a rutinas digitales extendidas, trabajo académico nocturno o dificultades a la hora de desconectarse de estas.

2. Satisfacción con la vida: ¿El promedio de satisfacción con la vida difiere del estándar poblacional de 6.5?

# Hipótesis:
# H0: μ = 6.5
# H1: μ ≠ 6.5
# Prueba: t de una muestra (bilateral)

t2 <- t.test(df$Satisfacción_Vida, mu = 6.5)

t2
## 
##  One Sample t-test
## 
## data:  df$Satisfacción_Vida
## t = 3.9564, df = 199, p-value = 0.0001058
## alternative hypothesis: true mean is not equal to 6.5
## 95 percent confidence interval:
##  6.748284 7.241716
## sample estimates:
## mean of x 
##     6.995

Interpretación

Los resultados nos muestran que el promedio de satisfacción con la vida es de 6.99, este resultado fue significativamente mayor que el estándar poblacional de 6.5. Esto nos indica que los estudiantes reportan un mayor bienestar que la media general.

Esto en términos sociales nos dice que, aunque esté presente la presión académica y el uso de redes, los jóvenes mantienen una percepción positiva de su vida. Sin embargo, este bienestar puede coexistir con niveles altos de estrés, lo que destaca la importancia de fomentar un equilibrio entre vida académica y autocuidado.

3. Estrés y actividad física: ¿Las personas que hacen actividad física tienen niveles de estrés más bajos que quienes no la practican?

# Hipótesis:
# H0: μ_Activos ≥ μ_NoActivos
# H1: μ_Activos < μ_NoActivos
# Prueba: t de dos muestras independientes (una cola)

t3 <- t.test(Estrés ~ Actividad_Física, data = df, alternative = "less")

t3
## 
##  Welch Two Sample t-test
## 
## data:  Estrés by Actividad_Física
## t = -1.1604, df = 164.74, p-value = 0.1238
## alternative hypothesis: true difference in means between group No and group Sí is less than 0
## 95 percent confidence interval:
##       -Inf 0.1431778
## sample estimates:
## mean in group No mean in group Sí 
##         5.814815         6.151261

Interpretación

El promedio de estrés fue similar entre quienes realizan actividad física y los que no, ya que podemos observar que los niveles de estrés de las personas que realizan actividad física fue de 6.15 y el resultado de quienes no es de 5.81, lo que nos demuestra que no hay diferencia significativa.

En términos del problema social, esto indica que la práctica de actividad física no se asocia directamente con menores niveles de estrés en los estudiantes. Es posible que otros factores como la carga académica o los hábitos digitales influyan más en los niveles de estrés.

4. Horas de estudio según carrera (Hay diferencias en las horas de estudio entre estudiantes de Ciencias Sociales y Ciencias Económicas)

# Hipótesis:
# H0: μ_Sociales = μ_Económicas
# H1: μ_Sociales ≠ μ_Económicas
# Prueba: t de dos muestras independientes (bilateral)

# Crear subconjuntos
sociales <- df %>% filter(Carrera %in% c("Psicología", "Sociología", "Ciencia Política"))
economicas <- df %>% filter(Carrera == "Economía")

t4 <- t.test(sociales$Horas_Estudio, economicas$Horas_Estudio)

t4
## 
##  Welch Two Sample t-test
## 
## data:  sociales$Horas_Estudio and economicas$Horas_Estudio
## t = 0.0089319, df = 92.101, p-value = 0.9929
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -0.6534679  0.6593722
## sample estimates:
## mean of x mean of y 
##  3.455782  3.452830

Interpretación

El promedio de horas de estudio fue casi igual entre los estudiantes de ciencias sociales (3.46 h) y los de ciencias económicas (3.45 h), por lo que no se encuentra diferencia significativa.

Esto indica que la dedicación académica es similar entre ambas áreas, lo que sugiere una carga de estudio equilibrada. Las diferencias en bienestar o estrés entre carreras podrían deberse más a factores personales o contextuales, como la gestión del tiempo o el uso de redes, que al número de horas de estudio registradas.

5. Cambio en bienestar después de vacaciones: (Simula dos mediciones de satisfacción (antes y después de vacaciones). ¿Mejora significativamente el bienestar?)

# Hipótesis:
# H0: μ_d = 0 (no hay cambio)
# H1: μ_d > 0 (mejora después de vacaciones)
# Prueba: t pareada

# Crear variable (después de vacaciones)
set.seed(123)
antes <- df$Satisfacción_Vida
después <- antes + rnorm(length(antes), mean = 0.5, sd = 0.7)

t5 <- t.test(antes, después, paired = TRUE, alternative = "greater")


t5
## 
##  Paired t-test
## 
## data:  antes and después
## t = -10.582, df = 199, p-value = 1
## alternative hypothesis: true mean difference is greater than 0
## 95 percent confidence interval:
##  -0.5711482        Inf
## sample estimates:
## mean difference 
##      -0.4940007

Interpretación

La prueba t pareada muestra una diferencia significativa entre las mediciones de satisfacción antes y después de las vacaciones. El promedio después del descanso fue mayor en aproximadamente 0.49 puntos, lo que indica que el bienestar personal aumenta después de las vacaciones.

Lo anterior sugiere que el descanso y la desconexión de las rutinas académicas y digitales contribuyen positivamente al bienestar de los estudiantes universitarios. Este resultado resalta la importancia de los espacios de recuperación emocional y del equilibrio entre productividad y autocuidado en la comunidad universitaria.

base.datos <- read.csv("C:/Users/USUARIO/OneDrive/Documentos/habitos_digitales.csv")

head(base.datos) Ejercicios:

  1. Sexo y actividad física:

¿Existe relación entre el sexo y la práctica de actividad física?

Hipotesis nula: No existe relacion entre el sexo y la practica de actividad fisica.

Hipotesis alternativa: Existe relacion entre el sexo y la pratica de actividad fisica.

Se utiliza la prueba chi - cuadrado de independencia debido a que el objetivo de la pregunta es encontrar si existe una relacion de asociacion entre dos variables categoricas.

tabla1 <- table(base.datos$Sexo, base.datos$Actividad_Física)
print(tabla1)
##         
##          No Sí
##   Hombre 31 42
##   Mujer  40 71
##   Otro   10  6
resultado <- chisq.test(tabla1)
print(resultado)
## 
##  Pearson's Chi-squared test
## 
## data:  tabla1
## X-squared = 4.2486, df = 2, p-value = 0.1195

Segun los resultados obtenidos por la prueba de chi-cuadrado, podemos concluir que no existe relacion entre el sexo y la practica de actividad fisica, esto lo podemos comprobar gracias a que (X^2(2) = 4.2486, p > 0.1195), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, esto es coherente considerando que el sexo no es uno de los factores y diferenciadores sociales clave al momento de practicar una actividad fisica. Ya que se han realizado diferentes movimientos que promueven la actividad fisica en ambos sexos y facilitan el acceso para gran parte de la poblacion. A pesar de esto, es importante recalcar que las mujeres presentan un mayor porcentaje que los hombres en la encuesta realizada, a pesar de que esta diferencia no sea significativa.

  1. Carrera y estrés alto:

Hipotesis nula: La proporción de estudiantes con alto estrés (≥8) no difiere entre carreras

Hipotesis alternativa: La proporción de estudiantes con alto estrés (≥8) difiere entre carreras

Se utilizara una prueba de chi-cuadrado de independencia ya que esta permite llevar a cabo una comparacion sobre la proporcion de grupos de variables categoricas.

base.datos$Carrera <- as.factor(base.datos$Carrera)
base.datos$Estrés_Nivel <- as.factor(ifelse(base.datos$Estrés >= 8, "Alto", "Bajo"))


tabla2 <- xtabs(~ Carrera + Estrés_Nivel, data = base.datos)
print(tabla2)
##                   Estrés_Nivel
## Carrera            Alto Bajo
##   Ciencia Política   18   42
##   Economía           13   40
##   Psicología         14   24
##   Sociología          8   41
library(lsr)
## Warning: package 'lsr' was built under R version 4.4.3
resultado_asociacion <- associationTest(formula = ~ Carrera + Estrés_Nivel, data = base.datos)
print(resultado_asociacion)
## 
##      Chi-square test of categorical association
## 
## Variables:   Carrera, Estrés_Nivel 
## 
## Hypotheses: 
##    null:        variables are independent of one another
##    alternative: some contingency exists between variables
## 
## Observed contingency table:
##                   Estrés_Nivel
## Carrera            Alto Bajo
##   Ciencia Política   18   42
##   Economía           13   40
##   Psicología         14   24
##   Sociología          8   41
## 
## Expected contingency table under the null hypothesis:
##                   Estrés_Nivel
## Carrera            Alto Bajo
##   Ciencia Política 15.9 44.1
##   Economía         14.0 39.0
##   Psicología       10.1 27.9
##   Sociología       13.0 36.0
## 
## Test results: 
##    X-squared statistic:  5.174 
##    degrees of freedom:  3 
##    p-value:  0.16 
## 
## Other information: 
##    estimated effect size (Cramer's v):  0.161

Segun los resultados conseguidos por la prueba de chi-cuadrado, podemos concluir que la proporción de estudiantes con alto estrés (≥8) no difiere entre carreras, esto lo podemos comprobar gracias a que (X^2(3) = 5.174, p > 0.16), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, esto demuestra que la carga de estres superior a 8 es similar en la mayoria de las carreras y no presenta una diferencia significativa. A su vez, se presenta un efecto Cramér’s V de 0,161 que refuerza la idea de una existe una fuerza asociacion debil.

  1. Uso intensivo de redes (≥5h/día) y sueño insuficiente (<7h):

Hipotesis nula: No Existe asociación entre el uso intensivo de redes y el sueño insuficiente

Hipotesis alternativa: Existe asociación entre el uso intensivo de redes y el sueño insuficiente

Prueba chi-cuadrado de independencia, ya que se comprobara la asociacion entre dos variables categoricas.

base.datos$UsoRedes_Intensivo <- as.factor(ifelse(base.datos$Horas_Redes >= 5, "Intensivo", "No intensivo"))
base.datos$Sueño_Insuficiente <- as.factor(ifelse(base.datos$Sueño < 7, "Insuficiente", "Suficiente"))

tabla3 <- xtabs(~ UsoRedes_Intensivo + Sueño_Insuficiente, data = base.datos)
print(tabla3)
##                   Sueño_Insuficiente
## UsoRedes_Intensivo Insuficiente Suficiente
##       Intensivo              36         57
##       No intensivo           47         60
library(lsr)

resultado_asociacion3 <- associationTest(formula = ~ UsoRedes_Intensivo + Sueño_Insuficiente, 
                                         data = base.datos)

Gracias a los resultados conseguidos por la prueba de chi-cuadrado, podemos concluir que no Existe asociación entre el uso intensivo de redes y el sueño insuficiente, esto lo podemos comprobar gracias a que (X^2(1) = 0.363, p > 0.547), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, se presenta un efecto Cramér’s V de 0,043 que nos indica la presencia de una asociacion considerablemente debil.

  1. Satisfacción y actividad física:

Hipotesis nula: las personas físicamente activas no reportan mayor satisfacción con la vida

Hipotesis alternativa:las personas físicamente activas reportan mayor satisfacción con la vida

Se utiliza una prueba chi-cuadrado de independencia debido a que las observaciones son considerables y por que se intenta comprobar la asociacion entre dos variables categoricas.

base.datos$Actividad_Física <- as.factor(base.datos$Actividad_Física)
base.datos$Satisfacción <- as.factor(ifelse(base.datos$Satisfacción_Vida >= 7, "Alta", "Baja"))


tabla4 <- xtabs(~ Actividad_Física + Satisfacción, data = base.datos)
print(tabla4)
##                 Satisfacción
## Actividad_Física Alta Baja
##               No   52   29
##               Sí   70   49
library(lsr)

library(lsr)

resultado_asociacion4 <- associationTest(formula = ~ Actividad_Física + Satisfacción,
                                         data = base.datos)
print(resultado_asociacion4)
## 
##      Chi-square test of categorical association
## 
## Variables:   Actividad_Física, Satisfacción 
## 
## Hypotheses: 
##    null:        variables are independent of one another
##    alternative: some contingency exists between variables
## 
## Observed contingency table:
##                 Satisfacción
## Actividad_Física Alta Baja
##               No   52   29
##               Sí   70   49
## 
## Expected contingency table under the null hypothesis:
##                 Satisfacción
## Actividad_Física Alta Baja
##               No 49.4 31.6
##               Sí 72.6 46.4
## 
## Test results: 
##    X-squared statistic:  0.381 
##    degrees of freedom:  1 
##    p-value:  0.537 
## 
## Other information: 
##    estimated effect size (Cramer's v):  0.044 
##    Yates' continuity correction has been applied

Debido a los resultados obtenidos por la prueba de chi-cuadrado, podemos concluir que las personas físicamente activas no reportan mayor satisfacción con la vida, esto lo podemos comprobar gracias a que (X^2(1) = 0.381, p > 0.537), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, se presenta un efecto Cramér’s V de 0,044 que nos indica la presencia de una asociacion considerablemente debil.

  1. Estrés y satisfacción:

Hipotesis nula: No hay relacion entre estres y satisfaccion

Hipotesis alternativa: Hay relacion entre estres y satisfaccion

Se utiliza una prueba chi-cuadrado de independencia debido a que los contenidos son considerablemente altos y por que buscas comprobar la asociacion entre dos variables categoricas.

base.datos$Estrés_Nivel <- as.factor(ifelse(base.datos$Estrés >= 8, "Alto", "Bajo"))
base.datos$Satisfacción <- as.factor(ifelse(base.datos$Satisfacción_Vida >= 7, "Alta", "Baja"))



library(lsr)


resultado_asociacion <- associationTest(formula = ~ Estrés_Nivel + Satisfacción, data = base.datos)


print(resultado_asociacion)
## 
##      Chi-square test of categorical association
## 
## Variables:   Estrés_Nivel, Satisfacción 
## 
## Hypotheses: 
##    null:        variables are independent of one another
##    alternative: some contingency exists between variables
## 
## Observed contingency table:
##             Satisfacción
## Estrés_Nivel Alta Baja
##         Alto   38   15
##         Bajo   84   63
## 
## Expected contingency table under the null hypothesis:
##             Satisfacción
## Estrés_Nivel Alta Baja
##         Alto 32.3 20.7
##         Bajo 89.7 57.3
## 
## Test results: 
##    X-squared statistic:  2.884 
##    degrees of freedom:  1 
##    p-value:  0.089 
## 
## Other information: 
##    estimated effect size (Cramer's v):  0.12 
##    Yates' continuity correction has been applied

Considerando lo obtenido por los resultados, es posible concluir que no existe relacion entre el estres y la sastisfaccion, esto es debido a que (X^2(1) = 2.884, p > 0.089) Lo que significa que no se rechaza la hipotesis nula, gracias a que el p value es mayor a 0.05, lo que indica que los datos no son significativos. Ademas, los resultados del test de cramer’s v sugieren que la fuerza de la asociacion es extremadamente debil. Lo que muestra que no necesariamente un bajo nivel de estres es una razon a favor de tener una satisfaccion con la vida, lo que puede señalar la presencia de otros factores al momento de determinar que una persona se considere satisfecha con su vida. A su vez, a pesar de los resultados, se puede encontrar que el 89.7 % que tiene un estres bajo, considera una satisfaccion con su vida, esto se debe a que esos resultados no son significativos.