library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
# 1. CREACIÓN DE BASE DE DATOS
# Tema: Hábitos digitales y bienestar en jóvenes universitarios
set.seed(123) # Para reproducibilidad
# Número de estudiantes
n <- 200
# Variables
ID <- 1:n
Edad <- sample(18:30, n, replace = TRUE)
Sexo <- sample(c("Hombre", "Mujer", "Otro"), n, replace = TRUE, prob = c(0.45, 0.5, 0.05))
Carrera <- sample(c("Psicología", "Sociología", "Economía", "Ciencia Política"), n, replace = TRUE)
Ciudad_nacimiento <- sample(c("Bogotá", "Medellín", "Cali", "Barranquilla", "Bucaramanga"), n, replace = TRUE)
# Horas enteras
Horas_Redes <- sample(0:8, n, replace = TRUE) # 0 a 8 horas
Horas_Estudio <- sample(0:6, n, replace = TRUE) # 0 a 6 horas
Estrés <- round(rnorm(n, mean = 6, sd = 2))
Estrés[Estrés < 1] <- 1
Estrés[Estrés > 10] <- 10
Sueño <- round(rnorm(n, mean = 7, sd = 1.5))
Sueño[Sueño < 3] <- 3
Sueño[Sueño > 10] <- 10
Actividad_Física <- sample(c("Sí", "No"), n, replace = TRUE, prob = c(0.6, 0.4))
Satisfacción_Vida <- round(rnorm(n, mean = 7, sd = 1.8))
Satisfacción_Vida[Satisfacción_Vida < 1] <- 1
Satisfacción_Vida[Satisfacción_Vida > 10] <- 10
# Variable derivada (también redondeada a 2 decimales)
Indice_Equilibrio <- round(Horas_Estudio / (Horas_Redes + 1), 2)
# Crear data frame
datos <- data.frame(
ID,
Edad,
Sexo,
Carrera,
Ciudad_nacimiento,
Horas_Redes,
Horas_Estudio,
Estrés,
Sueño,
Actividad_Física,
Satisfacción_Vida,
Indice_Equilibrio
)
# -------------------------------
# 2. EXPORTAR BASE A CSV
# -------------------------------
write.csv(datos, "habitos_digitales.csv", row.names = FALSE)
df <- datos
# Vista previa
head(datos)
## ID Edad Sexo Carrera Ciudad_nacimiento Horas_Redes Horas_Estudio
## 1 1 20 Hombre Psicología Medellín 5 5
## 2 2 20 Mujer Ciencia Política Cali 4 6
## 3 3 27 Mujer Sociología Medellín 8 2
## 4 4 19 Mujer Psicología Cali 1 5
## 5 5 23 Hombre Ciencia Política Cali 2 6
## 6 6 28 Hombre Ciencia Política Bogotá 2 4
## Estrés Sueño Actividad_Física Satisfacción_Vida Indice_Equilibrio
## 1 8 7 Sí 9 0.83
## 2 2 9 No 7 1.20
## 3 5 7 Sí 7 0.22
## 4 7 8 Sí 4 2.50
## 5 6 6 Sí 4 2.00
## 6 6 6 Sí 8 1.33
# Hipótesis:
# H0: μ = 7 (duermen 7 horas en promedio)
# H1: μ < 7 (duermen menos de 7 horas)
# Prueba: t de una muestra
t1 <- t.test(df$Sueño, mu = 7, alternative = "less")
t1
##
## One Sample t-test
##
## data: df$Sueño
## t = -0.54115, df = 199, p-value = 0.2945
## alternative hypothesis: true mean is less than 7
## 95 percent confidence interval:
## -Inf 7.123228
## sample estimates:
## mean of x
## 6.94
Interpretación
El análisis de la variable Sueño muestra un promedio de 6.94 horas diarias, un valor muy cercano a lo recomendado de 7 horas. El resultado del test t indica que no hay evidencia estadísticamente significativa para afirmar que los estudiantes duermen menos de 7 horas en promedio.
Esto sugiere que, en general, los jóvenes universitarios mantienen hábitos de sueño relativamente adecuados, a pesar del uso frecuente de redes sociales y de las exigencias académicas. Aunque el hecho de que el promedio esté apenas por debajo del umbral saludable, puede decirnos que hay una tendencia a la ligera privación de sueño, posiblemente asociada a rutinas digitales extendidas, trabajo académico nocturno o dificultades a la hora de desconectarse de estas.
# Hipótesis:
# H0: μ = 6.5
# H1: μ ≠ 6.5
# Prueba: t de una muestra (bilateral)
t2 <- t.test(df$Satisfacción_Vida, mu = 6.5)
t2
##
## One Sample t-test
##
## data: df$Satisfacción_Vida
## t = 3.9564, df = 199, p-value = 0.0001058
## alternative hypothesis: true mean is not equal to 6.5
## 95 percent confidence interval:
## 6.748284 7.241716
## sample estimates:
## mean of x
## 6.995
Interpretación
Los resultados nos muestran que el promedio de satisfacción con la vida es de 6.99, este resultado fue significativamente mayor que el estándar poblacional de 6.5. Esto nos indica que los estudiantes reportan un mayor bienestar que la media general.
Esto en términos sociales nos dice que, aunque esté presente la presión académica y el uso de redes, los jóvenes mantienen una percepción positiva de su vida. Sin embargo, este bienestar puede coexistir con niveles altos de estrés, lo que destaca la importancia de fomentar un equilibrio entre vida académica y autocuidado.
# Hipótesis:
# H0: μ_Activos ≥ μ_NoActivos
# H1: μ_Activos < μ_NoActivos
# Prueba: t de dos muestras independientes (una cola)
t3 <- t.test(Estrés ~ Actividad_Física, data = df, alternative = "less")
t3
##
## Welch Two Sample t-test
##
## data: Estrés by Actividad_Física
## t = -1.1604, df = 164.74, p-value = 0.1238
## alternative hypothesis: true difference in means between group No and group Sí is less than 0
## 95 percent confidence interval:
## -Inf 0.1431778
## sample estimates:
## mean in group No mean in group Sí
## 5.814815 6.151261
Interpretación
El promedio de estrés fue similar entre quienes realizan actividad física y los que no, ya que podemos observar que los niveles de estrés de las personas que realizan actividad física fue de 6.15 y el resultado de quienes no es de 5.81, lo que nos demuestra que no hay diferencia significativa.
En términos del problema social, esto indica que la práctica de actividad física no se asocia directamente con menores niveles de estrés en los estudiantes. Es posible que otros factores como la carga académica o los hábitos digitales influyan más en los niveles de estrés.
# Hipótesis:
# H0: μ_d = 0 (no hay cambio)
# H1: μ_d > 0 (mejora después de vacaciones)
# Prueba: t pareada
# Crear variable (después de vacaciones)
set.seed(123)
antes <- df$Satisfacción_Vida
después <- antes + rnorm(length(antes), mean = 0.5, sd = 0.7)
t5 <- t.test(antes, después, paired = TRUE, alternative = "greater")
t5
##
## Paired t-test
##
## data: antes and después
## t = -10.582, df = 199, p-value = 1
## alternative hypothesis: true mean difference is greater than 0
## 95 percent confidence interval:
## -0.5711482 Inf
## sample estimates:
## mean difference
## -0.4940007
Interpretación
La prueba t pareada muestra una diferencia significativa entre las mediciones de satisfacción antes y después de las vacaciones. El promedio después del descanso fue mayor en aproximadamente 0.49 puntos, lo que indica que el bienestar personal aumenta después de las vacaciones.
Lo anterior sugiere que el descanso y la desconexión de las rutinas académicas y digitales contribuyen positivamente al bienestar de los estudiantes universitarios. Este resultado resalta la importancia de los espacios de recuperación emocional y del equilibrio entre productividad y autocuidado en la comunidad universitaria.
base.datos <- read.csv("C:/Users/USUARIO/OneDrive/Documentos/habitos_digitales.csv")
head(base.datos) Ejercicios:
¿Existe relación entre el sexo y la práctica de actividad física?
Hipotesis nula: No existe relacion entre el sexo y la practica de actividad fisica.
Hipotesis alternativa: Existe relacion entre el sexo y la pratica de actividad fisica.
Se utiliza la prueba chi - cuadrado de independencia debido a que el objetivo de la pregunta es encontrar si existe una relacion de asociacion entre dos variables categoricas.
tabla1 <- table(base.datos$Sexo, base.datos$Actividad_Física)
print(tabla1)
##
## No Sí
## Hombre 31 42
## Mujer 40 71
## Otro 10 6
resultado <- chisq.test(tabla1)
print(resultado)
##
## Pearson's Chi-squared test
##
## data: tabla1
## X-squared = 4.2486, df = 2, p-value = 0.1195
Segun los resultados obtenidos por la prueba de chi-cuadrado, podemos concluir que no existe relacion entre el sexo y la practica de actividad fisica, esto lo podemos comprobar gracias a que (X^2(2) = 4.2486, p > 0.1195), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, esto es coherente considerando que el sexo no es uno de los factores y diferenciadores sociales clave al momento de practicar una actividad fisica. Ya que se han realizado diferentes movimientos que promueven la actividad fisica en ambos sexos y facilitan el acceso para gran parte de la poblacion. A pesar de esto, es importante recalcar que las mujeres presentan un mayor porcentaje que los hombres en la encuesta realizada, a pesar de que esta diferencia no sea significativa.
Hipotesis nula: La proporción de estudiantes con alto estrés (≥8) no difiere entre carreras
Hipotesis alternativa: La proporción de estudiantes con alto estrés (≥8) difiere entre carreras
Se utilizara una prueba de chi-cuadrado de independencia ya que esta permite llevar a cabo una comparacion sobre la proporcion de grupos de variables categoricas.
base.datos$Carrera <- as.factor(base.datos$Carrera)
base.datos$Estrés_Nivel <- as.factor(ifelse(base.datos$Estrés >= 8, "Alto", "Bajo"))
tabla2 <- xtabs(~ Carrera + Estrés_Nivel, data = base.datos)
print(tabla2)
## Estrés_Nivel
## Carrera Alto Bajo
## Ciencia Política 18 42
## Economía 13 40
## Psicología 14 24
## Sociología 8 41
library(lsr)
## Warning: package 'lsr' was built under R version 4.4.3
resultado_asociacion <- associationTest(formula = ~ Carrera + Estrés_Nivel, data = base.datos)
print(resultado_asociacion)
##
## Chi-square test of categorical association
##
## Variables: Carrera, Estrés_Nivel
##
## Hypotheses:
## null: variables are independent of one another
## alternative: some contingency exists between variables
##
## Observed contingency table:
## Estrés_Nivel
## Carrera Alto Bajo
## Ciencia Política 18 42
## Economía 13 40
## Psicología 14 24
## Sociología 8 41
##
## Expected contingency table under the null hypothesis:
## Estrés_Nivel
## Carrera Alto Bajo
## Ciencia Política 15.9 44.1
## Economía 14.0 39.0
## Psicología 10.1 27.9
## Sociología 13.0 36.0
##
## Test results:
## X-squared statistic: 5.174
## degrees of freedom: 3
## p-value: 0.16
##
## Other information:
## estimated effect size (Cramer's v): 0.161
Segun los resultados conseguidos por la prueba de chi-cuadrado, podemos concluir que la proporción de estudiantes con alto estrés (≥8) no difiere entre carreras, esto lo podemos comprobar gracias a que (X^2(3) = 5.174, p > 0.16), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, esto demuestra que la carga de estres superior a 8 es similar en la mayoria de las carreras y no presenta una diferencia significativa. A su vez, se presenta un efecto Cramér’s V de 0,161 que refuerza la idea de una existe una fuerza asociacion debil.
Hipotesis nula: No Existe asociación entre el uso intensivo de redes y el sueño insuficiente
Hipotesis alternativa: Existe asociación entre el uso intensivo de redes y el sueño insuficiente
Prueba chi-cuadrado de independencia, ya que se comprobara la asociacion entre dos variables categoricas.
base.datos$UsoRedes_Intensivo <- as.factor(ifelse(base.datos$Horas_Redes >= 5, "Intensivo", "No intensivo"))
base.datos$Sueño_Insuficiente <- as.factor(ifelse(base.datos$Sueño < 7, "Insuficiente", "Suficiente"))
tabla3 <- xtabs(~ UsoRedes_Intensivo + Sueño_Insuficiente, data = base.datos)
print(tabla3)
## Sueño_Insuficiente
## UsoRedes_Intensivo Insuficiente Suficiente
## Intensivo 36 57
## No intensivo 47 60
library(lsr)
resultado_asociacion3 <- associationTest(formula = ~ UsoRedes_Intensivo + Sueño_Insuficiente,
data = base.datos)
Gracias a los resultados conseguidos por la prueba de chi-cuadrado, podemos concluir que no Existe asociación entre el uso intensivo de redes y el sueño insuficiente, esto lo podemos comprobar gracias a que (X^2(1) = 0.363, p > 0.547), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, se presenta un efecto Cramér’s V de 0,043 que nos indica la presencia de una asociacion considerablemente debil.
Hipotesis nula: las personas físicamente activas no reportan mayor satisfacción con la vida
Hipotesis alternativa:las personas físicamente activas reportan mayor satisfacción con la vida
Se utiliza una prueba chi-cuadrado de independencia debido a que las observaciones son considerables y por que se intenta comprobar la asociacion entre dos variables categoricas.
base.datos$Actividad_Física <- as.factor(base.datos$Actividad_Física)
base.datos$Satisfacción <- as.factor(ifelse(base.datos$Satisfacción_Vida >= 7, "Alta", "Baja"))
tabla4 <- xtabs(~ Actividad_Física + Satisfacción, data = base.datos)
print(tabla4)
## Satisfacción
## Actividad_Física Alta Baja
## No 52 29
## Sí 70 49
library(lsr)
library(lsr)
resultado_asociacion4 <- associationTest(formula = ~ Actividad_Física + Satisfacción,
data = base.datos)
print(resultado_asociacion4)
##
## Chi-square test of categorical association
##
## Variables: Actividad_Física, Satisfacción
##
## Hypotheses:
## null: variables are independent of one another
## alternative: some contingency exists between variables
##
## Observed contingency table:
## Satisfacción
## Actividad_Física Alta Baja
## No 52 29
## Sí 70 49
##
## Expected contingency table under the null hypothesis:
## Satisfacción
## Actividad_Física Alta Baja
## No 49.4 31.6
## Sí 72.6 46.4
##
## Test results:
## X-squared statistic: 0.381
## degrees of freedom: 1
## p-value: 0.537
##
## Other information:
## estimated effect size (Cramer's v): 0.044
## Yates' continuity correction has been applied
Debido a los resultados obtenidos por la prueba de chi-cuadrado, podemos concluir que las personas físicamente activas no reportan mayor satisfacción con la vida, esto lo podemos comprobar gracias a que (X^2(1) = 0.381, p > 0.537), en donde el p value es mayor a 0.05 y por ende, no se rechaza la hipotesis nula. A su vez, se presenta un efecto Cramér’s V de 0,044 que nos indica la presencia de una asociacion considerablemente debil.
Hipotesis nula: No hay relacion entre estres y satisfaccion
Hipotesis alternativa: Hay relacion entre estres y satisfaccion
Se utiliza una prueba chi-cuadrado de independencia debido a que los contenidos son considerablemente altos y por que buscas comprobar la asociacion entre dos variables categoricas.
base.datos$Estrés_Nivel <- as.factor(ifelse(base.datos$Estrés >= 8, "Alto", "Bajo"))
base.datos$Satisfacción <- as.factor(ifelse(base.datos$Satisfacción_Vida >= 7, "Alta", "Baja"))
library(lsr)
resultado_asociacion <- associationTest(formula = ~ Estrés_Nivel + Satisfacción, data = base.datos)
print(resultado_asociacion)
##
## Chi-square test of categorical association
##
## Variables: Estrés_Nivel, Satisfacción
##
## Hypotheses:
## null: variables are independent of one another
## alternative: some contingency exists between variables
##
## Observed contingency table:
## Satisfacción
## Estrés_Nivel Alta Baja
## Alto 38 15
## Bajo 84 63
##
## Expected contingency table under the null hypothesis:
## Satisfacción
## Estrés_Nivel Alta Baja
## Alto 32.3 20.7
## Bajo 89.7 57.3
##
## Test results:
## X-squared statistic: 2.884
## degrees of freedom: 1
## p-value: 0.089
##
## Other information:
## estimated effect size (Cramer's v): 0.12
## Yates' continuity correction has been applied
Considerando lo obtenido por los resultados, es posible concluir que no existe relacion entre el estres y la sastisfaccion, esto es debido a que (X^2(1) = 2.884, p > 0.089) Lo que significa que no se rechaza la hipotesis nula, gracias a que el p value es mayor a 0.05, lo que indica que los datos no son significativos. Ademas, los resultados del test de cramer’s v sugieren que la fuerza de la asociacion es extremadamente debil. Lo que muestra que no necesariamente un bajo nivel de estres es una razon a favor de tener una satisfaccion con la vida, lo que puede señalar la presencia de otros factores al momento de determinar que una persona se considere satisfecha con su vida. A su vez, a pesar de los resultados, se puede encontrar que el 89.7 % que tiene un estres bajo, considera una satisfaccion con su vida, esto se debe a que esos resultados no son significativos.