1. Definiciones

2. Análisis de correlación

Simulación de los vectores

set.seed(123)
horas_usodelcelular <- runif(40, min = 1, max = 8)
puntaje_examen <- 100 - horas_usodelcelular * 8 + rnorm(40, mean = 0, sd = 5)

summary(horas_usodelcelular)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.172   3.176   5.084   4.946   6.721   7.960
summary(puntaje_examen)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   36.21   46.29   59.02   60.57   73.32   90.34

Prueba de normalidad

shapiro.test(horas_usodelcelular)
## 
##  Shapiro-Wilk normality test
## 
## data:  horas_usodelcelular
## W = 0.94203, p-value = 0.04051
shapiro.test(puntaje_examen)
## 
##  Shapiro-Wilk normality test
## 
## data:  puntaje_examen
## W = 0.93815, p-value = 0.02997

Prueba de correlación

Ya que ambas variables no siguen una distribución normal, se usa la correlación de Spearman:

cor.test(horas_usodelcelular, puntaje_examen, method = "spearman")
## 
##  Spearman's rank correlation rho
## 
## data:  horas_usodelcelular and puntaje_examen
## S = 20786, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.9499062

Interpretación

  • ¿Existe una relación significativa?: Sí, el valor p es menor a 0.05, por lo tanto, existe una relación significativa.
  • ¿Es positiva o negativa?: Es negativa ya que el coeficiente rho es -0.9499062. Esto significa que a mayor uso del celular, menor es el puntaje del examen.

3. Hipótesis, normalidad y análisis adicional

Hipótesis

  • Hipótesis nula: No existe relación significativa entre las horas de uso del celular y el puntaje en el examen final.
  • Hipótesis alterna: Existe una relación significativa entre las horas de uso del celular y el puntaje en el examen final.

Normalidad (repetición del análisis)

shapiro.test(horas_usodelcelular)
## 
##  Shapiro-Wilk normality test
## 
## data:  horas_usodelcelular
## W = 0.94203, p-value = 0.04051
shapiro.test(puntaje_examen)
## 
##  Shapiro-Wilk normality test
## 
## data:  puntaje_examen
## W = 0.93815, p-value = 0.02997

Ambas variables presentan p < 0.05, por lo tanto, no siguen una distribución normal.

Correlación (confirmación)

cor.test(horas_usodelcelular, puntaje_examen, method = "spearman")
## 
##  Spearman's rank correlation rho
## 
## data:  horas_usodelcelular and puntaje_examen
## S = 20786, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##        rho 
## -0.9499062

Resultado: p < 2.2e-16 y rho = -0.9499062. Relación significativa y negativa.

Simulación y prueba de normalidad para notas

set.seed(456)
notas <- rnorm(30, mean = 70, sd = 10)
shapiro.test(notas)
## 
##  Shapiro-Wilk normality test
## 
## data:  notas
## W = 0.95866, p-value = 0.2862

Resultado esperado: p > 0.05, lo que indica que notas sí sigue una distribución normal.