Ejercicio: Una institución desea saber si existe relación entre las horas de estudio semanales y el puntaje obtenido en un examen final por un grupo de estudiantes. Realizar
• Simular o carga dos vectores llamados horas_usodelcelular y puntaje_examen, con al menos 40 observaciones cada uno.
horas_usocelular<-sample(1:10,40,replace=TRUE)
puntaje_examen<-round(runif(40,min=50,max=100)-horas_usocelular*runif(40,min=1,max=5))
print(horas_usocelular)
## [1] 7 8 4 3 7 10 1 5 1 1 8 5 1 2 3 5 4 9 10 2 4 2 1 8 4
## [26] 7 7 2 5 6 8 9 4 8 3 9 4 3 6 6
print(puntaje_examen)
## [1] 63 71 72 48 77 18 56 56 60 70 54 73 47 83 74 57 39 65 50 88 49 56 90 64 57
## [26] 86 58 48 49 42 30 56 88 26 79 20 72 88 70 79
• Verificar si ambas variables se distribuyen normalmente con shapiro.test().
shapiro.test(horas_usocelular)
##
## Shapiro-Wilk normality test
##
## data: horas_usocelular
## W = 0.94125, p-value = 0.03812
shapiro.test(puntaje_examen)
##
## Shapiro-Wilk normality test
##
## data: puntaje_examen
## W = 0.96151, p-value = 0.1885
print(paste("si el valor-p resultante es mayor que 0.05 no se rechaza la hipotesis nula de normalidad, lo que indica que la variable sigue una distribución normal"))
## [1] "si el valor-p resultante es mayor que 0.05 no se rechaza la hipotesis nula de normalidad, lo que indica que la variable sigue una distribución normal"
• Según el resultado de normalidad, elige la prueba de correlación adecuada:
o cor.test(…, method = “pearson”) si hay normalidad. o cor.test(…, method = “spearman”) si no hay normalidad.
cor.test(horas_usocelular,puntaje_examen,method = "pearson")
##
## Pearson's product-moment correlation
##
## data: horas_usocelular and puntaje_examen
## t = -2.6438, df = 38, p-value = 0.01185
## alternative hypothesis: true correlation is not equal to 0
## 95 percent confidence interval:
## -0.62849968 -0.09421986
## sample estimates:
## cor
## -0.3941605
• Interpretar: o ¿Existe una relación significativa entre horas de estudio y puntaje? o ¿La relación es positiva o negativa?
print(paste0("si existe una relacion significativa,ya que las variables tienen una distribucion normal, el valor-p es menor 0.05 . y la relacion es negativa de -0.6199647" ))
## [1] "si existe una relacion significativa,ya que las variables tienen una distribucion normal, el valor-p es menor 0.05 . y la relacion es negativa de -0.6199647"
print(paste("Hipotesis Nula (H_0): No existe una relacion significativa entre las horas de uso del celular y el puntaje del examen. "))
## [1] "Hipotesis Nula (H_0): No existe una relacion significativa entre las horas de uso del celular y el puntaje del examen. "
print(paste("hipotesis alterna(H_A): Existe una relacion significativa entre las horas de uso del celular y el puntaje del examen. "))
## [1] "hipotesis alterna(H_A): Existe una relacion significativa entre las horas de uso del celular y el puntaje del examen. "
• Verifica la normalidad de los datos:
shapiro.test(horas_usocelular)
##
## Shapiro-Wilk normality test
##
## data: horas_usocelular
## W = 0.94125, p-value = 0.03812
shapiro.test(puntaje_examen)
##
## Shapiro-Wilk normality test
##
## data: puntaje_examen
## W = 0.96151, p-value = 0.1885
• Simula o carga un conjunto de datos llamado notas (al menos 30 observaciones).
notas<-round(runif(30, min=50, max=100))
print(notas)
## [1] 81 95 93 54 71 64 85 74 90 80 81 71 80 89 79 80 87 95 78 87 72 56 86 50 82
## [26] 70 70 52 87 75
• Usa la función shapiro.test(notas) para comprobar si los datos siguen una distribución normal.
shapiro.test(notas)
##
## Shapiro-Wilk normality test
##
## data: notas
## W = 0.93243, p-value = 0.05699
print(paste("Como el valor-p es mayor a 0.05, podemos asumir normalidad."))
## [1] "Como el valor-p es mayor a 0.05, podemos asumir normalidad."