Solucion
| Término | Definición |
|---|---|
| Población |
Muestra: Subconjunto representativo de la población. Parámetro: Medida descriptiva de una población (μ). Estadístico: Medida descriptiva de una muestra (x̄). Error de muestreo: Diferencia entre estadístico y parámetro. |
| Nivel de significancia (α) | Probabilidad de rechazar la hipótesis nula cuando es verdadera. Usualmente α = 0.05. |
| Distribución muestral | Distribución de probabilidad de un estadístico (como la media) a partir de muchas muestras. |
| Pruebas de normalidad | Shapiro-Wilk y Kolmogorov-Smirnov: pruebas para evaluar si los datos siguen distribución normal. |
| Gráfico de dispersión (plot) | Gráfico que muestra la relación entre dos variables numéricas mediante puntos. |
| Correlación | Pearson (lineal), Spearman (monótona), Kendall (rangos): tipos de correlación. |
| Prueba de hipótesis | Incluye H₀ e H₁, valor-p, e intervalos de confianza para tomar decisiones estadísticas. |
| Pruebas para datos paramétricos | Pruebas con supuestos de normalidad (e.g., t de Student, ANOVA). |
| Prueba para datos no paramétricos | Pruebas sin supuestos de normalidad (e.g., Mann-Whitney, Wilcoxon, Kruskal-Wallis). |
Ejercicio: Una institución desea saber si existe relación entre las horas de estudio semanales y el puntaje obtenido en un examen final por un grupo de estudiantes. Realizar
• Simular o carga dos vectores llamados horas_usodelcelular y puntaje_examen, con al menos 40 observaciones cada uno.
• Verificar si ambas variables se distribuyen normalmente con shapiro.test().
• Según el resultado de normalidad, elige la prueba de correlación adecuada: o cor.test(…, method = “pearson”) si hay normalidad. o cor.test(…, method = “spearman”) si no hay normalidad.
• Interpretar: o ¿Existe una relación significativa entre horas de estudio y puntaje? o ¿La relación es positiva o negativa?
## [1] 29 79 41 88 94 5 53 89 55 46 96 45 68 57 10 90 25 4 33 95 89 69 64 99 66
## [26] 71 54 59 29 15 96 90 69 80 2 48 76 22 32 23
## [1] 1 4 4 4 2 1 2 5 3 9 0 4 8 1 6 2 1 8 9 4 7 1 4 3 8 4 8 8 8 4 8 6 7 0 5 2 4 6
## [39] 4 1
##
## Shapiro-Wilk normality test
##
## data: horas_usodelcelular
## W = 0.94213, p-value = 0.04083
##
## Shapiro-Wilk normality test
##
## data: puntaje_examen
## W = 0.92645, p-value = 0.01235
## Warning in cor.test.default(horas_usodelcelular, puntaje_examen, method =
## "spearman"): Cannot compute exact p-value with ties
##
## Spearman's rank correlation rho
##
## data: horas_usodelcelular and puntaje_examen
## S = 11664, p-value = 0.5633
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## -0.09416175
Preguntas:
1¿Existe una relación significativa entre horas de estudio y puntaje?
NO existe una relacion significativa entre los datos debido a que su relacion es demasiado pequeña y ademas de no ser muy cercacana al -1 para afirmar que la relacion es inversa esto nos indica que las horas de uso del celular no tienen una relacion de estar conectada a las calificaciones en un examen
la relacion es negativa si fuera -1 o cercana esto nos indicaria que las horas de uso del celular no tienen nada que ver con las calificaciones del examen y si duera lo contrario diriamos que las horas de uso si influyen en los resultados de los examenes
## [1] 29 79 41 88 94 5 53 89 55 46 96 45 68 57 10 90 25 4 33 95 89 69 64 99 66
## [26] 71 54 59 29 15
## [1] 10 9 7 8 0 5 8 2 3 2 1 4 4 4 2 1 2 5 3 9 0 4 8 1 6
## [26] 2 1 8 9 4
##
## Shapiro-Wilk normality test
##
## data: horas_usodelcelular1
## W = 0.94531, p-value = 0.1265
##
## Shapiro-Wilk normality test
##
## data: puntaje_examen1
## W = 0.91864, p-value = 0.02474
## [1] 7 1 4 3 8 4 8 8 8 4 8 6 7 0 5 2 4 6 4 1 2 7 4 8 1
## [26] 4 10 9 9 2
##
## Shapiro-Wilk normality test
##
## data: NOTAS
## W = 0.93803, p-value = 0.08049
NULA los datos van a seguir una una distribucion de manera normal
ALTERNA los datos NO van a seguir una una distribucion de manera normal
como evidenciamos los datos no son normales para puntaje del examen
pero si son normales para las horas de uso del celular
los datos si siguen una distribucion normal