Solucion

  1. Busca y escribe una definición corta (1 a 2 líneas) de los siguientes términos relacionados con la estadística inferencial.
Término Definición
Población Muestra: Subconjunto representativo de la población.
Parámetro: Medida descriptiva de una población (μ).
Estadístico: Medida descriptiva de una muestra (x̄).
Error de muestreo: Diferencia entre estadístico y parámetro.
Nivel de significancia (α) Probabilidad de rechazar la hipótesis nula cuando es verdadera. Usualmente α = 0.05.
Distribución muestral Distribución de probabilidad de un estadístico (como la media) a partir de muchas muestras.
Pruebas de normalidad Shapiro-Wilk y Kolmogorov-Smirnov: pruebas para evaluar si los datos siguen distribución normal.
Gráfico de dispersión (plot) Gráfico que muestra la relación entre dos variables numéricas mediante puntos.
Correlación Pearson (lineal), Spearman (monótona), Kendall (rangos): tipos de correlación.
Prueba de hipótesis Incluye H₀ e H₁, valor-p, e intervalos de confianza para tomar decisiones estadísticas.
Pruebas para datos paramétricos Pruebas con supuestos de normalidad (e.g., t de Student, ANOVA).
Prueba para datos no paramétricos Pruebas sin supuestos de normalidad (e.g., Mann-Whitney, Wilcoxon, Kruskal-Wallis).
  1. A partir de las anteriores definiciones realizar la siguiente actividad en R, hay que recordar que en la clase se realizó el código en R y la interpretación, el procedimiento es igual:

Ejercicio: Una institución desea saber si existe relación entre las horas de estudio semanales y el puntaje obtenido en un examen final por un grupo de estudiantes. Realizar

• Simular o carga dos vectores llamados horas_usodelcelular y puntaje_examen, con al menos 40 observaciones cada uno.

• Verificar si ambas variables se distribuyen normalmente con shapiro.test().

• Según el resultado de normalidad, elige la prueba de correlación adecuada: o cor.test(…, method = “pearson”) si hay normalidad. o cor.test(…, method = “spearman”) si no hay normalidad.

• Interpretar: o ¿Existe una relación significativa entre horas de estudio y puntaje? o ¿La relación es positiva o negativa?

##  [1] 29 79 41 88 94  5 53 89 55 46 96 45 68 57 10 90 25  4 33 95 89 69 64 99 66
## [26] 71 54 59 29 15 96 90 69 80  2 48 76 22 32 23
##  [1] 1 4 4 4 2 1 2 5 3 9 0 4 8 1 6 2 1 8 9 4 7 1 4 3 8 4 8 8 8 4 8 6 7 0 5 2 4 6
## [39] 4 1
## 
##  Shapiro-Wilk normality test
## 
## data:  horas_usodelcelular
## W = 0.94213, p-value = 0.04083
## 
##  Shapiro-Wilk normality test
## 
## data:  puntaje_examen
## W = 0.92645, p-value = 0.01235
## Warning in cor.test.default(horas_usodelcelular, puntaje_examen, method =
## "spearman"): Cannot compute exact p-value with ties
## 
##  Spearman's rank correlation rho
## 
## data:  horas_usodelcelular and puntaje_examen
## S = 11664, p-value = 0.5633
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
##         rho 
## -0.09416175

Preguntas:

1¿Existe una relación significativa entre horas de estudio y puntaje?

NO existe una relacion significativa entre los datos debido a que su relacion es demasiado pequeña y ademas de no ser muy cercacana al -1 para afirmar que la relacion es inversa esto nos indica que las horas de uso del celular no tienen una relacion de estar conectada a las calificaciones en un examen

  1. ¿La relación es positiva o negativa?

la relacion es negativa si fuera -1 o cercana esto nos indicaria que las horas de uso del celular no tienen nada que ver con las calificaciones del examen y si duera lo contrario diriamos que las horas de uso si influyen en los resultados de los examenes

  1. Del ejercicio anterior variables horas_usodelcelular y puntaje_examen realizar: • Plantea las hipótesis nula y alterna: • Verifica la normalidad de los datos: • Simula o carga un conjunto de datos llamado notas (al menos 30 observaciones). • Usa la función shapiro.test(notas) para comprobar si los datos siguen una distribución normal.
##  [1] 29 79 41 88 94  5 53 89 55 46 96 45 68 57 10 90 25  4 33 95 89 69 64 99 66
## [26] 71 54 59 29 15
##  [1] 10  9  7  8  0  5  8  2  3  2  1  4  4  4  2  1  2  5  3  9  0  4  8  1  6
## [26]  2  1  8  9  4
## 
##  Shapiro-Wilk normality test
## 
## data:  horas_usodelcelular1
## W = 0.94531, p-value = 0.1265
## 
##  Shapiro-Wilk normality test
## 
## data:  puntaje_examen1
## W = 0.91864, p-value = 0.02474
##  [1]  7  1  4  3  8  4  8  8  8  4  8  6  7  0  5  2  4  6  4  1  2  7  4  8  1
## [26]  4 10  9  9  2
## 
##  Shapiro-Wilk normality test
## 
## data:  NOTAS
## W = 0.93803, p-value = 0.08049
  1. planteamos las hipotesis nulas y alternas
  1. NULA los datos van a seguir una una distribucion de manera normal

  2. ALTERNA los datos NO van a seguir una una distribucion de manera normal

  1. normalidad de los datos

como evidenciamos los datos no son normales para puntaje del examen

pero si son normales para las horas de uso del celular

  1. Usa la función shapiro.test(notas) para comprobar si los datos siguen una distribución normal.

los datos si siguen una distribucion normal