Datos de encuesta

library(readxl)
library(tidyverse)
datos <- read_excel("encuesta_depurada.xlsx")
datos
## # A tibble: 30 × 10
##    promedio_ac…¹ color…² horas…³ horas…⁴ redes…⁵ redso…⁶ bachi…⁷ lectura horas…⁸
##            <dbl> <chr>     <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>     <dbl>
##  1          3.53 Verde        30       7       4 Youtube 1 Año   Muy po…      20
##  2          3.8  Amaril…      12       6       9 Facebo… Menos … Frecue…       3
##  3          4.02 Rojo         45       6       3 Facebo… 1 Año   Frecue…      42
##  4          4.39 Negro        60       6       2 Facebo… Menos … Muy po…      90
##  5          3.99 Azul         50       8       9 Instag… Menos … Muy po…      56
##  6          3.8  Vino t…      25       2       5 Instag… Más de… Nada         40
##  7          3.83 Rosado       28       2       2 Youtube Más de… Frecue…      30
##  8          3.8  Negro        40       6       4 Facebo… 1 Año   Muy po…      80
##  9          3.8  Negro        40       6       4 Instag… 1 Año   Muy po…      80
## 10          3.88 Azul         36       7       5 Facebo… Menos … Muy po…      10
## # … with 20 more rows, 1 more variable: trabajo <chr>, and abbreviated variable
## #   names ¹​promedio_academico, ²​color_favorito, ³​horas_estudiar, ⁴​horas_dormir,
## #   ⁵​redes_sociales, ⁶​redsocial_favorita, ⁷​bachiller_universidad,
## #   ⁸​horas_internet

Analizando la normalidad

Gráficos

Densidades

datos %>% 
  ggplot(mapping = aes(x = promedio_academico)) +
  geom_density()

Cuantil-Cuantil

datos %>% 
  ggplot(mapping = aes(sample = promedio_academico)) +
  geom_qq() +
  geom_qq_line()

  • El mismo gráfico anterior con la biblioteca ggpubr:
library(ggpubr)
ggqqplot(data = datos$promedio_academico)

  • El mismo gráfico con la biblioteca car:
library(car)
qqPlot(x = datos$promedio_academico)

## [1]  4 22

Pruebas de hipótesis

  • Juego de hipótesis:

\[H_0: X \sim N(\mu, \sigma) \\ H_1: X \nsim N(\mu, \sigma)\]

  • Nivel de significancia: en este caso vamos a usar un nivel de significancia del 1%, es decir, del 0.01 (\(\alpha = 0.01\))

Shapiro Wilk

shapiro.test(x = datos$promedio_academico)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$promedio_academico
## W = 0.94241, p-value = 0.1056
  • Conclusión: como el valor p (0.1056) es mayor que el nivel de significancia (0.01) no existe evidencia para rechazar la hipótesis nula, es decir, que la variable aleatoria promedio_académico se distribuye de forma normal.

Anderson Darling

library(nortest)
ad.test(x = datos$promedio_academico)
## 
##  Anderson-Darling normality test
## 
## data:  datos$promedio_academico
## A = 0.60659, p-value = 0.1046
  • Conclusión: como el valor p (0.1046) es mayor que el nivel de significancia (0.01) no existe evidencia para rechazar la hipótesis nula, es decir, que la variable aleatoria promedio_académico se distribuye de forma normal.