Datos de encuesta

library(readxl)
library(tidyverse)
datos <- read_excel("encuesta_depurada.xlsx")
datos
## # A tibble: 30 × 10
##    promedio_academico color_favorito horas_estudiar horas_dormir redes_sociales
##                 <dbl> <chr>                   <dbl>        <dbl>          <dbl>
##  1               3.53 Verde                      30            7              4
##  2               3.8  Amarillo                   12            6              9
##  3               4.02 Rojo                       45            6              3
##  4               4.39 Negro                      60            6              2
##  5               3.99 Azul                       50            8              9
##  6               3.8  Vino tinto                 25            2              5
##  7               3.83 Rosado                     28            2              2
##  8               3.8  Negro                      40            6              4
##  9               3.8  Negro                      40            6              4
## 10               3.88 Azul                       36            7              5
## # … with 20 more rows, and 5 more variables: redsocial_favorita <chr>,
## #   bachiller_universidad <chr>, lectura <chr>, horas_internet <dbl>,
## #   trabajo <chr>

Analizando la normalidad

Gráficos

Densidades

datos %>% 
  ggplot(mapping = aes(x = promedio_academico)) +
  geom_density()

Cuantil-Cuantil

datos %>% 
  ggplot(mapping = aes(sample = promedio_academico)) +
  geom_qq() +
  geom_qq_line()

  • El mismo gráfico anterior con la biblioteca ggpubr:
library(ggpubr)
ggqqplot(data = datos$promedio_academico)

  • El mismo gráfico con la biblioteca car:
library(car)
qqPlot(x = datos$promedio_academico)

## [1]  4 22

Pruebas de hipótesis

  • Juego de hipótesis:

\[H_0: X \sim N(\mu, \sigma) \\ H_1: X \nsim N(\mu, \sigma)\]

  • Nivel de significancia: en este caso vamos a usar un nivel de significancia del 1%, es decir, del 0.01 (\(\alpha = 0.01\))

Shapiro Wilk

shapiro.test(x = datos$promedio_academico)
## 
##  Shapiro-Wilk normality test
## 
## data:  datos$promedio_academico
## W = 0.94241, p-value = 0.1056
  • Conclusión: como el valor p (0.1056) es mayor que el nivel de significancia (0.01) no existe evidencia para rechazar la hipótesis nula, es decir, que la variable aleatoria promedio_académico se distribuye de forma normal.

Anderson Darling

library(nortest)
ad.test(x = datos$promedio_academico)
## 
##  Anderson-Darling normality test
## 
## data:  datos$promedio_academico
## A = 0.60659, p-value = 0.1046
  • Conclusión: como el valor p (0.1046) es mayor que el nivel de significancia (0.01) no existe evidencia para rechazar la hipótesis nula, es decir, que la variable aleatoria promedio_académico se distribuye de forma normal.