library(readxl)
library(tidyverse)
datos <- read_excel("encuesta_depurada.xlsx")
datos
## # A tibble: 30 × 10
## promedio_academico color_favorito horas_estudiar horas_dormir redes_sociales
## <dbl> <chr> <dbl> <dbl> <dbl>
## 1 3.53 Verde 30 7 4
## 2 3.8 Amarillo 12 6 9
## 3 4.02 Rojo 45 6 3
## 4 4.39 Negro 60 6 2
## 5 3.99 Azul 50 8 9
## 6 3.8 Vino tinto 25 2 5
## 7 3.83 Rosado 28 2 2
## 8 3.8 Negro 40 6 4
## 9 3.8 Negro 40 6 4
## 10 3.88 Azul 36 7 5
## # … with 20 more rows, and 5 more variables: redsocial_favorita <chr>,
## # bachiller_universidad <chr>, lectura <chr>, horas_internet <dbl>,
## # trabajo <chr>
datos %>%
ggplot(mapping = aes(x = promedio_academico)) +
geom_density()
datos %>%
ggplot(mapping = aes(sample = promedio_academico)) +
geom_qq() +
geom_qq_line()
library(ggpubr)
ggqqplot(data = datos$promedio_academico)
library(car)
qqPlot(x = datos$promedio_academico)
## [1] 4 22
\[H_0: X \sim N(\mu, \sigma) \\ H_1: X \nsim N(\mu, \sigma)\]
shapiro.test(x = datos$promedio_academico)
##
## Shapiro-Wilk normality test
##
## data: datos$promedio_academico
## W = 0.94241, p-value = 0.1056
library(nortest)
ad.test(x = datos$promedio_academico)
##
## Anderson-Darling normality test
##
## data: datos$promedio_academico
## A = 0.60659, p-value = 0.1046