Prueba de hipótesis
Librerías
setwd("~/R Scripts/proyecto") # Directorio de trabajo.
library("pacman") # Importa biblioteca "pacman". Se utiliza para hacer una mejor gestión de paquetes.
p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales", "readxl", "tidyverse","cluster", "factoextra","NbClust","tidyr", "hpackedbubble") # Paquetes necesarios para la elaboración.Descarga de datos
xfun::embed_file("GEyPPC_PorEstado.csv")xfun::embed_file("GEyPPC_comparar.csv")r <- read_csv("GEyPPC_comparar.csv") #Leer datos##
## -- Column specification --------------------------------------------------------
## cols(
## Entidad = col_character(),
## GradoEscolaridad = col_double(),
## PPC = col_double(),
## Ubicacion = col_character()
## )
datatable(r)Mediante la observación de la tabla anterior podríamos decir que el Grado de Escolaridad (GE) es más alto cuando el PIB Per Cápita (PPC) es mayor y que los estados del norte tienden a ser más ricos que los del sur.
boxplot(r$PPC ~ r$Ubicacion, col = "pink", xlab = "Ubicación", ylab= "PPC")boxplot(r$GradoEscolaridad ~ r$Ubicacion, col = "pink", xlab = "Ubicación", ylab= "GE")N <- subset(r, r$Ubicacion == "N")
S <- subset(r, r$Ubicacion == "S")
hist(N$PPC, xlab = "PPC", main = "Histograma PPC NORTE")hist(N$GradoEscolaridad, xlab = "GE", main = "Histograma GE NORTE")hist(S$PPC, xlab = "PPC", main = "Histograma PPC SUR")hist(S$GradoEscolaridad, xlab = "GE", main = "Histograma GE SUR")summary(S$GradoEscolaridad)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 7.800 9.000 9.700 9.519 10.000 11.500
sd(S$GradoEscolaridad)## [1] 0.8669597
summary(N$GradoEscolaridad)## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 9.20 9.85 10.10 10.04 10.25 10.70
sd(N$GradoEscolaridad)## [1] 0.4129715
Shapiro test
shapiro.test(r$GradoEscolaridad)##
## Shapiro-Wilk normality test
##
## data: r$GradoEscolaridad
## W = 0.95212, p-value = 0.1655