Prueba de hipótesis

Librerías

setwd("~/R Scripts/proyecto") # Directorio de trabajo.

library("pacman") # Importa biblioteca "pacman". Se utiliza para hacer una mejor gestión de paquetes.

p_load("base64enc", "htmltools", "mime", "xfun", "prettydoc","readr", "knitr","DT","dplyr", "ggplot2","plotly", "gganimate","gifski","scales", "readxl", "tidyverse","cluster", "factoextra","NbClust","tidyr", "hpackedbubble") # Paquetes necesarios para la elaboración.

Descarga este documento

xfun::embed_file("U2A3.rmd")

Download U2A3.rmd

Descarga de datos

xfun::embed_file("GEyPPC_PorEstado.csv")

Download GEyPPC_PorEstado.csv

xfun::embed_file("GEyPPC_comparar.csv")

Download GEyPPC_comparar.csv

r <- read_csv("GEyPPC_comparar.csv") #Leer datos
## 
## -- Column specification --------------------------------------------------------
## cols(
##   Entidad = col_character(),
##   GradoEscolaridad = col_double(),
##   PPC = col_double(),
##   Ubicacion = col_character()
## )
datatable(r)

Mediante la observación de la tabla anterior podríamos decir que el Grado de Escolaridad (GE) es más alto cuando el PIB Per Cápita (PPC) es mayor y que los estados del norte tienden a ser más ricos que los del sur.

boxplot(r$PPC ~ r$Ubicacion, col = "pink", xlab = "Ubicación", ylab= "PPC")

boxplot(r$GradoEscolaridad ~ r$Ubicacion, col = "pink", xlab = "Ubicación", ylab= "GE")

N <- subset(r, r$Ubicacion == "N")
S <- subset(r, r$Ubicacion == "S")

hist(N$PPC, xlab = "PPC", main = "Histograma PPC NORTE")

hist(N$GradoEscolaridad, xlab = "GE", main = "Histograma GE NORTE")

hist(S$PPC, xlab = "PPC", main = "Histograma PPC SUR")

hist(S$GradoEscolaridad, xlab = "GE", main = "Histograma GE SUR")

summary(S$GradoEscolaridad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   7.800   9.000   9.700   9.519  10.000  11.500
sd(S$GradoEscolaridad)
## [1] 0.8669597
summary(N$GradoEscolaridad)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    9.20    9.85   10.10   10.04   10.25   10.70
sd(N$GradoEscolaridad)
## [1] 0.4129715

Shapiro test

shapiro.test(r$GradoEscolaridad)
## 
##  Shapiro-Wilk normality test
## 
## data:  r$GradoEscolaridad
## W = 0.95212, p-value = 0.1655