knitr::opts_chunk$set(echo = TRUE)

Base de dados

knitr::opts_chunk$set(echo = TRUE)

library(readxl)
library(flextable)
library(dplyr)
library(kableExtra)
library(corrplot)

UF <- read_excel("Desktop/Base_de_dados-master/empregados_setor_publico_adm_direta.xlsx")

Tabela

knitr::opts_chunk$set(echo = TRUE)

kable(UF, row.names = FALSE)%>%
  kable_styling( full_width = T,bootstrap_options = c("striped", "hover", "condensed", "responsive"), 
                 position = "center", fixed_thead = T) %>%
  scroll_box(width = "900px", height = "600px")
S Sigla Codigo Estado Região CodigoReg estatutarios_2019 clt_2019 comissionados_2019 estagiarios_2019 sem_vinculo_permanente_2019 total_2019 populacao_2019 estatutarios_2015 clt_2015 comissionados_2015 estagiarios_2015 sem_vinculo_permanente_2015 total_2015 populacao_2015
AC AC 12 Acre Norte N 11253 4655 1626 449 4898 22881 881935 9943 4870 1553 310 5323 21999 803513
AL AL 27 Alagoas Nordeste NE 75830 2514 12660 762 38486 130252 3337357 82420 3682 10454 497 32704 129757 3340932
AM AM 13 Amazonas Norte N 13679 228 2324 196 3766 20193 845731 13459 229 2520 0 4015 20223 766679
AP AP 16 Amapa Norte N 43015 3459 11332 118 40159 98083 4144597 61597 4520 9843 1444 39524 116928 3938336
BA BA 29 Bahia Nordeste NE 307188 12074 51231 7917 135743 514153 14873064 311758 18009 51197 6405 118402 505771 15203934
CE CE 23 Ceara Nordeste NE 184346 22759 30139 5815 73947 317006 9132078 180575 16552 27720 3933 85459 314239 8904459
DF DF 53 Distrito Federal Centro-Oeste MW 102521 97 5164 1047 13368 122197 3015268 114047 3 5446 885 10158 130539 2914830
ES ES 32 Espirito Santo Sudeste SE 73177 8026 11547 7910 37522 138182 4018650 76242 7788 11865 5681 39125 140701 3929911
GO GO 52 Goias Centro-Oeste MW 147949 1700 42135 3151 17664 212599 7018354 147700 1164 37271 2934 20896 209965 6610681
MA MA 21 Maranhao Nordeste NE 157597 9613 30995 198 98601 297004 7075181 170063 7154 25920 565 96479 300181 6904241
MG MG 31 Minas Gerais Sudeste SE 71953 5545 8607 3253 20760 110118 3484466 70967 2933 8923 1826 24940 109589 3265486
MS MS 50 Mato Grosso do Sul Centro-Oeste MW 70641 809 8867 4059 26459 110835 2778986 61375 546 7215 3334 18557 91027 2651235
MT MT 51 Mato Grosso Centro-Oeste MW 411433 37466 39476 14712 169361 672448 21168791 403164 35959 38609 13495 178113 669340 20869101
PA PA 15 Para Norte N 168594 5393 20998 1596 97202 293783 8602865 170148 3712 18637 682 103792 296971 8175113
PB PB 25 Paraiba Nordeste NE 97945 1043 20684 191 49717 169580 4018127 102138 4156 19932 224 44400 170850 3972202
PE PE 26 Pernambuco Nordeste NE 253848 26689 17076 25455 7104 330172 11433957 249765 30527 18731 20797 15747 335567 11163018
PI PI 22 Piaui Nordeste NE 147976 3087 30921 9822 83684 275490 9557071 155374 10750 28837 3727 73074 271762 9345173
PR PR 41 Parana Sul S 69120 4038 15733 835 24693 114419 3273227 66041 9375 14184 790 23959 114349 3204028
RJ RJ 33 Rio de Janeiro Sudeste SE 269570 19530 48188 5419 54937 397644 17264943 283144 21824 43902 11411 61267 421548 16550024
RN RN 24 Rio Grande do Norte Nordeste NE 75128 3652 16356 3517 27310 125963 3506853 80453 2980 15915 2344 25241 126933 3442175
RO RO 11 Rondonia Norte N 225236 13514 22761 24636 22420 308567 11377239 220599 17829 22623 21976 22581 305608 11247972
RR RR 14 Roraima Norte N 40706 3513 6459 206 1592 52476 1777225 43209 3580 5935 356 1053 54133 1768204
RS RS 43 Rio Grande do Sul Sul S 11414 577 2656 0 4743 19390 605761 10597 606 2417 10 3707 17337 505665
SC SC 42 Santa Catarina Sul S 133392 21929 14188 15853 40628 225990 7164788 127324 24351 13747 10170 42373 217965 6819190
SE SE 28 Sergipe Nordeste NE 620932 231659 41644 49771 38983 982989 45919049 600031 259910 52294 42139 42887 997261 44396484
SP SP 35 Sao Paulo Sudeste SE 43997 1114 12438 1190 17890 76629 2298696 49311 1281 11592 1134 9991 73309 2242937
TO TO 17 Tocantins Norte N 41902 364 7539 500 19988 70293 1572866 41283 314 7101 352 14198 63248 1515126

Índices/100k hab

knitr::opts_chunk$set(echo = TRUE)
UF$total2015_por100k <- (UF$total_2015/UF$populacao_2015)*100000
UF$total2019_por100k <- (UF$total_2019/UF$populacao_2019)*100000

UF$estatutarios2015_por100k <- (UF$estatutarios_2015/UF$populacao_2015)*100000
UF$estatutarios2019_por100k <- (UF$estatutarios_2019/UF$populacao_2019)*100000

UF$clt2015_por100k <- (UF$clt_2015/UF$populacao_2015)*100000
UF$clt2019_por100k <- (UF$clt_2019/UF$populacao_2019)*100000

UF$comissionados2015_por100k <- (UF$comissionados_2015/UF$populacao_2015)*100000
UF$comissionados2019_por100k <- (UF$comissionados_2019/UF$populacao_2019)*100000

UF$estagiarios2015_por100k <- (UF$estagiarios_2015/UF$populacao_2015)*100000
UF$estagiarios2019_por100k <- (UF$estagiarios_2019/UF$populacao_2019)*100000

UF$sem_vinculo_permanente2015_por100k <- (UF$sem_vinculo_permanente_2015/UF$populacao_2015)*100000
UF$sem_vinculo_permanente2019_por100k <- (UF$sem_vinculo_permanente_2019/UF$populacao_2019)*100000

Boxplot

Total/100k por região

options(scipen = 999)

par(mfrow=c(1,2))
boxplot(total2015_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2015 \n")

boxplot(total2019_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2019 \n")

Estatutarios/100k por região

par(mfrow=c(1,2))
boxplot(estatutarios2015_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2015 \n")

boxplot(estatutarios2019_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2019 \n")

Comissionados/100k por região

par(mfrow=c(1,2))
boxplot(comissionados2015_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2015 \n")

boxplot(comissionados2019_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2019 \n")

CLT/100k por região

par(mfrow=c(1,2))
boxplot(clt2015_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2015 \n")

boxplot(clt2019_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2019 \n")

Estagiários/100k por região

par(mfrow=c(1,2))
boxplot(estagiarios2015_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2015 \n")

boxplot(estagiarios2019_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2019 \n")

SVP/100k por região

par(mfrow=c(1,2))
boxplot(sem_vinculo_permanente2015_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2015 \n")

boxplot(sem_vinculo_permanente2019_por100k~Região, 
        data=UF,
        col=c("#87CEFA","#708090","#87CEFA","#0f8efc","#ADD8E6"),
        main="2019 \n")

Flextable

Total/100k por região - 2015

UF %>% select(Região,total2015_por100k) %>% group_by (Região) %>%
  summarise(média=mean(total2015_por100k),
            desvio_padrao=sd(total2015_por100k),
            minimo=min(total2015_por100k),
            maximo=max (total2015_por100k)) %>%
  flextable()

Total/100k por região - 2019

UF %>% select(Região,total2019_por100k) %>% group_by (Região) %>%
  summarise(média=mean(total2019_por100k),
            desvio_padrao=sd(total2019_por100k),
            minimo=min(total2019_por100k),
            maximo=max (total2019_por100k)) %>%
  flextable()

Estatutário/100k por região - 2015

UF %>% select(Região,estatutarios2015_por100k) %>% group_by (Região) %>%
  summarise(média=mean(estatutarios2015_por100k),
            desvio_padrao=sd(estatutarios2015_por100k),
            minimo=min(estatutarios2015_por100k),
            maximo=max (estatutarios2015_por100k)) %>%
  flextable()

Estatutário/100k por região - 2019

UF %>% select(Região,estatutarios2019_por100k) %>% group_by (Região) %>%
  summarise(média=mean(estatutarios2019_por100k),
            desvio_padrao=sd(estatutarios2019_por100k),
            minimo=min(estatutarios2019_por100k),
            maximo=max (estatutarios2019_por100k)) %>%
  flextable()

Comissionários/100k por região - 2015

UF %>% select(Região,comissionados2015_por100k) %>% group_by (Região) %>%
  summarise(média=mean(comissionados2015_por100k),
            desvio_padrao=sd(comissionados2015_por100k),
            minimo=min(comissionados2015_por100k),
            maximo=max (comissionados2015_por100k)) %>%
  flextable()

Comissionários/100k por região - 2019

UF %>% select(Região,comissionados2019_por100k) %>% group_by (Região) %>%
  summarise(média=mean(comissionados2019_por100k),
            desvio_padrao=sd(comissionados2019_por100k),
            minimo=min(comissionados2019_por100k),
            maximo=max (comissionados2019_por100k)) %>%
  flextable()

CLT/100k por região - 2015

UF %>% select(Região,clt2015_por100k) %>% group_by (Região) %>%
  summarise(média=mean(clt2015_por100k),
            desvio_padrao=sd(clt2015_por100k),
            minimo=min(clt2015_por100k),
            maximo=max (clt2015_por100k)) %>%
  flextable()

CLT/100k por região - 2019

UF %>% select(Região,clt2019_por100k) %>% group_by (Região) %>%
  summarise(média=mean(clt2019_por100k),
            desvio_padrao=sd(clt2019_por100k),
            minimo=min(clt2019_por100k),
            maximo=max (clt2019_por100k)) %>%
  flextable()

Estagiários/100k por região - 2015

UF %>% select(Região,estagiarios2015_por100k) %>% group_by (Região) %>%
  summarise(média=mean(estagiarios2015_por100k),
            desvio_padrao=sd(estagiarios2015_por100k),
            minimo=min(estagiarios2015_por100k),
            maximo=max (estagiarios2015_por100k)) %>%
  flextable()

Estagiários/100k por região - 2019

UF %>% select(Região,estagiarios2019_por100k) %>% group_by (Região) %>%
  summarise(média=mean(estagiarios2019_por100k),
            desvio_padrao=sd(estagiarios2019_por100k),
            minimo=min(estagiarios2019_por100k),
            maximo=max (estagiarios2019_por100k)) %>%
  flextable()

SVP/100k por região - 2015

UF %>% select(Região,sem_vinculo_permanente2015_por100k) %>% group_by (Região) %>%
  summarise(média=mean(sem_vinculo_permanente2015_por100k),
            desvio_padrao=sd(sem_vinculo_permanente2015_por100k),
            minimo=min(sem_vinculo_permanente2015_por100k),
            maximo=max (sem_vinculo_permanente2015_por100k)) %>%
  flextable()

SVP/100k por região - 2019

UF %>% select(Região,sem_vinculo_permanente2019_por100k) %>% group_by (Região) %>%
  summarise(média=mean(sem_vinculo_permanente2019_por100k),
            desvio_padrao=sd(sem_vinculo_permanente2019_por100k),
            minimo=min(sem_vinculo_permanente2019_por100k),
            maximo=max (sem_vinculo_permanente2019_por100k)) %>%
  flextable()

Matriz de correlação

2015

MC <-cor(UF[,c("estatutarios2015_por100k","clt2015_por100k","comissionados2015_por100k","estagiarios2015_por100k")])
corrplot.mixed(MC)

MC <-cor(UF[,c("estatutarios2019_por100k","clt2019_por100k","comissionados2019_por100k","estagiarios2019_por100k")])
corrplot.mixed(MC)

2019

MC <-cor(UF[,c("estatutarios2019_por100k","clt2019_por100k","comissionados2019_por100k","estagiarios2019_por100k")])
corrplot.mixed(MC)

Teste de hipóteses

Estatutário/Região

2015

#------------ Residuos estatutarios 2015 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo4 <- aov(estatutarios2015_por100k~Região,data = UF)
estatutarios2015<-residuals(modelo4)

shapiro.test(estatutarios2015)

    Shapiro-Wilk normality test

data:  estatutarios2015
W = 0.96172, p-value = 0.4042
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.4042
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Variancia = para todas as regiões
#H1: Pelo menos 1 variancia != 

bartlett.test(estatutarios2015_por100k~Região,data = UF)

    Bartlett test of homogeneity of variances

data:  estatutarios2015_por100k by Região
Bartlett's K-squared = 8.711, df = 4, p-value = 0.06874
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.06874
# Logo Não Rej H0, as regiões apresentam a mesma variância em 2015

modelo4 <- aov(estatutarios2015_por100k~Região,data = UF)

#H0: MEDIA DE CARGOS COMISSIONADOS EM 2015 = EM TODAS AS REGIÕES
#H1:  Pelo menos 1 MÉDIA != 
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 NÃO rej H0

options(scipen = 999)
summary(modelo4)
            Df  Sum Sq Mean Sq F value Pr(>F)
Região       4 1169916  292479   1.183  0.346
Residuals   22 5440144  247279               
# p-value = 0.346, a média de cargo comissionados é igual por região em 2015

#---------------------------------

2019

#------------ Residuos estatutarios 2019 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo3 <- aov(estatutarios2019_por100k~Região,data = UF)
estatutarios2019<-residuals(modelo3)

shapiro.test(estatutarios2019)

    Shapiro-Wilk normality test

data:  estatutarios2019
W = 0.96249, p-value = 0.4205
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.4205
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Variancia = para todas as regiões
#H1: Pelo menos 1 variancia != 

bartlett.test(estatutarios2019_por100k~Região,data = UF)

    Bartlett test of homogeneity of variances

data:  estatutarios2019_por100k by Região
Bartlett's K-squared = 6.8917, df = 4, p-value = 0.1417
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.1417
# Logo Não Rej H0, as regiões apresentam a mesma variância em 2019

modelo3 <- aov(estatutarios2019_por100k~Região,data = UF)

#H0: MEDIA DE CARGOS COMISSIONADOS EM 2019 = EM TODAS AS REGIÕES
#H1:  Pelo menos 1 MÉDIA != 
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 NÃO rej H0

options(scipen = 999)
summary(modelo3)
            Df  Sum Sq Mean Sq F value Pr(>F)
Região       4 1304722  326180   1.639    0.2
Residuals   22 4379162  199053               
# p-value = 0.2, a média de cargo comissionados é igual por região em 2019

#---------------------------------

Comissionados/Região

2015

#------------ Residuos comissionados 2015 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo2 <- aov(comissionados2015_por100k~Região,data = UF)
residuoscomissionados2015<-residuals(modelo2)

shapiro.test(residuoscomissionados2015)

    Shapiro-Wilk normality test

data:  residuoscomissionados2015
W = 0.97097, p-value = 0.6276
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.6276
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Variancia = para todas as regiões
#H1: Pelo menos 1 variancia != 

bartlett.test(residuoscomissionados2015~UF$Região)

    Bartlett test of homogeneity of variances

data:  residuoscomissionados2015 by UF$Região
Bartlett's K-squared = 1.5492, df = 4, p-value = 0.8179
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.8179
# Logo Não Rej H0, as regiões apresentam a mesma variância em 2019

modelo2 <- aov(comissionados2015_por100k~Região,data = UF)

#H0: MEDIA DE CARGOS COMISSIONADOS EM 2015 = EM TODAS AS REGIÕES
#H1:  Pelo menos 1 MÉDIA != 
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 NÃO rej H0

options(scipen = 999)
summary(modelo2)
            Df Sum Sq Mean Sq F value Pr(>F)
Região       4  19362    4841   0.293  0.879
Residuals   22 363467   16521               
# p-value = 0.879, a média de cargo comissionados é igual por região em 2015

#---------------------------------

2019

#------------ Residuos comissionados 2019 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo <- aov(comissionados2019_por100k~Região,data = UF)
residuoscomissionados2019<-residuals(modelo)

shapiro.test(residuoscomissionados2019)

    Shapiro-Wilk normality test

data:  residuoscomissionados2019
W = 0.98599, p-value = 0.9658
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.9658
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Variancia = para todas as regiões
#H1: Pelo menos 1 variancia != 

bartlett.test(residuoscomissionados2019~UF$Região)

    Bartlett test of homogeneity of variances

data:  residuoscomissionados2019 by UF$Região
Bartlett's K-squared = 1.7279, df = 4, p-value = 0.7856
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.7856
# Logo Não Rej H0, as regiões apresentam a mesma variância em 2019

modelo <- aov(comissionados2019_por100k~Região,data = UF)

#H0: MEDIA DE CARGOS COMISSIONADOS EM 2019 = EM TODAS AS REGIÕES
#H1:  Pelo menos 1 MÉDIA != 
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 NÃO rej H0

options(scipen = 999)
summary(modelo)
            Df Sum Sq Mean Sq F value Pr(>F)
Região       4  18289    4572   0.229  0.919
Residuals   22 440198   20009               
# p-value = 0.919, a média de cargo comissionados é igual por região em 2019

#---------------------------------

CLT/Região

2015

#------------ Residuos CLT 2015 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo8 <- aov(clt2015_por100k~Região,data = UF)
clt2015<-residuals(modelo8)

shapiro.test(clt2015)

    Shapiro-Wilk normality test

data:  clt2015
W = 0.7807, p-value = 0.00006453
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.00006453
# Logo Rej H0, os resíduos não seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Distribuição = para todas as regiões
#H1: Pelo menos 1 distribuição != 

kruskal.test(clt2015_por100k~Região,data = UF)

    Kruskal-Wallis rank sum test

data:  clt2015_por100k by Região
Kruskal-Wallis chi-squared = 6.9468, df = 4, p-value = 0.1387
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.1387
# Logo Não Rej H0, as regiões apresentam a mesma distribuição em 2015


#---------------------------------

2019

#------------ Residuos CLT 2019 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo7 <- aov(clt2019_por100k~Região,data = UF)
clt2019<-residuals(modelo7)

shapiro.test(clt2019)

    Shapiro-Wilk normality test

data:  clt2019
W = 0.81449, p-value = 0.0002466
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.0002466
# Logo Rej H0, os resíduos não seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Distribuição = para todas as regiões
#H1: Pelo menos 1 distribuição != 

kruskal.test(clt2019_por100k~Região,data = UF)

    Kruskal-Wallis rank sum test

data:  clt2019_por100k by Região
Kruskal-Wallis chi-squared = 4.1257, df = 4, p-value = 0.3893
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.3893
# Logo Não Rej H0, as regiões apresentam a mesma distribuição em 2019


#---------------------------------

Estagiários/Região

2015

#------------ Residuos estagiarios 2015 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo6 <- aov(estagiarios2015_por100k~Região,data = UF)
estagiarios2015<-residuals(modelo6)

shapiro.test(estagiarios2015)

    Shapiro-Wilk normality test

data:  estagiarios2015
W = 0.8076, p-value = 0.0001859
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.0001859
#Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Distribuição = para todas as regiões
#H1: Pelo menos 1 distribuição != 

kruskal.test(estagiarios2015_por100k~Região,data = UF)

    Kruskal-Wallis rank sum test

data:  estagiarios2015_por100k by Região
Kruskal-Wallis chi-squared = 4.7166, df = 4, p-value = 0.3176
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.3176
#Logo Não Rej H0, as regiões apresentam a mesma distribuição em 2015


#---------------------------------

2019

#------------ Residuos estagiarios 2019 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo5 <- aov(estagiarios2019_por100k~Região,data = UF)
estagiarios2019<-residuals(modelo5)

shapiro.test(estagiarios2019)

    Shapiro-Wilk normality test

data:  estagiarios2019
W = 0.86022, p-value = 0.001848
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.001848
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Distribuição = para todas as regiões
#H1: Pelo menos 1 distribuição != 

kruskal.test(estagiarios2019_por100k~Região,data = UF)

    Kruskal-Wallis rank sum test

data:  estagiarios2019_por100k by Região
Kruskal-Wallis chi-squared = 2.868, df = 4, p-value = 0.5802
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.5802
# Logo Não Rej H0, as regiões apresentam a mesma distribuição em 2019


#---------------------------------

SVP/Região

2015

#------------ Residuos sem_vinculos_permanentes 2015 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo10 <- aov(sem_vinculo_permanente2015_por100k~Região,data = UF)
sem_vinculo_permanente2015<-residuals(modelo10)

shapiro.test(sem_vinculo_permanente2015)

    Shapiro-Wilk normality test

data:  sem_vinculo_permanente2015
W = 0.96758, p-value = 0.5393
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.5393
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Distribuição = para todas as regiões
#H1: Pelo menos 1 distribuição != 

bartlett.test(sem_vinculo_permanente2015~Região,data = UF)

    Bartlett test of homogeneity of variances

data:  sem_vinculo_permanente2015 by Região
Bartlett's K-squared = 5.689, df = 4, p-value = 0.2236
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.2236
# Logo Não Rej H0, as regiões apresentam a mesma variância em 2015

modelo10 <- aov(sem_vinculo_permanente2015~Região,data = UF)

#H0: MEDIA DOS FUNCIONARIOS SEM VINCULO PERMANENTE EM 2019 = EM TODAS AS REGIÕES
#H1:  Pelo menos 1 MÉDIA !=  
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 NÃO rej H0

options(scipen = 999)
summary(modelo10)
            Df  Sum Sq Mean Sq F value Pr(>F)
Região       4       0       0       0      1
Residuals   22 3072430  139656               
# p-value = 1, a média de FUNCIONARIOS SEM VINCULO PERMANENTE é igual por região em 2015

#---------------------------------

2019

#------------ Residuos sem_vinculos_permanentes 2019 ------------

# Verificando os pressupostos de normalidade (resíduos com 
# distribuição normal) 
modelo9 <- aov(sem_vinculo_permanente2019_por100k~Região,data = UF)
sem_vinculo_permanente2019<-residuals(modelo9)

shapiro.test(sem_vinculo_permanente2019)

    Shapiro-Wilk normality test

data:  sem_vinculo_permanente2019
W = 0.9703, p-value = 0.6096
# H0: os residuos seguem uma distribuição normal
# H1: os residuos NÃO seguem uma distribuição normal
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

#p-value = 0.6096
# Logo Não Rej H0, os resíduos seguem uma distribuição normal

# Verificando o pressuposto de homogeneidade de variâncias (variância  constante)
#H0: Distribuição = para todas as regiões
#H1: Pelo menos 1 distribuição != 

bartlett.test(sem_vinculo_permanente2019~Região,data = UF)

    Bartlett test of homogeneity of variances

data:  sem_vinculo_permanente2019 by Região
Bartlett's K-squared = 4.3188, df = 4, p-value = 0.3646
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 Não Rej H0

# p-value = 0.3646
# Logo Não Rej H0, as regiões apresentam a mesma variância em 2015

modelo9 <- aov(sem_vinculo_permanente2019~Região,data = UF)

#H0: MEDIA DOS FUNCIONARIOS SEM VINCULO PERMANENTE EM 2019 = EM TODAS AS REGIÕES
#H1:  Pelo menos 1 MÉDIA != 
#p-valor <= 0,05 Rej H0
#p-valor > 0,05 NÃO rej H0

options(scipen = 999)
summary(modelo9)
            Df  Sum Sq Mean Sq F value Pr(>F)
Região       4       0       0       0      1
Residuals   22 3574345  162470               
# p-value = 1, a média de FUNCIONARIOS SEM VINCULO PERMANENTE é igual por região em 2019

#---------------------------------