library(readxl)
## Warning: package 'readxl' was built under R version 4.2.1
library(DT)
empre <- read_excel("C:/Users/02aci/Desktop/estastistica/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
head(empre)
## # A tibble: 6 × 6
## id Exp Educ Posg Adm Salario
## <dbl> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 1 2 0 1 1388.
## 2 2 1 3 1 0 1161.
## 3 3 1 3 1 1 1870.
## 4 4 1 2 0 0 1128.
## 5 5 1 3 1 0 1177.
## 6 6 2 2 0 1 2087.
gujarati_empresa_tecnologia <- read_excel("C:/Users/02aci/Desktop/estastistica/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
guja <- read_excel("C:/Users/02aci/Desktop/estastistica/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
library(flextable)
library (readr)
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.1
## corrplot 0.92 loaded
datatable(empre)
Exp: Experiência (em anos)
Educ: Educação com os níveis 1= ensino médio completo, 2 = graduação completa, e 3 = algum título de pós-graduação.
Posg: Pós Graduação: vale 1 (um) se tem algum título de pós-graduação e 0 (zero caso contrário)
Adm: É codificada como sendo 1 (um) para as pessoas exercendo cargos administrativos e 0 (zero) caso contrário
Salario: Salário mensal
minha_tabela1 <- table(empre$Educ) %>% data.frame()
minha_tabela1 <- minha_tabela1 %>% rename(EDUC=Var1,NUMERO=Freq)
minha_tabela1 %>% flextable() %>% theme_zebra()
EDUC | NUMERO |
1 | 12 |
2 | 21 |
3 | 13 |
21 PESSOAS POSSUEM GRADUAÇÃO COMPLETA
empre$Salario -> salario
tabela2 <- table(empre$Salario) %>% data.frame()
tabela2 %>% flextable() %>% theme_zebra()
Var1 | Freq |
1053.5 | 1 |
1128.3 | 1 |
1141.7 | 1 |
1160.8 | 1 |
1176.7 | 1 |
1177.2 | 1 |
1219.5 | 1 |
1223.1 | 1 |
1231.3 | 1 |
1233.6 | 1 |
1288.4 | 1 |
1324.5 | 1 |
1354.8 | 1 |
1367.7 | 1 |
1383.9 | 1 |
1387.6 | 1 |
1446.7 | 1 |
1480.3 | 1 |
1486.1 | 1 |
1497.5 | 1 |
1594.2 | 1 |
1596.5 | 1 |
1599 | 1 |
1688.2 | 1 |
1697.8 | 1 |
1740.4 | 1 |
1748.3 | 1 |
1794.9 | 1 |
1870.1 | 1 |
1883.8 | 1 |
1920.7 | 1 |
1934.6 | 1 |
1980 | 1 |
2026.3 | 1 |
2087.2 | 1 |
2135.2 | 1 |
2137.1 | 1 |
2218.4 | 1 |
2288.4 | 1 |
2317.4 | 1 |
2378 | 1 |
2417 | 1 |
2541 | 1 |
2568.5 | 1 |
2633 | 1 |
2783.7 | 1 |
min(salario)
## [1] 1053.5
#exp = 2 anos
#escolaridade = 1 (ensino médio)
SALÁRIO DE 1053
EXPERIÊNCIA DE 2 ANOS
ESCOLARIDADE 1 - ENSINO MÉDIO
TABELA56 <- table(empre$Posg, empre$Educ)
TABELA56
##
## 1 2 3
## 0 12 20 0
## 1 0 1 13
round(prop.table(TABELA56)*100)
##
## 1 2 3
## 0 26 43 0
## 1 0 2 28
13 PESSOAS POSSUEM A PÓS GRADUAÇÃO NO TOTAL DA EMPRESA, REALIZANDO UMA RÁPIDA CONTA FEITA PELO R, CHEGAMOS A PORCENTAGEM DE APROXIMADAMENTE 28% DE PESSOAS DA EMPRESA.
TABELA34 <- table(empre$Adm,empre$Educ)
TABELA34
##
## 1 2 3
## 0 9 12 5
## 1 3 9 8
round(prop.table(TABELA34)*100)
##
## 1 2 3
## 0 20 26 11
## 1 7 20 17
CERCA DE 17%
plot(empre$Salario,empre$Educ,pch=20,col="darkblue",
main="Gráfico 1",xlab = "salário",ylab = "educação")
APESAR DE NÃO SER UMA CRESCENTE LINEAR, PESSOAS COM ESCOLARIDADE NÍVEL 1(APENAS ENSINO MÉDIO) NÃO POSSUEM A MÁXIMA DE SALÁRIO, SENDO O MAIOR SALÁRIO DESSE NÍVEL CHEGANDO APENAS A METADE DO MAIOR SALÁRIO DA EMPRESA.JÁ O NÍVEL 2 (GRADUAÇÃO COMPLETA) É O NÍVEL QUE MAIS IMPACTA NO SALÁRIO, JÁ QUE HÁ PESSOAS DESSE NÍVEL COM SALÁRIOS MENORES QUE O NÍVEL 1 E MAIORES QUE O NÍVEL 3, NÃO HAVENDO UMA REGRA EXPLÍCITA. JÁ O NÍVEL 3 POSSUI A MAIORIA COM SALÁRIOS ACIMA DA MÉDIA DA EMPRESA, PORÉM HÁ ALGUMAS PESSOAS QUE ESTÃO COM SALÁRIO ABAIXO DO NÍVEL 1. EM SUMA, A ESCOLARIDADE NÃO CAUSA UMA GRANDE DISCREPÂNCIA E IMPACTO NO SALÁRIO.
plot(empre$Salario,empre$Adm,pch=20,col="royalblue",
main="Gráfico 1",xlab = "salário",ylab = "CARGO ADM")
SIM, POIS PESSOAS QUE NÃO POSSUEM CARGO ADMINISTRATIVO ESTÃO REPRESENTADAS PELO MENOR SALÁRIO, TENDO SEU PICO NA METADE DO MAIOR SALÁRIO DA EMPRESA. JÁ PESSOAS QUE POSSUEM CARGOS ADMINISTRATIVOS ESTÃO REPRESENTADAS PELO MAIOR SALÁRIO E SUA MAIORIA ACIMA DOS SALÁRIOS DE QUEM NÃO POSSUI. EM SUMA, QUEM NÃO POSSUI CARGO POSSUI UM SALÁRIO ENTRE 1000 - 1900 E QUEM POSSUI CARGO POSSUI UM SALÁRIO ENTRE 1500 - 3000
plot(gujarati_empresa_tecnologia$Salario,gujarati_empresa_tecnologia$Exp,pch=20,col="blue",
main="Gráfico 1",xlab = "salário",ylab = "EXPERIENCIA")
HÁ UMA CORRELAÇÃO POSITIVA. PESSOAS COM MAIS ANOS DE EMPRESA TENDEM A TER A MÍNIMA SALARIAL MAIOR, PESSOAS COM MENOS ANOS TENDEM A TER A MÍNIMA SALARIAL MENOR.
library(tidyr)
## Warning: package 'tidyr' was built under R version 4.2.1
empre <- separate(empre,"Educ",into="ENSINO SUPERIOR",sep="1",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 12 rows [8, 11, 14,
## 21, 25, 27, 29, 30, 35, 38, 44, 46].
empre <- separate(empre,"Educ",into="ENSINO MEDIO",sep="2",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 21 rows [1, 4, 6, 7,
## 10, 12, 17, 19, 20, 23, 24, 26, 31, 33, 34, 36, 39, 40, 42, 43, ...].
empre <- separate(empre,"ENSINO MEDIO",into="Ensino Medio",sep="3",remove=TRUE)
## Warning: Expected 1 pieces. Additional pieces discarded in 13 rows [2, 3, 5, 9,
## 13, 15, 16, 18, 22, 28, 32, 37, 41].
mc <- empre %>% select(Educ, Adm, Salario) %>% cor()
selecao <- c("educação","Cargo adm","salário")
corrplot(mc, method = "number")
Ao buscar um gráfico com mais informações, é possível notar que há valores de AMBAS associação, sendo de 0.20 até a.39 de correlação fraca e de 0.70 até 0.89 de associação forte e uma associação MUITO forte trazida pelo 0.90 até o 1.0, que ocorrem no caso de relação linear perfeita, quando os pontos caem exatamente sobre a reta.
menor que 5 anos = “pouca experiência”
entre 6 e 10 anos = “média experiência”
maior que 11 anos = “muita experiência”
guja$Exp <- ifelse(guja$Exp<6,"pouca experiencia",ifelse(guja$Exp>10,"muita experiencia","media experiencia"))
1 - 20 = pouca experiência
21 - 33 = média experiência
34 - 46 = muita experiência
guja %>% select(Salario,Exp) %>% group_by(Exp) %>%
summarise(Mediana=median(Salario), Minimo=min(Salario), Maximo=max(Salario), Media=mean(Salario),desvio_padrao=round(sd(Salario),2))%>% flextable() %>% theme_zebra()
Exp | Mediana | Minimo | Maximo | Media | desvio_padrao |
media experiencia | 1,697.80 | 1,233.6 | 2,378.0 | 1,789.931 | 418.52 |
muita experiencia | 1,920.70 | 1,486.1 | 2,783.7 | 2,076.831 | 445.30 |
pouca experiencia | 1,306.45 | 1,053.5 | 2,137.1 | 1,453.750 | 361.62 |
MEDIANA DE:
R$1.306,45 - POUCA EXPERIÊNCIA
R$1.697,15 - MÉDIA EXPERIÊNCIA
R$1.920,70 - MUITA EXPERIÊNCIA
MEDIA DE:
R$ 1.453,75 - POUCA EXPERIÊNCIA
R$ 1.789,93 - MÉDIA EXPERIÊNCIA
R$ 2.076,83 - MUITA EXPERIÊNCIA
DESVIO PADRÃO DE:
361,61 - POUCA EXPERIÊNCIA
418,52 - MÉDIA EXPERIÊNCIA
445,29 - MUITA EXPERIÊNCIA
tabela39 <- table(guja$Exp,guja$Educ)
tabela55 <- table(guja$Salario,guja$Exp)
tabela44 <- table(guja$Salario,guja$Educ)
round(prop.table(tabela39)*100)
##
## 1 2 3
## media experiencia 11 11 7
## muita experiencia 9 15 4
## pouca experiencia 7 20 17
barplot(tabela44)
barplot(tabela55)
Em relação ao salário e a faixa de experiência, os maiores salários pertencem a quem tem menos experiência, e em relação a educação, o salário é maior as pessoas que possuem ensino médio completo.
SIM, EXISTE. POR MEIO DE UM MÉTODO DE ANÁLISE DE REGRESSÃO SIMULTÂNEA MÚLTIPLA APLICADA DE TODAS ESSAS VARIÁVEIS EM CONJUNTO. SE A SIGNIFICÂNCIA DE REGRESSÃO MELHORAR, DEVE-SE PROVAVELMENTE A CO-LINEARIDADE ENTRE AS DUAS VARIÁVEIS
FOI REALIZADO UM OUTRO MÉTODO PARA TENTAR AVALIAR O IMPACTO SIMULTANEO, NÃO TÃO PRECISO OU INFORMATIVO COMO UMA ANÁLISE DE REGRESSÃO, MAS VALE A TENTATIVA COM UM GRÁFICO DE COEFICIENTE DE CORRELAÇÃO.
bc <- gujarati_empresa_tecnologia %>% select(Salario, Exp, Adm, Educ) %>% cor()
selecao <- c("salário","Experiencia","Cargos","Educação")
corrplot(bc, method = "number")
00 A 0.19 - BEM FRACA
0.20 A 0.39 - FRACA
0.40 A 0.69 - MODERADA
0.70 A 0.89 - FORTE
0.90 A 1.00 - MUITO FORTE
UM GRÁFICO XYPLOT COM A VARIÁVEL DO ENSINO MÉDIO E ENSINO SUPERIOR DENTRO DE SALÁRIO E EXPERIENCIA. É UMA CRESCENTE, PESSOAS COM MAIS EXPERIÊNCIA POSSUEM MAIORES SALÁRIOS E COM MENOS EXPERIÊNCIAS MENORES TRABALHOS. NO CASO DO ENSINO MÉDIO (EM ROSA) SEUS SALÁRIOS SÃO MENORES EM RELAÇÃO A QUEM TEM ENSINO SUPERIOR (EM PRETO)
library(lattice)
## Warning: package 'lattice' was built under R version 4.2.1
xyplot(Salario ~ Exp, groups = gujarati_empresa_tecnologia$`Ensino Medio`, autokey = TRUE, data = gujarati_empresa_tecnologia)
## Warning: Unknown or uninitialised column: `Ensino Medio`.
xyplot(Salario ~ Exp, groups = Educ, autokey = TRUE, data = gujarati_empresa_tecnologia)