INTRODUÇÃO

  • Nesse trabalho responderemos 15 questões propostas com base numa base de dados denomidada “gujarati_empresa_tecnologia”, chamada neste trabalho de “empre” > Para começar, iremos importar a base de dados e as library que serão usadas
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.1
library(DT)

empre <- read_excel("C:/Users/02aci/Desktop/estastistica/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
head(empre)
## # A tibble: 6 × 6
##      id   Exp  Educ  Posg   Adm Salario
##   <dbl> <dbl> <dbl> <dbl> <dbl>   <dbl>
## 1     1     1     2     0     1   1388.
## 2     2     1     3     1     0   1161.
## 3     3     1     3     1     1   1870.
## 4     4     1     2     0     0   1128.
## 5     5     1     3     1     0   1177.
## 6     6     2     2     0     1   2087.
gujarati_empresa_tecnologia <- read_excel("C:/Users/02aci/Desktop/estastistica/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")

guja <- read_excel("C:/Users/02aci/Desktop/estastistica/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(flextable)
library (readr)
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.1
## corrplot 0.92 loaded
datatable(empre)

LEGENDA

Exp: Experiência (em anos)

Educ: Educação com os níveis 1= ensino médio completo, 2 = graduação completa, e 3 = algum título de pós-graduação.

Posg: Pós Graduação: vale 1 (um) se tem algum título de pós-graduação e 0 (zero caso contrário)

Adm: É codificada como sendo 1 (um) para as pessoas exercendo cargos administrativos e 0 (zero) caso contrário

Salario: Salário mensal

PERGUNTA 1

Quantas pessoas com graduação completa existem na empresa Gujarati?

minha_tabela1 <- table(empre$Educ) %>% data.frame()
minha_tabela1 <- minha_tabela1 %>% rename(EDUC=Var1,NUMERO=Freq)

minha_tabela1 %>% flextable() %>% theme_zebra()

21 PESSOAS POSSUEM GRADUAÇÃO COMPLETA

PERGUNTA 2

Qual é o salário mais baixo da empresa? Qual a escolaridade dessa pessoa? Qual a experiência?

empre$Salario -> salario

tabela2 <- table(empre$Salario) %>% data.frame()

tabela2 %>% flextable() %>% theme_zebra()
min(salario)
## [1] 1053.5
#exp =  2 anos

#escolaridade = 1 (ensino médio)

SALÁRIO DE 1053

EXPERIÊNCIA DE 2 ANOS

ESCOLARIDADE 1 - ENSINO MÉDIO

PERGUNTA 3

Qual a proporção de pessoas com pós-graduação na empresa Gujarati?

TABELA56 <- table(empre$Posg, empre$Educ)

TABELA56
##    
##      1  2  3
##   0 12 20  0
##   1  0  1 13
round(prop.table(TABELA56)*100)
##    
##      1  2  3
##   0 26 43  0
##   1  0  2 28

13 PESSOAS POSSUEM A PÓS GRADUAÇÃO NO TOTAL DA EMPRESA, REALIZANDO UMA RÁPIDA CONTA FEITA PELO R, CHEGAMOS A PORCENTAGEM DE APROXIMADAMENTE 28% DE PESSOAS DA EMPRESA.

PERGUNTA 4

Qual a proporção de pessoas com pós-graduação exercendo cargos administrativos na empresa Gujarati?

TABELA34 <- table(empre$Adm,empre$Educ)

TABELA34 
##    
##      1  2  3
##   0  9 12  5
##   1  3  9  8
round(prop.table(TABELA34)*100)
##    
##      1  2  3
##   0 20 26 11
##   1  7 20 17

CERCA DE 17%

PERGUNTA 5

Qual o impacto da escolaridade no salário?

plot(empre$Salario,empre$Educ,pch=20,col="darkblue",
     main="Gráfico 1",xlab = "salário",ylab = "educação")

APESAR DE NÃO SER UMA CRESCENTE LINEAR, PESSOAS COM ESCOLARIDADE NÍVEL 1(APENAS ENSINO MÉDIO) NÃO POSSUEM A MÁXIMA DE SALÁRIO, SENDO O MAIOR SALÁRIO DESSE NÍVEL CHEGANDO APENAS A METADE DO MAIOR SALÁRIO DA EMPRESA.JÁ O NÍVEL 2 (GRADUAÇÃO COMPLETA) É O NÍVEL QUE MAIS IMPACTA NO SALÁRIO, JÁ QUE HÁ PESSOAS DESSE NÍVEL COM SALÁRIOS MENORES QUE O NÍVEL 1 E MAIORES QUE O NÍVEL 3, NÃO HAVENDO UMA REGRA EXPLÍCITA. JÁ O NÍVEL 3 POSSUI A MAIORIA COM SALÁRIOS ACIMA DA MÉDIA DA EMPRESA, PORÉM HÁ ALGUMAS PESSOAS QUE ESTÃO COM SALÁRIO ABAIXO DO NÍVEL 1. EM SUMA, A ESCOLARIDADE NÃO CAUSA UMA GRANDE DISCREPÂNCIA E IMPACTO NO SALÁRIO.

PERGUNTA 6

O fato de ter um cargo administrativo influência no salário?

plot(empre$Salario,empre$Adm,pch=20,col="royalblue",
     main="Gráfico 1",xlab = "salário",ylab = "CARGO ADM")

SIM, POIS PESSOAS QUE NÃO POSSUEM CARGO ADMINISTRATIVO ESTÃO REPRESENTADAS PELO MENOR SALÁRIO, TENDO SEU PICO NA METADE DO MAIOR SALÁRIO DA EMPRESA. JÁ PESSOAS QUE POSSUEM CARGOS ADMINISTRATIVOS ESTÃO REPRESENTADAS PELO MAIOR SALÁRIO E SUA MAIORIA ACIMA DOS SALÁRIOS DE QUEM NÃO POSSUI. EM SUMA, QUEM NÃO POSSUI CARGO POSSUI UM SALÁRIO ENTRE 1000 - 1900 E QUEM POSSUI CARGO POSSUI UM SALÁRIO ENTRE 1500 - 3000

PERGUNTA 7

Qual o impacto da experiência no salário?

plot(gujarati_empresa_tecnologia$Salario,gujarati_empresa_tecnologia$Exp,pch=20,col="blue",
     main="Gráfico 1",xlab = "salário",ylab = "EXPERIENCIA")

HÁ UMA CORRELAÇÃO POSITIVA. PESSOAS COM MAIS ANOS DE EMPRESA TENDEM A TER A MÍNIMA SALARIAL MAIOR, PESSOAS COM MENOS ANOS TENDEM A TER A MÍNIMA SALARIAL MENOR.

PERGUNTA 8

Seria possível criar uma nova variável com base na escolaridade? Faça uma nova variável com base na codificação abaixo:

  • Nova classificação:
  • UNIV = “ensino médio” (se Educ=1)
  • UNIV = “ensino superior” (se Educ=2 ou Educ=3)
library(tidyr)
## Warning: package 'tidyr' was built under R version 4.2.1
empre <- separate(empre,"Educ",into="ENSINO SUPERIOR",sep="1",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 12 rows [8, 11, 14,
## 21, 25, 27, 29, 30, 35, 38, 44, 46].
empre <- separate(empre,"Educ",into="ENSINO MEDIO",sep="2",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 21 rows [1, 4, 6, 7,
## 10, 12, 17, 19, 20, 23, 24, 26, 31, 33, 34, 36, 39, 40, 42, 43, ...].
empre <- separate(empre,"ENSINO MEDIO",into="Ensino Medio",sep="3",remove=TRUE)
## Warning: Expected 1 pieces. Additional pieces discarded in 13 rows [2, 3, 5, 9,
## 13, 15, 16, 18, 22, 28, 32, 37, 41].

PERGUNTA 9

Existe algum efeito no salário da interação do fato da pessoa estar em cargo administrativo (atividade meio) ou não (atividade fim da empresa) com a educação?

mc <- empre %>% select(Educ, Adm, Salario) %>% cor()  
selecao <- c("educação","Cargo adm","salário")

corrplot(mc, method = "number") 

Ao buscar um gráfico com mais informações, é possível notar que há valores de AMBAS associação, sendo de 0.20 até a.39 de correlação fraca e de 0.70 até 0.89 de associação forte e uma associação MUITO forte trazida pelo 0.90 até o 1.0, que ocorrem no caso de relação linear perfeita, quando os pontos caem exatamente sobre a reta.

PERGUNTA 10

Faça a transformação da experiência em três faixas de experiência.

  • menor que 5 anos = “pouca experiência”

  • entre 6 e 10 anos = “média experiência”

  • maior que 11 anos = “muita experiência”

guja$Exp <- ifelse(guja$Exp<6,"pouca experiencia",ifelse(guja$Exp>10,"muita experiencia","media experiencia"))

PERGUNTA 11

Quantas pessoas estão em cada categoria dessa nova variável faixas de experiência ?

1 - 20 = pouca experiência

21 - 33 = média experiência

34 - 46 = muita experiência

PERGUNTA 12

Qual o salário médio, mediano e o desvio-padrão de cada categoria dessa nova variável faixas de experiência?

guja %>% select(Salario,Exp) %>% group_by(Exp) %>%  
  summarise(Mediana=median(Salario), Minimo=min(Salario), Maximo=max(Salario), Media=mean(Salario),desvio_padrao=round(sd(Salario),2))%>% flextable() %>% theme_zebra()

MEDIANA DE:

  • R$1.306,45 - POUCA EXPERIÊNCIA

  • R$1.697,15 - MÉDIA EXPERIÊNCIA

  • R$1.920,70 - MUITA EXPERIÊNCIA

MEDIA DE:

  • R$ 1.453,75 - POUCA EXPERIÊNCIA

  • R$ 1.789,93 - MÉDIA EXPERIÊNCIA

  • R$ 2.076,83 - MUITA EXPERIÊNCIA

DESVIO PADRÃO DE:

  • 361,61 - POUCA EXPERIÊNCIA

  • 418,52 - MÉDIA EXPERIÊNCIA

  • 445,29 - MUITA EXPERIÊNCIA

PERGUNTA 13

Existe algum efeito no salário da interação da (faixa de) experiência com a educação?

tabela39 <- table(guja$Exp,guja$Educ)
tabela55 <- table(guja$Salario,guja$Exp)
tabela44 <- table(guja$Salario,guja$Educ)
round(prop.table(tabela39)*100)
##                    
##                      1  2  3
##   media experiencia 11 11  7
##   muita experiencia  9 15  4
##   pouca experiencia  7 20 17
barplot(tabela44)

barplot(tabela55)

Em relação ao salário e a faixa de experiência, os maiores salários pertencem a quem tem menos experiência, e em relação a educação, o salário é maior as pessoas que possuem ensino médio completo.

PERGUNTA 14

Existe alguma forma de avaliar o impacto simultâneo das variáveis experiência, educação e cargo administrativo no salário?

SIM, EXISTE. POR MEIO DE UM MÉTODO DE ANÁLISE DE REGRESSÃO SIMULTÂNEA MÚLTIPLA APLICADA DE TODAS ESSAS VARIÁVEIS EM CONJUNTO. SE A SIGNIFICÂNCIA DE REGRESSÃO MELHORAR, DEVE-SE PROVAVELMENTE A CO-LINEARIDADE ENTRE AS DUAS VARIÁVEIS

FOI REALIZADO UM OUTRO MÉTODO PARA TENTAR AVALIAR O IMPACTO SIMULTANEO, NÃO TÃO PRECISO OU INFORMATIVO COMO UMA ANÁLISE DE REGRESSÃO, MAS VALE A TENTATIVA COM UM GRÁFICO DE COEFICIENTE DE CORRELAÇÃO.

bc <- gujarati_empresa_tecnologia %>% select(Salario, Exp, Adm, Educ) %>% cor()  
selecao <- c("salário","Experiencia","Cargos","Educação")

corrplot(bc, method = "number") 

  • 00 A 0.19 - BEM FRACA

  • 0.20 A 0.39 - FRACA

  • 0.40 A 0.69 - MODERADA

  • 0.70 A 0.89 - FORTE

  • 0.90 A 1.00 - MUITO FORTE

PERGUNTA 15

Você conseguria refazer e interpretar um dos gráficos abaixo?

UM GRÁFICO XYPLOT COM A VARIÁVEL DO ENSINO MÉDIO E ENSINO SUPERIOR DENTRO DE SALÁRIO E EXPERIENCIA. É UMA CRESCENTE, PESSOAS COM MAIS EXPERIÊNCIA POSSUEM MAIORES SALÁRIOS E COM MENOS EXPERIÊNCIAS MENORES TRABALHOS. NO CASO DO ENSINO MÉDIO (EM ROSA) SEUS SALÁRIOS SÃO MENORES EM RELAÇÃO A QUEM TEM ENSINO SUPERIOR (EM PRETO)

library(lattice)
## Warning: package 'lattice' was built under R version 4.2.1
xyplot(Salario ~ Exp, groups = gujarati_empresa_tecnologia$`Ensino Medio`, autokey = TRUE, data = gujarati_empresa_tecnologia)
## Warning: Unknown or uninitialised column: `Ensino Medio`.

xyplot(Salario ~ Exp, groups = Educ, autokey = TRUE, data = gujarati_empresa_tecnologia)