Introdução

Nesse último trabalho de estatística, foi carregada a base de dados “gujarati_empresa_tecnologia.xlsx”, onde a mesma, foi alterada para o nome “gurajati”. Além disso, foram utilizados alguns pacotes, como os sugeridos pelo professor: readxl, dplyr, ggplot2, e ggthemes.

library(readxl)
gujarati <- read_excel("C:/Users/rober/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
View(gujarati)

gurajati <- read_excel("C:/Users/rober/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")

library(dplyr)
library(ggplot2)
library(flextable)
library(readr)
library(corrplot)
library(DT)
library(ggthemes)
library(readxl)

datatable(gujarati)

Questão 1

Quantas pessoas com graduação completa existem na empresa Gujarati? Existem 21 pessoas com graduação completa.

tabela_1 <- table(gujarati$Educ) %>% data.frame()
tabela_1 <- tabela_1 %>% rename(EDUC=Var1,NUMERO=Freq)

tabela_1 %>% flextable() %>% theme_zebra()

Questão 2

Qual é o salário mais baixo da empresa? Qual a escolaridade dessa pessoa? Qual a experiência? Essa pessoa recebe R$ 1053 de salário, possui ensino médio completo e tem 2 anos de experiência.

gujarati$Salario -> Salario

tabela_2 <- table(gujarati$Salario)
                  
min(Salario)
## [1] 1053.5

Questão 3

Qual a proporção de pessoas com pós-graduação na empresa Gujarati? Nessa empresa 30% das pessoas possuem pós-graduação, sendo 14 trabalhadores.

tabela_3 <- table(gujarati$Posg)
tabela_3
## 
##  0  1 
## 32 14
round(prop.table(tabela_3)*100)
## 
##  0  1 
## 70 30

Questão 4

Qual a proporção de pessoas com pós-graduação exercendo cargos administrativos na empresa Gujarati? Nessa empresa 17% das pessoas possuem pós-graduação e trabalham na área administrativa, logo, são 8 trabalhadores.

tabela_4 <- table(gurajati$Adm,gurajati$Educ)
tabela_4
##    
##      1  2  3
##   0  9 12  5
##   1  3  9  8
round(prop.table(tabela_4)*100)
##    
##      1  2  3
##   0 20 26 11
##   1  7 20 17

Questão 5

Qual o impacto da escolaridade no salário? Diante do gráfico desenvolvido, observa-se que a escolaridade não possui tanto impacto no salário, uma vez que, existem pessoas com ensino médio completo (nível 1) ganhando mais que pessoas com graduação completa (nível 2) e pessoas de pós-graduação (nível 3), ganhando menos que pessoas de graduação completa (nível 2).

plot(gurajati$Salario,gurajati$Educ,pch=20,col="orange",
     main="Gráfico: Salário X Educação", xlab="Salário", ylab="Educação")

Questão 6

O fato de ter um cargo administrativo influência no salário? Sim, é possível notar que os trabalhadores que estão nos cargos de administração possuem os maiores salários, estando entre R$ 1500 e R$ 3000.

plot(gurajati$Salario,gurajati$Adm,pch=20,col="purple",
     main="Gráfico: Salário X Cargo de Administrador", xlab="Salário", ylab="Administrador")

Questão 7

Qual o impacto da experiência no salário? Pode-se perceber que pessoas com menos experiência possuem a faixa salarial menor que pessoas com mais experiência. Logo, quanto mais experiência, maior será a faixa salarial.

plot(gujarati$Salario,gujarati$Exp,pch=20,col="blue",
     main="Gráfico: Salário X Experiência", xlab= "Salário", ylab= "Experiência")

Questão 8

Seria possível criar uma nova variável com base na escolaridade? Faça uma nova variável com base na codificação abaixo:

Nova classificação:

UNIV = “ensino médio” (se Educ=1)

UNIV = “ensino superior” (se Educ=2 ou Educ=3)

library(tidyr)
gujarati <- separate(gurajati,"Educ",into="ENSINO SUPERIOR",sep="1",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 12 rows [8, 11, 14,
## 21, 25, 27, 29, 30, 35, 38, 44, 46].
gurajati <- separate(gurajati,"Educ",into="ENSINO MEDIO",sep="2",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 21 rows [1, 4, 6, 7,
## 10, 12, 17, 19, 20, 23, 24, 26, 31, 33, 34, 36, 39, 40, 42, 43, ...].
gurajati <- separate(gurajati,"ENSINO MEDIO",into="Ensino Medio",sep="3",remove=TRUE)
## Warning: Expected 1 pieces. Additional pieces discarded in 13 rows [2, 3, 5, 9,
## 13, 15, 16, 18, 22, 28, 32, 37, 41].

Questão 9

Existe algum efeito no salário da interação do fato da pessoa estar em cargo administrativo (atividade meio) ou não (atividade fim da empresa) com a educação? Diante do gráfico apresentado, quando o valor está entre 0.20 e 0.39, a correlação é fraca. Já, quando o valor está entre 0.70 e 0.89, é muito forte e quando estiver entre 0.90 e 1.0 é muito forte.

mc <- gurajati %>% select(Educ, Adm, Salario) %>% cor()
selecao <- c("educação", "Cargo adm", "salario")

corrplot(mc, method = "number") 

Questão 10

Faça a transformação da experiência em três faixas de experiência.

  1. menor que 5 anos = “pouca experiência”
  2. entre 6 e 10 anos = “média experiência”
  3. maior que 11 anos = “muita experiência”
library(readxl)
gujarati_empresa_tecnologia <- read_excel("C:/Users/rober/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
View(gujarati_empresa_tecnologia)
gujarati_empresa_tecnologia$Exp <- ifelse(gujarati_empresa_tecnologia$Exp<6,"pouca experiencia",ifelse(gujarati_empresa_tecnologia$Exp>10,"muita experiencia","media experiencia"))

Questão 11

Quantas pessoas estão em cada categoria dessa nova variável faixas de experiência ?

1 - 20 = pouca experiência

21 - 33 = média experiência

34 - 46 = muita experiência

Questão 12

Qual o salário médio, mediano e o desvio-padrão de cada categoria dessa nova variável faixas de experiência?

gujarati_empresa_tecnologia %>% select(Salario,Exp) %>% group_by(Exp) %>%  
  summarise(Mediana=median(Salario), Minimo=min(Salario), Maximo=max(Salario), Media=mean(Salario),desvio_padrao=round(sd(Salario),2))%>% flextable() %>% theme_zebra()

MEDIANA DE:

R$1.306,45 - POUCA EXPERIÊNCIA

R$1.697,15 - MÉDIA EXPERIÊNCIA

R$1.920,70 - MUITA EXPERIÊNCIA

MEDIA DE:

R$ 1.453,75 - POUCA EXPERIÊNCIA

R$ 1.789,93 - MÉDIA EXPERIÊNCIA

R$ 2.076,83 - MUITA EXPERIÊNCIA

DESVIO PADRÃO DE:

361,61 - POUCA EXPERIÊNCIA

418,52 - MÉDIA EXPERIÊNCIA

445,29 - MUITA EXPERIÊNCIA