BIBLIOTECAS

library(dplyr)
library(ggplot2)
library(flextable)
library(ggthemes)

BASE DE DADOS

library(readxl)
gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")

QUESTÃO 1- Quantas pessoas com graduação completa existem na empresa Gujarati?

tabela_1 <- table(gujarati_empresa_tecnologia$Educ) %>% data.frame()
tabela_1 <- tabela_1 %>% rename(escolaridade=Var1,Quantidade=Freq)
flextable(data.frame(tabela_1)) %>% theme_vader()
gujarati_empresa_tecnologia$Educ <- ifelse(gujarati_empresa_tecnologia$Educ==1,"ensino médio completo",ifelse(gujarati_empresa_tecnologia$Educ==2,"graduação completa","pós graduação"))

Resposta: 34 pessoas

QUESTÃO 2- Qual é o salário mais baixo da empresa? Qual a escolaridade dessa pessoa? Qual a experiência?

gujarati_empresa_tecnologia %>% select(Salario,Educ) %>% group_by(Educ) %>% summarise(Minimo=min(Salario),Maximo=max(Salario)) %>% flextable %>% theme_tron()

Resposta: O salário mais baixo é de 1053,5 reais, essa pessoa possui o ensino médio completo e tem 2 anos de experiência, numa escala de 1 a 20 anos

QUESTÃO 3- Qual a proporção de pessoas com pós-graduação na empresa Gujarati?

prop_tabela <- round(prop.table(table(gujarati_empresa_tecnologia$Educ))*100,2)
prop_tabela %>% data.frame() %>% rename(escolaridade=Var1,Percentual=Freq) %>% flextable %>% theme_booktabs()

Resposta: R:28,26% das pessoas tem pós graduação

QUESTÃO 4- Qual a proporção de pessoas com pós-graduação exercendo cargos administrativos na empresa Gujarati?

Transformando variável

gujarati_empresa_tecnologia$Adm <- ifelse(gujarati_empresa_tecnologia$Adm==0,"não exerce","exerce cargo administrativo")
tabela_quali <- table(gujarati_empresa_tecnologia$Educ,gujarati_empresa_tecnologia$Adm) %>% prop.table() %>% round(3) %>% data.frame() %>% rename(Escolaridade=Var1,Cargo_adm=Var2,Percentual=Freq) %>% flextable %>% theme_vader()
tabela_quali
tabela_coluna<- table(gujarati_empresa_tecnologia$Educ,gujarati_empresa_tecnologia$Adm) %>% prop.table(2) %>% round(2) %>% data.frame() %>% rename(Escolaridade=Var1,Cargo_adm=Var2,Percentual=Freq) %>% flextable %>% theme_vader()
tabela_coluna

Resposta: Cerca de 17,4% das pessoas que possuem pós graduação trabalham na área administrativa

QUESTÃO 5- Qual o impacto da escolaridade no salário?

boxplot(gujarati_empresa_tecnologia$Salario ~ gujarati_empresa_tecnologia$Educ, col=c("blue","pink","purple"), main= 'Salário de acordo com o nível de escolaridade',xlab = "nível de escolaridade",ylab = "valor do salário")

R: Quanto maior a sua escolaridade, maior será o seu salário, como é visto no gráfico acima.

QUESTÃO 6- O fato de ter um cargo administrativo influência no salário?

boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Adm, col=c("#942272","#229426"), main= 'Salário de acordo com o cargo',xlab = "cargo administrativo",ylab = "valor do salário")

gujarati_empresa_tecnologia %>% select(Salario,Adm) %>% group_by(Adm) %>% summarise(Minimo=min(Salario),Mediana=median(Salario),Media=round(mean(Salario),2),Desvio_padrão=round(sd(Salario),2),Maximo=max(Salario)) %>% flextable %>% theme_box()

R: Ter um cargo administrativo influencia sim no salário, uma vez que quem tem cargo administrativo ganha um salário maior, como é visível no gráfico.

QUESTÃO 7- Qual o impacto da experiência no salário?

plot(gujarati_empresa_tecnologia$Exp,gujarati_empresa_tecnologia$Salario,pch=20,col="orange",main= "Gráfico relacionando a experiência e o salário",xlab="experiência",ylab="Salário")
abline(lsfit(gujarati_empresa_tecnologia$Exp,gujarati_empresa_tecnologia$Salario),col="black")

library(corrplot)
mcc <- gujarati_empresa_tecnologia %>% select(Exp,Salario) %>% cor()
corrplot(mcc,method = "number")

R: Através da matriz de correlação é possível dizer que as variáveis tem associação entre si. Dessa forma, é possível dizer que quanto maior a sua experiência, maior será o seu salário, o que é visível no diagrama.

QUESTÃO 8- seria possível criar uma nova variável com base na escolaridade? Faça uma nova variável com base na codificação abaixo:

gujarati_empresa_tecnologia %>% mutate(Educação = ifelse (Educ > 1, "Ensino Superior", "Ensino Médio"))
## # A tibble: 46 × 7
##       id   Exp Educ                   Posg Adm                  Salario Educação
##    <dbl> <dbl> <chr>                 <dbl> <chr>                  <dbl> <chr>   
##  1     1     1 graduação completa        0 exerce cargo admini…   1388. Ensino …
##  2     2     1 pós graduação             1 não exerce             1161. Ensino …
##  3     3     1 pós graduação             1 exerce cargo admini…   1870. Ensino …
##  4     4     1 graduação completa        0 não exerce             1128. Ensino …
##  5     5     1 pós graduação             1 não exerce             1177. Ensino …
##  6     6     2 graduação completa        0 exerce cargo admini…   2087. Ensino …
##  7     7     2 graduação completa        0 não exerce             1177. Ensino …
##  8     8     2 ensino médio completo     0 não exerce             1054. Ensino …
##  9     9     2 pós graduação             1 não exerce             1220. Ensino …
## 10    10     3 graduação completa        0 não exerce             1231. Ensino …
## # … with 36 more rows

QUESTÃO 9- Existe algum efeito no salário da interação do fato da pessoa estar em cargo administrativo (atividade meio) ou não (atividade fim da empresa) com a educação?

boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Adm, col=c("red","yellow"), main= 'Valor do salário de acordo com o cargo',xlab = "Cargo administrativo",ylab = "Salário")

boxplot(gujarati_empresa_tecnologia$Salario ~ gujarati_empresa_tecnologia$Educ, col=c("#944651","#62a19e","#627ba1"), main= 'valor do salário de acordo com a formação',xlab = "Escolaridade",ylab= "Salário")

## R: Quem exerce cargo administrativo e possui ensino superior ganha mais, uma vez que é visível no gráfico que quem tem cargo administrativo tem uma média salarial maior e quanto maior seu nível de escolaridade, maior o seu salário.

CRIAÇÃO DE UMA NOVA VÁRIAVEL

gujarati_empresa_tecnologia["Escolaridade"] <- gujarati_empresa_tecnologia$Educ
gujarati_empresa_tecnologia$Escolaridade <- ifelse(gujarati_empresa_tecnologia$Escolaridade==1,"Ensino médio", "Ensino superior")
flextable(gujarati_empresa_tecnologia)

Transformação da variável Educ em faixas de experiência

gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")
gujarati_empresa_tecnologia$Exp <- cut(gujarati_empresa_tecnologia$Exp, breaks = c(1, 4, 6, 9, 11, 20) , c("pouca experiência", "5-6 anos", "média experiência","10-11 anos","muita experiência") , include.lowest = TRUE, right = TRUE)

QUESTÃO 10- Faça a transformação da experiência em três faixas de experiência.

gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")
gujarati_empresa_tecnologia$Exp <- cut(gujarati_empresa_tecnologia$Exp, breaks = c(1, 4, 6, 9, 11, 20) , c("pouca experiência", "5-6 anos", "média experiência","10-11 anos","muita experiência") , include.lowest = TRUE, right = TRUE)

QUESTÃO 11 - Quantas pessoas estão em cada categoria dessa nova variável faixas de experiência ?

tab_exp <-table(gujarati_empresa_tecnologia$Exp) %>% data.frame %>% rename(Experiência=Var1,Quantidade=Freq) %>% flextable %>% theme_box()
tab_exp

R: No total, tem 33 pessoas distribuídas nas três faixas de experiência

QUESTÃO 12 -Qual o salário médio, mediano e o desvio-padrão de cada categoria dessa nova variável faixas de experiência?

gujarati_empresa_tecnologia %>% select(Salario,Exp) %>% group_by(Exp) %>% summarise(Mediana=median(Salario),Media=round(mean(Salario),2),Desvio_padrão=round(sd(Salario),2)) %>% flextable() %>% theme_tron_legacy()

QUESTÃO 13 -Existe algum efeito no salário da interação da (faixa de) experiência com a educação?

gujarati_empresa_tecnologia$Educ <- ifelse(gujarati_empresa_tecnologia$Educ==1,"ensino médio completo",ifelse(gujarati_empresa_tecnologia$Educ==2,"graduação completa","pós graduação"))

boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Exp, col=c("purple","green","pink","aquamarine","grey"), main= 'Valor do salário de acordo com a experiência',xlab = "Nível de experiência",ylab = "Salário")

boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Educ, col=c("blue","orange","pink"), main= 'valor do salário de acordo com a formação',xlab = "Escolaridade",ylab= "Salário")

## R: Quanto maior sua experiência e sua formação, maior será o seu salário na empresa, como é visível pelas médias e caixas dos gráficos

QUESTÃO 14- Existe alguma forma de avaliar o impacto simultâneo das variáveis experiência, educação e cargo administrativo no salário?

gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")

gujarati_empresa_tecnologia <- gujarati_empresa_tecnologia %>% dplyr::mutate(Escolaridade =ifelse(Educ == "1","Ensino medio","Ensino superior"))

diagrama <-ggplot(gujarati_empresa_tecnologia, aes(y = Salario, x = Exp, shape = Escolaridade                                   , color = Escolaridade)) + geom_smooth(formula = y ~ x, method = "lm", aes(x = Exp, y = Salario)) + geom_point(size = 3, alpha = .4) + theme_economist(base_size = 12) + theme_calc(base_size = 12) + theme(legend.position = "top") + xlab("Anos de experiência") + ylab("Salário") 
diagrama

A partir de todos os gráficos, é possível deduzir que quem possui maior experiência, ensino superior e possui um cargo administrativo tem um alto salário. A interação entre essas três variáveis influencia sim no salário, podendo aumentar ou diminuir ele.