library(readxl)
library(dplyr)
library(tidyverse)
library(reactable)
library(formattable)
library(ggplot2)
library(ggthemes)
gujarati_tec <- read_excel("C:/Users/Kelly Grigorio/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
gujarati_tec$Educ <- ifelse(gujarati_tec$Educ==1,"Ens. Médio",
ifelse(gujarati_tec$Educ==2,"Graduação","Pós Graduação"))
gujarati_tec$Posg <- ifelse(gujarati_tec$Posg==1,"Sim","Não")
gujarati_tec$Adm <- ifelse(gujarati_tec$Adm==1,"Administrativo", "Outro cargo")
0.1 Quantas pessoas com graduação completa existem na empresa Gujarati?
graduacao=subset(gujarati_tec, Educ=='Graduação')
table(graduacao$Educ) %>%
data.frame() %>%
rename(Escolaridade=Var1,Total=Freq) %>%
reactable()
0.2 Qual é o salário mais baixo da empresa? Qual a escolaridade dessa pessoa? Qual a experiência?
min_salario=subset(gujarati_tec, Salario=='1053.5')
table(min_salario$Salario, min_salario$Educ, min_salario$Exp) %>%
data.frame() %>%
rename(Salário=Var1,Escolaridade=Var2,Experiência=Var3,Total=Freq) %>%
reactable()
0.3 Qual a proporção de pessoas com pós-graduação na empresa Gujarati?
table(gujarati_tec$Educ) %>%
prop.table() %>%
`*`(100) %>%
round(2) %>%
data.frame() %>%
rename(Escolaridade=Var1,Total=Freq) %>%
reactable()
A proporção de pessoas com pós-graduação são de 28,26%
0.4 Qual a proporção de pessoas com pós-graduação exercendo cargos administrativos na empresa Gujarati?
table(gujarati_tec$Educ, gujarati_tec$Adm) %>%
prop.table() %>%
`*`(100) %>%
round(2) %>%
data.frame() %>%
rename(Escolaridade=Var1,Cargo=Var2,Total=Freq) %>%
reactable()
A proporção de pessoas com pós-graduação exercendo cargos administrativos são de 17,39%
0.5 Qual o impacto da escolaridade no salário?
gujarati_tec %>% select(Salario,Educ) %>%
group_by(Educ) %>%
summarise(
Mínimo=min(Salario),
Mediana=median(Salario),
Média=round(mean(Salario),2),
Desvio_Padrao=round(sd(Salario),2),
Máximo=max(Salario)) %>%
reactable()
É possível afirmar que as pessoas com título de pós graduação possuem maior média salárial.
0.6 O fato de ter um cargo administrativo influência no salário?
gujarati_tec %>% select(Salario,Adm) %>%
group_by(Adm) %>%
summarise(
Mínimo=min(Salario),
Mediana=median(Salario),
Média=round(mean(Salario),2),
Desvio_Padrao=round(sd(Salario),2),
Máximo=max(Salario)) %>%
reactable()
Sim. Pessoas com cargo administrativo possuem maior média salárial.
0.7 Qual o impacto da experiência no salário?
gujarati_tec["Exp2"]<-gujarati_tec$Exp
gujarati_tec$Exp2 <- ifelse(gujarati_tec$Exp2<=5,"Pouca Experiencia",
ifelse(gujarati_tec$Exp2>=11,"Muita Experiencia","Media Experiencia"))
gujarati_tec %>% select(Salario,Exp) %>%
group_by(Exp) %>%
summarise(
Mínimo=min(Salario),
Mediana=median(Salario),
Média=round(mean(Salario),2),
Desvio_Padrao=round(sd(Salario),2),
Máximo=max(Salario)) %>%
reactable()
ggplot(data = gujarati_tec, aes(y = Salario, x = Exp))+
geom_boxplot(aes(fill = Exp2))+
theme_stata()+
scale_colour_stata()
É possível afirmar que pessoas com maior experiência tendem a ganhar melhores salários já que a média do salário das pessoas com mais experiência se aproxima dos 2 mil reais.
0.8 Seria possível criar uma nova variável com base na escolaridade?
0.8.1 Faça uma nova variável com base na codificação abaixo:
Nova classificação:
UNIV = “ensino médio” (se Educ = Ensino Médio)
UNIV = “ensino superior” (se Educ = Graduação ou Educ = Pós Graduação)”
gujarati_tec <- read_excel("C:/Users/Kelly Grigorio/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
gujarati_tec["Univ"]<-gujarati_tec$Educ
gujarati_tec$Educ <- ifelse(gujarati_tec$Educ==1,"Ens. Médio",
ifelse(gujarati_tec$Educ==2,"Graduação","Pós Graduação"))
gujarati_tec$Posg <- ifelse(gujarati_tec$Posg==1,"Sim","Não")
gujarati_tec$Adm <- ifelse(gujarati_tec$Adm==1,"Administrativo", "Outro cargo")
gujarati_tec$Univ <- ifelse(gujarati_tec$Univ==1,"Ensino Médio", "Ensino Superior")
reactable(gujarati_tec)
0.8.2 Existe algum efeito no salário da interação do fato da pessoa estar em cargo administrativo (atividade meio) ou não (atividade fim da empresa) com a educação?
ggplot(data = gujarati_tec, aes(y = Salario, x = Adm))+
geom_boxplot(aes(fill = Univ))+
theme_stata()+
scale_colour_stata()
Pessoa com ensino superior e cargo administrativo possuem maior média salarial, segundo o boxplot, tendo apenas um outlier com salário inferior. Porém, vale ressaltar que pessoas em cargos não administrativos vão ter um salário inferior independente do grau de escolaridade, sendo que nesse caso pessoas com Ensino médio tem a média salarial maior que pessoas com ensino superior.
0.9 Faça a transformação da experiência em três faixas de experiência.
Menor que 5 anos = “pouca experiência”
Entre 6 e 10 anos = “média experiência”
Maior que 11 anos = “muita experiência”
gujarati_tec["Exp2"]<-gujarati_tec$Exp
gujarati_tec$Exp2 <- ifelse(gujarati_tec$Exp2<=5,"Pouca Experiencia",
ifelse(gujarati_tec$Exp2>=11,"Muita Experiencia","Media Experiencia"))
reactable(gujarati_tec)
0.10 Quantas pessoas estão em cada categoria dessa nova variável faixas de experiência ?
table(gujarati_tec$Exp2) %>%
data.frame() %>%
rename(Experiência=Var1,Total=Freq) %>%
reactable()
0.11 Qual o salário médio, mediano e o desvio-padrão de cada categoria dessa nova variável faixas de experiência?
gujarati_tec %>% select(Salario,Exp2) %>%
group_by(Exp2) %>%
summarise(
Mínimo=min(Salario),
Mediana=median(Salario),
Média=round(mean(Salario),2),
Desvio_Padrao=round(sd(Salario),2),
Máximo=max(Salario)) %>%
reactable()
0.12 Existe algum efeito no salário da interação da (faixa de) experiência com a educação?
ggplot(data = gujarati_tec, aes(y = Salario, x = Exp2))+
geom_boxplot(aes(fill = Univ))+
theme_stata()+
scale_colour_stata()
Pessoas com maior grau de experiência e de escolaridade tendem a ter maior média salarial.
0.13 Existe alguma forma de avaliar o impacto simultâneo das variáveis experiência, educação e cargo administrativo no salário?
ggplot(data = gujarati_tec, aes(y = Exp, x = Adm))+
geom_boxplot(aes(fill = Educ))+
theme_stata()+
scale_colour_stata()
0.14 Você conseguria refazer e interpretar um dos gráficos abaixo?
DICA 1: o primeiro gráfico foi feito com a função plot() do R básico.
DICA 2: o segundo foi feito com a função xyplot do pacote lattice.
DICA 3: Esse gráfico também poderia ser feito com a função geom_point do pacote ggplot2
ggplot(gujarati_tec, aes(y = Salario, x = Exp ,
shape = Univ, color = Univ)) +
geom_smooth(formula = y ~ x, method = "lm",
aes(x = Exp,
y = Salario))+
geom_point(size = 3, alpha = .4) +
theme_classic(base_size = 12) +
theme(legend.position = "top") +
xlab("Anos de Experiência") +
ylab("Salário")
Pessoas com ensino superior e mais tempo de experiência possuem maior salário