library(dplyr)
library(ggplot2)
library(flextable)
library(ggthemes)
library(readxl)
gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")
tabela_1 <- table(gujarati_empresa_tecnologia$Educ) %>% data.frame()
tabela_1 <- tabela_1 %>% rename(escolaridade=Var1,Quantidade=Freq)
flextable(data.frame(tabela_1)) %>% theme_vader()
escolaridade | Quantidade |
1 | 12 |
2 | 21 |
3 | 13 |
gujarati_empresa_tecnologia$Educ <- ifelse(gujarati_empresa_tecnologia$Educ==1,"ensino médio completo",ifelse(gujarati_empresa_tecnologia$Educ==2,"graduação completa","pós graduação"))
gujarati_empresa_tecnologia %>% select(Salario,Educ) %>% group_by(Educ) %>% summarise(Minimo=min(Salario),Maximo=max(Salario)) %>% flextable %>% theme_tron()
Educ | Minimo | Maximo |
ensino médio completo | 1,053.5 | 1,934.6 |
graduação completa | 1,128.3 | 2,783.7 |
pós graduação | 1,160.8 | 2,568.5 |
prop_tabela <- round(prop.table(table(gujarati_empresa_tecnologia$Educ))*100,2)
prop_tabela %>% data.frame() %>% rename(escolaridade=Var1,Percentual=Freq) %>% flextable %>% theme_booktabs()
escolaridade | Percentual |
ensino médio completo | 26.09 |
graduação completa | 45.65 |
pós graduação | 28.26 |
Transformando variável
gujarati_empresa_tecnologia$Adm <- ifelse(gujarati_empresa_tecnologia$Adm==0,"não exerce","exerce cargo administrativo")
tabela_quali <- table(gujarati_empresa_tecnologia$Educ,gujarati_empresa_tecnologia$Adm) %>% prop.table() %>% round(3) %>% data.frame() %>% rename(Escolaridade=Var1,Cargo_adm=Var2,Percentual=Freq) %>% flextable %>% theme_vader()
tabela_quali
Escolaridade | Cargo_adm | Percentual |
ensino médio completo | exerce cargo administrativo | 0.065 |
graduação completa | exerce cargo administrativo | 0.196 |
pós graduação | exerce cargo administrativo | 0.174 |
ensino médio completo | não exerce | 0.196 |
graduação completa | não exerce | 0.261 |
pós graduação | não exerce | 0.109 |
tabela_coluna<- table(gujarati_empresa_tecnologia$Educ,gujarati_empresa_tecnologia$Adm) %>% prop.table(2) %>% round(2) %>% data.frame() %>% rename(Escolaridade=Var1,Cargo_adm=Var2,Percentual=Freq) %>% flextable %>% theme_vader()
tabela_coluna
Escolaridade | Cargo_adm | Percentual |
ensino médio completo | exerce cargo administrativo | 0.15 |
graduação completa | exerce cargo administrativo | 0.45 |
pós graduação | exerce cargo administrativo | 0.40 |
ensino médio completo | não exerce | 0.35 |
graduação completa | não exerce | 0.46 |
pós graduação | não exerce | 0.19 |
boxplot(gujarati_empresa_tecnologia$Salario ~ gujarati_empresa_tecnologia$Educ, col=c("blue","pink","purple"), main= 'Salário de acordo com o nível de escolaridade',xlab = "nível de escolaridade",ylab = "valor do salário")
boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Adm, col=c("#942272","#229426"), main= 'Salário de acordo com o cargo',xlab = "cargo administrativo",ylab = "valor do salário")
gujarati_empresa_tecnologia %>% select(Salario,Adm) %>% group_by(Adm) %>% summarise(Minimo=min(Salario),Mediana=median(Salario),Media=round(mean(Salario),2),Desvio_padrão=round(sd(Salario),2),Maximo=max(Salario)) %>% flextable %>% theme_box()
Adm | Minimo | Mediana | Media | Desvio_padrão | Maximo |
exerce cargo administrativo | 1,387.6 | 2,136.15 | 2,115.05 | 392.43 | 2,783.7 |
não exerce | 1,053.5 | 1,361.25 | 1,424.68 | 267.41 | 1,934.6 |
plot(gujarati_empresa_tecnologia$Exp,gujarati_empresa_tecnologia$Salario,pch=20,col="orange",main= "Gráfico relacionando a experiência e o salário",xlab="experiência",ylab="Salário")
abline(lsfit(gujarati_empresa_tecnologia$Exp,gujarati_empresa_tecnologia$Salario),col="black")
library(corrplot)
mcc <- gujarati_empresa_tecnologia %>% select(Exp,Salario) %>% cor()
corrplot(mcc,method = "number")
gujarati_empresa_tecnologia %>% mutate(Educação = ifelse (Educ > 1, "Ensino Superior", "Ensino Médio"))
## # A tibble: 46 × 7
## id Exp Educ Posg Adm Salario Educação
## <dbl> <dbl> <chr> <dbl> <chr> <dbl> <chr>
## 1 1 1 graduação completa 0 exerce cargo admini… 1388. Ensino …
## 2 2 1 pós graduação 1 não exerce 1161. Ensino …
## 3 3 1 pós graduação 1 exerce cargo admini… 1870. Ensino …
## 4 4 1 graduação completa 0 não exerce 1128. Ensino …
## 5 5 1 pós graduação 1 não exerce 1177. Ensino …
## 6 6 2 graduação completa 0 exerce cargo admini… 2087. Ensino …
## 7 7 2 graduação completa 0 não exerce 1177. Ensino …
## 8 8 2 ensino médio completo 0 não exerce 1054. Ensino …
## 9 9 2 pós graduação 1 não exerce 1220. Ensino …
## 10 10 3 graduação completa 0 não exerce 1231. Ensino …
## # … with 36 more rows
boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Adm, col=c("red","yellow"), main= 'Valor do salário de acordo com o cargo',xlab = "Cargo administrativo",ylab = "Salário")
boxplot(gujarati_empresa_tecnologia$Salario ~ gujarati_empresa_tecnologia$Educ, col=c("#944651","#62a19e","#627ba1"), main= 'valor do salário de acordo com a formação',xlab = "Escolaridade",ylab= "Salário")
## R: Quem exerce cargo administrativo e possui ensino superior ganha
mais, uma vez que é visível no gráfico que quem tem cargo administrativo
tem uma média salarial maior e quanto maior seu nível de escolaridade,
maior o seu salário.
gujarati_empresa_tecnologia["Escolaridade"] <- gujarati_empresa_tecnologia$Educ
gujarati_empresa_tecnologia$Escolaridade <- ifelse(gujarati_empresa_tecnologia$Escolaridade==1,"Ensino médio", "Ensino superior")
flextable(gujarati_empresa_tecnologia)
id | Exp | Educ | Posg | Adm | Salario | Escolaridade |
1 | 1 | graduação completa | 0 | exerce cargo administrativo | 1,387.6 | Ensino superior |
2 | 1 | pós graduação | 1 | não exerce | 1,160.8 | Ensino superior |
3 | 1 | pós graduação | 1 | exerce cargo administrativo | 1,870.1 | Ensino superior |
4 | 1 | graduação completa | 0 | não exerce | 1,128.3 | Ensino superior |
5 | 1 | pós graduação | 1 | não exerce | 1,176.7 | Ensino superior |
6 | 2 | graduação completa | 0 | exerce cargo administrativo | 2,087.2 | Ensino superior |
7 | 2 | graduação completa | 0 | não exerce | 1,177.2 | Ensino superior |
8 | 2 | ensino médio completo | 0 | não exerce | 1,053.5 | Ensino superior |
9 | 2 | pós graduação | 1 | não exerce | 1,219.5 | Ensino superior |
10 | 3 | graduação completa | 0 | não exerce | 1,231.3 | Ensino superior |
11 | 3 | ensino médio completo | 0 | exerce cargo administrativo | 1,497.5 | Ensino superior |
12 | 3 | graduação completa | 0 | exerce cargo administrativo | 2,137.1 | Ensino superior |
13 | 3 | pós graduação | 1 | exerce cargo administrativo | 1,980.0 | Ensino superior |
14 | 4 | ensino médio completo | 0 | não exerce | 1,141.7 | Ensino superior |
15 | 4 | pós graduação | 1 | exerce cargo administrativo | 2,026.3 | Ensino superior |
16 | 4 | pós graduação | 1 | não exerce | 1,223.1 | Ensino superior |
17 | 4 | graduação completa | 0 | não exerce | 1,288.4 | Ensino superior |
18 | 5 | pós graduação | 1 | não exerce | 1,324.5 | Ensino superior |
19 | 5 | graduação completa | 0 | não exerce | 1,367.7 | Ensino superior |
20 | 5 | graduação completa | 1 | exerce cargo administrativo | 1,596.5 | Ensino superior |
21 | 6 | ensino médio completo | 0 | não exerce | 1,233.6 | Ensino superior |
22 | 6 | pós graduação | 1 | exerce cargo administrativo | 2,135.2 | Ensino superior |
23 | 6 | graduação completa | 0 | não exerce | 1,383.9 | Ensino superior |
24 | 6 | graduação completa | 0 | exerce cargo administrativo | 2,288.4 | Ensino superior |
25 | 7 | ensino médio completo | 0 | exerce cargo administrativo | 1,697.8 | Ensino superior |
26 | 8 | graduação completa | 0 | não exerce | 1,480.3 | Ensino superior |
27 | 8 | ensino médio completo | 0 | exerce cargo administrativo | 1,740.4 | Ensino superior |
28 | 8 | pós graduação | 1 | exerce cargo administrativo | 2,218.4 | Ensino superior |
29 | 8 | ensino médio completo | 0 | não exerce | 1,354.8 | Ensino superior |
30 | 10 | ensino médio completo | 0 | não exerce | 1,446.7 | Ensino superior |
31 | 10 | graduação completa | 0 | não exerce | 1,594.2 | Ensino superior |
32 | 10 | pós graduação | 1 | exerce cargo administrativo | 2,317.4 | Ensino superior |
33 | 10 | graduação completa | 0 | exerce cargo administrativo | 2,378.0 | Ensino superior |
34 | 11 | graduação completa | 0 | exerce cargo administrativo | 2,541.0 | Ensino superior |
35 | 11 | ensino médio completo | 0 | não exerce | 1,486.1 | Ensino superior |
36 | 12 | graduação completa | 0 | não exerce | 1,688.2 | Ensino superior |
37 | 12 | pós graduação | 1 | exerce cargo administrativo | 2,417.0 | Ensino superior |
38 | 13 | ensino médio completo | 0 | não exerce | 1,599.0 | Ensino superior |
39 | 13 | graduação completa | 0 | exerce cargo administrativo | 2,633.0 | Ensino superior |
40 | 14 | graduação completa | 0 | não exerce | 1,794.9 | Ensino superior |
41 | 15 | pós graduação | 1 | exerce cargo administrativo | 2,568.5 | Ensino superior |
42 | 16 | graduação completa | 0 | exerce cargo administrativo | 2,783.7 | Ensino superior |
43 | 16 | graduação completa | 0 | não exerce | 1,883.8 | Ensino superior |
44 | 16 | ensino médio completo | 0 | não exerce | 1,748.3 | Ensino superior |
45 | 17 | graduação completa | 0 | não exerce | 1,920.7 | Ensino superior |
46 | 20 | ensino médio completo | 0 | não exerce | 1,934.6 | Ensino superior |
gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")
gujarati_empresa_tecnologia$Exp <- cut(gujarati_empresa_tecnologia$Exp, breaks = c(1, 4, 6, 9, 11, 20) , c("pouca experiência", "5-6 anos", "média experiência","10-11 anos","muita experiência") , include.lowest = TRUE, right = TRUE)
gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")
gujarati_empresa_tecnologia$Exp <- cut(gujarati_empresa_tecnologia$Exp, breaks = c(1, 4, 6, 9, 11, 20) , c("pouca experiência", "5-6 anos", "média experiência","10-11 anos","muita experiência") , include.lowest = TRUE, right = TRUE)
tab_exp <-table(gujarati_empresa_tecnologia$Exp) %>% data.frame %>% rename(Experiência=Var1,Quantidade=Freq) %>% flextable %>% theme_box()
tab_exp
Experiência | Quantidade |
pouca experiência | 17 |
5-6 anos | 7 |
média experiência | 5 |
10-11 anos | 6 |
muita experiência | 11 |
gujarati_empresa_tecnologia %>% select(Salario,Exp) %>% group_by(Exp) %>% summarise(Mediana=median(Salario),Media=round(mean(Salario),2),Desvio_padrão=round(sd(Salario),2)) %>% flextable() %>% theme_tron_legacy()
Exp | Mediana | Media | Desvio_padrão |
pouca experiência | 1,231.3 | 1,458.02 | 390.49 |
5-6 anos | 1,383.9 | 1,618.54 | 422.05 |
média experiência | 1,697.8 | 1,698.34 | 330.83 |
10-11 anos | 1,955.8 | 1,960.57 | 502.37 |
muita experiência | 1,920.7 | 2,088.34 | 425.87 |
gujarati_empresa_tecnologia$Educ <- ifelse(gujarati_empresa_tecnologia$Educ==1,"ensino médio completo",ifelse(gujarati_empresa_tecnologia$Educ==2,"graduação completa","pós graduação"))
boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Exp, col=c("purple","green","pink","aquamarine","grey"), main= 'Valor do salário de acordo com a experiência',xlab = "Nível de experiência",ylab = "Salário")
boxplot(gujarati_empresa_tecnologia$Salario ~gujarati_empresa_tecnologia$Educ, col=c("blue","orange","pink"), main= 'valor do salário de acordo com a formação',xlab = "Escolaridade",ylab= "Salário")
## R: Quanto maior sua experiência e sua formação, maior será o seu
salário na empresa, como é visível pelas médias e caixas dos
gráficos
gujarati_empresa_tecnologia <- read_excel("C:/Users/npm25/Downloads/gujarati_empresa_tecnologia.xlsx")
gujarati_empresa_tecnologia <- gujarati_empresa_tecnologia %>% dplyr::mutate(Escolaridade =ifelse(Educ == "1","Ensino medio","Ensino superior"))
diagrama <-ggplot(gujarati_empresa_tecnologia, aes(y = Salario, x = Exp, shape = Escolaridade , color = Escolaridade)) + geom_smooth(formula = y ~ x, method = "lm", aes(x = Exp, y = Salario)) + geom_point(size = 3, alpha = .4) + theme_economist(base_size = 12) + theme_calc(base_size = 12) + theme(legend.position = "top") + xlab("Anos de experiência") + ylab("Salário")
diagrama