Nesse último trabalho de estatística, foi carregada a base de dados “gujarati_empresa_tecnologia.xlsx”, onde a mesma, foi alterada para o nome “gurajati”. Além disso, foram utilizados alguns pacotes, como os sugeridos pelo professor: readxl, dplyr, ggplot2, e ggthemes.
library(readxl)
gujarati <- read_excel("C:/Users/rober/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
View(gujarati)
gurajati <- read_excel("C:/Users/rober/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
library(dplyr)
library(ggplot2)
library(flextable)
library(readr)
library(corrplot)
library(DT)
library(ggthemes)
library(readxl)
datatable(gujarati)
Quantas pessoas com graduação completa existem na empresa Gujarati? Existem 21 pessoas com graduação completa.
tabela_1 <- table(gujarati$Educ) %>% data.frame()
tabela_1 <- tabela_1 %>% rename(EDUC=Var1,NUMERO=Freq)
tabela_1 %>% flextable() %>% theme_zebra()
EDUC | NUMERO |
1 | 12 |
2 | 21 |
3 | 13 |
Qual é o salário mais baixo da empresa? Qual a escolaridade dessa pessoa? Qual a experiência? Essa pessoa recebe R$ 1053 de salário, possui ensino médio completo e tem 2 anos de experiência.
gujarati$Salario -> Salario
tabela_2 <- table(gujarati$Salario)
min(Salario)
## [1] 1053.5
Qual a proporção de pessoas com pós-graduação na empresa Gujarati? Nessa empresa 30% das pessoas possuem pós-graduação, sendo 14 trabalhadores.
tabela_3 <- table(gujarati$Posg)
tabela_3
##
## 0 1
## 32 14
round(prop.table(tabela_3)*100)
##
## 0 1
## 70 30
Qual a proporção de pessoas com pós-graduação exercendo cargos administrativos na empresa Gujarati? Nessa empresa 17% das pessoas possuem pós-graduação e trabalham na área administrativa, logo, são 8 trabalhadores.
tabela_4 <- table(gurajati$Adm,gurajati$Educ)
tabela_4
##
## 1 2 3
## 0 9 12 5
## 1 3 9 8
round(prop.table(tabela_4)*100)
##
## 1 2 3
## 0 20 26 11
## 1 7 20 17
Qual o impacto da escolaridade no salário? Diante do gráfico desenvolvido, observa-se que a escolaridade não possui tanto impacto no salário, uma vez que, existem pessoas com ensino médio completo (nível 1) ganhando mais que pessoas com graduação completa (nível 2) e pessoas de pós-graduação (nível 3), ganhando menos que pessoas de graduação completa (nível 2).
plot(gurajati$Salario,gurajati$Educ,pch=20,col="orange",
main="Gráfico: Salário X Educação", xlab="Salário", ylab="Educação")
O fato de ter um cargo administrativo influência no salário? Sim, é possível notar que os trabalhadores que estão nos cargos de administração possuem os maiores salários, estando entre R$ 1500 e R$ 3000.
plot(gurajati$Salario,gurajati$Adm,pch=20,col="purple",
main="Gráfico: Salário X Cargo de Administrador", xlab="Salário", ylab="Administrador")
Qual o impacto da experiência no salário? Pode-se perceber que pessoas com menos experiência possuem a faixa salarial menor que pessoas com mais experiência. Logo, quanto mais experiência, maior será a faixa salarial.
plot(gujarati$Salario,gujarati$Exp,pch=20,col="blue",
main="Gráfico: Salário X Experiência", xlab= "Salário", ylab= "Experiência")
Seria possível criar uma nova variável com base na escolaridade? Faça uma nova variável com base na codificação abaixo:
Nova classificação:
UNIV = “ensino médio” (se Educ=1)
UNIV = “ensino superior” (se Educ=2 ou Educ=3)
library(tidyr)
gujarati <- separate(gurajati,"Educ",into="ENSINO SUPERIOR",sep="1",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 12 rows [8, 11, 14,
## 21, 25, 27, 29, 30, 35, 38, 44, 46].
gurajati <- separate(gurajati,"Educ",into="ENSINO MEDIO",sep="2",remove=FALSE)
## Warning: Expected 1 pieces. Additional pieces discarded in 21 rows [1, 4, 6, 7,
## 10, 12, 17, 19, 20, 23, 24, 26, 31, 33, 34, 36, 39, 40, 42, 43, ...].
gurajati <- separate(gurajati,"ENSINO MEDIO",into="Ensino Medio",sep="3",remove=TRUE)
## Warning: Expected 1 pieces. Additional pieces discarded in 13 rows [2, 3, 5, 9,
## 13, 15, 16, 18, 22, 28, 32, 37, 41].
Existe algum efeito no salário da interação do fato da pessoa estar em cargo administrativo (atividade meio) ou não (atividade fim da empresa) com a educação? Diante do gráfico apresentado, quando o valor está entre 0.20 e 0.39, a correlação é fraca. Já, quando o valor está entre 0.70 e 0.89, é muito forte e quando estiver entre 0.90 e 1.0 é muito forte.
mc <- gurajati %>% select(Educ, Adm, Salario) %>% cor()
selecao <- c("educação", "Cargo adm", "salario")
corrplot(mc, method = "number")
Faça a transformação da experiência em três faixas de experiência.
library(readxl)
gujarati_empresa_tecnologia <- read_excel("C:/Users/rober/Desktop/Base_de_dados-master/gujarati_empresa_tecnologia.xlsx")
View(gujarati_empresa_tecnologia)
gujarati_empresa_tecnologia$Exp <- ifelse(gujarati_empresa_tecnologia$Exp<6,"pouca experiencia",ifelse(gujarati_empresa_tecnologia$Exp>10,"muita experiencia","media experiencia"))
Quantas pessoas estão em cada categoria dessa nova variável faixas de experiência ?
1 - 20 = pouca experiência
21 - 33 = média experiência
34 - 46 = muita experiência
Qual o salário médio, mediano e o desvio-padrão de cada categoria dessa nova variável faixas de experiência?
gujarati_empresa_tecnologia %>% select(Salario,Exp) %>% group_by(Exp) %>%
summarise(Mediana=median(Salario), Minimo=min(Salario), Maximo=max(Salario), Media=mean(Salario),desvio_padrao=round(sd(Salario),2))%>% flextable() %>% theme_zebra()
Exp | Mediana | Minimo | Maximo | Media | desvio_padrao |
media experiencia | 1,697.80 | 1,233.6 | 2,378.0 | 1,789.931 | 418.52 |
muita experiencia | 1,920.70 | 1,486.1 | 2,783.7 | 2,076.831 | 445.30 |
pouca experiencia | 1,306.45 | 1,053.5 | 2,137.1 | 1,453.750 | 361.62 |
MEDIANA DE:
R$1.306,45 - POUCA EXPERIÊNCIA
R$1.697,15 - MÉDIA EXPERIÊNCIA
R$1.920,70 - MUITA EXPERIÊNCIA
MEDIA DE:
R$ 1.453,75 - POUCA EXPERIÊNCIA
R$ 1.789,93 - MÉDIA EXPERIÊNCIA
R$ 2.076,83 - MUITA EXPERIÊNCIA
DESVIO PADRÃO DE:
361,61 - POUCA EXPERIÊNCIA
418,52 - MÉDIA EXPERIÊNCIA
445,29 - MUITA EXPERIÊNCIA