library(readxl)
library(flextable)
library(dplyr)
library(corrplot)
library(readr)
Escola_Oliver <- read_delim("Base_de_dados-master/Escola_Oliveira_p_Livro_DMQ.csv",
delim = ";", escape_double = FALSE, locale = locale(),
trim_ws = TRUE)
View(Escola_Oliver)
Escola_Oliver$anos_trabalho=as.numeric(sub(",",".",sub(".","",Escola_Oliver$anos_trabalho,fixed=TRUE),fixed = TRUE))
Escola_Oliver$sexo=ifelse(Escola_Oliver$sexo==1,"Masculino","Feminino")
Escola_Oliver$raca=ifelse(Escola_Oliver$raca==1,"Minoria","Branco")
Escola_Oliver$casado=ifelse(Escola_Oliver$casado==1,"Sim","Não")
Escola_Oliver$grau_pagamento=ifelse(Escola_Oliver$grau_pagamento==1,
"Professor Substituto 1",ifelse(Escola_Oliver$grau_pagamento==2,
"Professor Titular","Professor Senior"))
head(Escola_Oliver) %>% data.frame() %>% flextable() %>% theme_box()
id | grau_pagamento | sexo | raca | casado | idade | anos_trabalho | desempenho | salario |
1 | Professor Substituto 1 | Masculino | Minoria | Não | 0.5 | 2 | 890 | |
2 | Professor Substituto 1 | Masculino | Branco | Não | 25 | 2.4 | 3 | 1,100 |
3 | Professor Titular | Masculino | Branco | Não | 23 | 3.6 | 7 | 1,070 |
4 | Professor Substituto 1 | Feminino | Minoria | Não | 26 | 1.9 | 3 | 1,190 |
5 | Professor Titular | Masculino | Branco | Sim | 22 | 3.4 | 6 | 1,290 |
6 | Professor Substituto 1 | Masculino | Minoria | Sim | 23 | 2.8 | 4 | 1,010 |
str(Escola_Oliver)
## spc_tbl_ [420 × 9] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:420] 1 2 3 4 5 6 7 8 9 10 ...
## $ grau_pagamento: chr [1:420] "Professor Substituto 1" "Professor Substituto 1" "Professor Titular" "Professor Substituto 1" ...
## $ sexo : chr [1:420] "Masculino" "Masculino" "Masculino" "Feminino" ...
## $ raca : chr [1:420] "Minoria" "Branco" "Branco" "Minoria" ...
## $ casado : chr [1:420] "Não" "Não" "Não" "Não" ...
## $ idade : num [1:420] NA 25 23 26 22 23 31 21 31 38 ...
## $ anos_trabalho : num [1:420] 0.5 2.4 3.6 1.9 3.4 2.8 2.3 0.4 3 1.4 ...
## $ desempenho : num [1:420] 2 3 7 3 6 4 3 2 5 3 ...
## $ salario : num [1:420] 890 1100 1070 1190 1290 1010 990 880 1520 1290 ...
## - attr(*, "spec")=
## .. cols(
## .. id = col_double(),
## .. grau_pagamento = col_double(),
## .. sexo = col_double(),
## .. raca = col_double(),
## .. casado = col_double(),
## .. idade = col_double(),
## .. anos_trabalho = col_character(),
## .. desempenho = col_double(),
## .. salario = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
Hipóteses
Quanto mais anos trabalhados maior o salário.
Quanto maior o desempenho maior o salário.
Quanto maior a idade do funcionário maior o salário.
Variável resposta: salário
Variáveis explicativas: anos de trabalho, desempenho e idade.
Diagrama de dispersão
plot(Escola_Oliver$anos_trabalho,Escola_Oliver$salario,pch=19,col="blue",
main="Diagrama de dispersão do salário pelos anos de trabalho",xlab="Anos trabalhados",ylab="Salário")
abline(lsfit(Escola_Oliver$anos_trabalho,Escola_Oliver$salario),col="red")
1.1) Coeficiente de correlação
cor(Escola_Oliver$salario,Escola_Oliver$anos_trabalho)
## [1] 0.7510329
plot(Escola_Oliver$desempenho,Escola_Oliver$salario,pch=19,col="green",
main="Diagrama de dispersão do salário pelo desempenho",xlab="Desempenho",ylab="Salário")
abline(lsfit(Escola_Oliver$desempenho,Escola_Oliver$salario),col="blue")
2.1) Coeficiente de correlação
cor(Escola_Oliver$salario,Escola_Oliver$desempenho)
## [1] 0.8346379
plot(Escola_Oliver$idade,Escola_Oliver$salario,pch=19,col="purple",
main="Diagrama de dispersão do salário pela idade",xlab="Idade",ylab="Salário")
abline(lsfit(Escola_Oliver$idade,Escola_Oliver$salario),col="pink")
3.1) Coeficiente de correlação
Escola_Oliver_sem_dados_faltantes = na.omit(Escola_Oliver)
cor(Escola_Oliver_sem_dados_faltantes$salario,Escola_Oliver_sem_dados_faltantes$idade)
## [1] 0.09012435
Matriz de correlação
Variaveis_quantitativas=c("idade","anos_trabalho","desempenho","salario")
Escola_Oliver%>%select(Variaveis_quantitativas)%>%cor()%>%corrplot(method="number")
Análise dos dados tratados
A partir da base de dados Escola_Oliver gráficos e tabelas foram construídos e por meio desses informações relevantes puderam ser observadas, principalmente, a partir das variáveis quantitativas. Sendo o salário a variável resposta e as variáveis explicativas os anos de trabalho, desempenho e idade dos funcionários.
Por meio do diagrama de dispersão do salário por anos trabalhados é possível observar uma correlação politiva forte na qual quanto mais o tem passa maior é o salário do funcionário. Pode-se perceber também que quanto maior o desempenho maior o salário do funciónário, possuindo uma correlação positiva forte.
Por outro lado, o diagrama de dispersão do salário pela idade do funcionário apresenta uma correlação nula, evitenciando o fato de a idade do funcionário não influenciar a sua remuneração.
As análise realizadas acima também podem ser percebidas por meio do coeficiente de correlação entre as vatiáveis, sendo valores próximos de -1 FORTE e NEGATIVA; valores próximos de 1 FORTE e POSITIVO e valores próximos ou igual a 0 CORRELAÇÃO NULA.
Concluísse, portanto, que das três hipóteses criadas no início da pesquisa apenas duas verdadeiramente se comprovam de fato.