R Markdown

library(readxl)
library(flextable)
library(dplyr)
library(corrplot)
library(readr)
Escola_Oliver <- read_delim("Base_de_dados-master/Escola_Oliveira_p_Livro_DMQ.csv", 
                            delim = ";", escape_double = FALSE, locale = locale(), 
                            trim_ws = TRUE)
View(Escola_Oliver)

Escola_Oliver$anos_trabalho=as.numeric(sub(",",".",sub(".","",Escola_Oliver$anos_trabalho,fixed=TRUE),fixed = TRUE))
Escola_Oliver$sexo=ifelse(Escola_Oliver$sexo==1,"Masculino","Feminino")
Escola_Oliver$raca=ifelse(Escola_Oliver$raca==1,"Minoria","Branco")
Escola_Oliver$casado=ifelse(Escola_Oliver$casado==1,"Sim","Não")
Escola_Oliver$grau_pagamento=ifelse(Escola_Oliver$grau_pagamento==1,
                                    "Professor Substituto 1",ifelse(Escola_Oliver$grau_pagamento==2,
                                    "Professor Titular","Professor Senior"))

head(Escola_Oliver) %>% data.frame() %>% flextable()  %>% theme_box()
str(Escola_Oliver)
## spc_tbl_ [420 × 9] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id            : num [1:420] 1 2 3 4 5 6 7 8 9 10 ...
##  $ grau_pagamento: chr [1:420] "Professor Substituto 1" "Professor Substituto 1" "Professor Titular" "Professor Substituto 1" ...
##  $ sexo          : chr [1:420] "Masculino" "Masculino" "Masculino" "Feminino" ...
##  $ raca          : chr [1:420] "Minoria" "Branco" "Branco" "Minoria" ...
##  $ casado        : chr [1:420] "Não" "Não" "Não" "Não" ...
##  $ idade         : num [1:420] NA 25 23 26 22 23 31 21 31 38 ...
##  $ anos_trabalho : num [1:420] 0.5 2.4 3.6 1.9 3.4 2.8 2.3 0.4 3 1.4 ...
##  $ desempenho    : num [1:420] 2 3 7 3 6 4 3 2 5 3 ...
##  $ salario       : num [1:420] 890 1100 1070 1190 1290 1010 990 880 1520 1290 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   id = col_double(),
##   ..   grau_pagamento = col_double(),
##   ..   sexo = col_double(),
##   ..   raca = col_double(),
##   ..   casado = col_double(),
##   ..   idade = col_double(),
##   ..   anos_trabalho = col_character(),
##   ..   desempenho = col_double(),
##   ..   salario = col_double()
##   .. )
##  - attr(*, "problems")=<externalptr>

Hipóteses

  1. Quanto mais anos trabalhados maior o salário.

  2. Quanto maior o desempenho maior o salário.

  3. Quanto maior a idade do funcionário maior o salário.

Variável resposta: salário

Variáveis explicativas: anos de trabalho, desempenho e idade.

Diagrama de dispersão

  1. Salário por anos trabalhados
plot(Escola_Oliver$anos_trabalho,Escola_Oliver$salario,pch=19,col="blue",
     main="Diagrama de dispersão do salário pelos anos de trabalho",xlab="Anos trabalhados",ylab="Salário")
abline(lsfit(Escola_Oliver$anos_trabalho,Escola_Oliver$salario),col="red")

1.1) Coeficiente de correlação

cor(Escola_Oliver$salario,Escola_Oliver$anos_trabalho)
## [1] 0.7510329
  1. Salário por desempenho
plot(Escola_Oliver$desempenho,Escola_Oliver$salario,pch=19,col="green",
     main="Diagrama de dispersão do salário pelo desempenho",xlab="Desempenho",ylab="Salário")
abline(lsfit(Escola_Oliver$desempenho,Escola_Oliver$salario),col="blue")

2.1) Coeficiente de correlação

cor(Escola_Oliver$salario,Escola_Oliver$desempenho)
## [1] 0.8346379
  1. Salário por idade do funcionário
plot(Escola_Oliver$idade,Escola_Oliver$salario,pch=19,col="purple",
     main="Diagrama de dispersão do salário pela idade",xlab="Idade",ylab="Salário")
abline(lsfit(Escola_Oliver$idade,Escola_Oliver$salario),col="pink")

3.1) Coeficiente de correlação

Escola_Oliver_sem_dados_faltantes = na.omit(Escola_Oliver)
cor(Escola_Oliver_sem_dados_faltantes$salario,Escola_Oliver_sem_dados_faltantes$idade)
## [1] 0.09012435

Matriz de correlação

Variaveis_quantitativas=c("idade","anos_trabalho","desempenho","salario")
Escola_Oliver%>%select(Variaveis_quantitativas)%>%cor()%>%corrplot(method="number")

Análise dos dados tratados

A partir da base de dados Escola_Oliver gráficos e tabelas foram construídos e por meio desses informações relevantes puderam ser observadas, principalmente, a partir das variáveis quantitativas. Sendo o salário a variável resposta e as variáveis explicativas os anos de trabalho, desempenho e idade dos funcionários.

Por meio do diagrama de dispersão do salário por anos trabalhados é possível observar uma correlação politiva forte na qual quanto mais o tem passa maior é o salário do funcionário. Pode-se perceber também que quanto maior o desempenho maior o salário do funciónário, possuindo uma correlação positiva forte.

Por outro lado, o diagrama de dispersão do salário pela idade do funcionário apresenta uma correlação nula, evitenciando o fato de a idade do funcionário não influenciar a sua remuneração.

As análise realizadas acima também podem ser percebidas por meio do coeficiente de correlação entre as vatiáveis, sendo valores próximos de -1 FORTE e NEGATIVA; valores próximos de 1 FORTE e POSITIVO e valores próximos ou igual a 0 CORRELAÇÃO NULA.

Concluísse, portanto, que das três hipóteses criadas no início da pesquisa apenas duas verdadeiramente se comprovam de fato.