Base de dados:

library(readr)
Escola_Oliveira_p_Livro_DMQ <- read_delim("~/bases_curso_estatistica/Base_de_dados-master/Escola_Oliveira_p_Livro_DMQ.csv", delim = ";", escape_double = FALSE, locale = locale(encoding = "WINDOWS-1252"), trim_ws = TRUE)
View(Escola_Oliveira_p_Livro_DMQ)

Visualizando os dados:

str(Escola_Oliveira_p_Livro_DMQ)
## spec_tbl_df [420 x 9] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ id            : num [1:420] 1 2 3 4 5 6 7 8 9 10 ...
##  $ grau_pagamento: num [1:420] 1 1 2 1 2 1 1 1 2 1 ...
##  $ sexo          : num [1:420] 1 1 1 0 1 1 0 1 0 1 ...
##  $ raca          : num [1:420] 1 0 0 1 0 1 0 0 0 1 ...
##  $ casado        : num [1:420] 0 0 0 0 1 1 1 1 0 1 ...
##  $ idade         : num [1:420] NA 25 23 26 22 23 31 21 31 38 ...
##  $ anos_trabalho : chr [1:420] "0,5" "2,4" "3,6" "1,9" ...
##  $ desempenho    : num [1:420] 2 3 7 3 6 4 3 2 5 3 ...
##  $ salario       : num [1:420] 890 1100 1070 1190 1290 1010 990 880 1520 1290 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   id = col_double(),
##   ..   grau_pagamento = col_double(),
##   ..   sexo = col_double(),
##   ..   raca = col_double(),
##   ..   casado = col_double(),
##   ..   idade = col_double(),
##   ..   anos_trabalho = col_character(),
##   ..   desempenho = col_double(),
##   ..   salario = col_double()
##   .. )
##  - attr(*, "problems")=<externalptr>

Diagrama de dispersão:

plot(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho,main = "Diagrama de dispersão",xlab = "Salário",ylab = "Desempenho")
abline(lsfit(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho),col="red")

Coeficiente de correlação:

cor(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho)
## [1] 0.8346379

Matriz de Correlação:

library(corrplot)
M <- cor(Escola_Oliveira_p_Livro_DMQ[,c("salario","desempenho")])
corrplot(M, method="circle")

A base de dados analisada foi “Escola_Oliveira_p_Livro.DMQ”, que contém informações sobre 420 empregados de uma escola. As variáveis, cujos resultados são representados nas tabelas e gráfico (matriz de correlação), foram “salário” e “desempenho”, e analisei a relação das duas variáveis para descobrir se o desempenho afeta o valor do salário dos trabalhadores.

No diagrama de dispersão é possível ver que, pela concentração crescente de outliers no eixo x, sua correlação é positiva forte.

Também é possível ver o mesmo resultado no coeficiente de correlação, que nos mostra 0.8 como seu valor, onde, quanto mais próximo de 1 for o valor encontrado, mais forte é a sua intensidade. Esses resultados também podem ser representados em forma de matriz, que é o caso do último gráfico.

Em todas as análises realizadas, o resultado é claro, quanto maior o desempenho do trabalhador, maior será o seu salário.