Base de dados:
library(readr)
Escola_Oliveira_p_Livro_DMQ <- read_delim("~/bases_curso_estatistica/Base_de_dados-master/Escola_Oliveira_p_Livro_DMQ.csv", delim = ";", escape_double = FALSE, locale = locale(encoding = "WINDOWS-1252"), trim_ws = TRUE)
View(Escola_Oliveira_p_Livro_DMQ)
Visualizando os dados:
str(Escola_Oliveira_p_Livro_DMQ)
## spec_tbl_df [420 x 9] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
## $ id : num [1:420] 1 2 3 4 5 6 7 8 9 10 ...
## $ grau_pagamento: num [1:420] 1 1 2 1 2 1 1 1 2 1 ...
## $ sexo : num [1:420] 1 1 1 0 1 1 0 1 0 1 ...
## $ raca : num [1:420] 1 0 0 1 0 1 0 0 0 1 ...
## $ casado : num [1:420] 0 0 0 0 1 1 1 1 0 1 ...
## $ idade : num [1:420] NA 25 23 26 22 23 31 21 31 38 ...
## $ anos_trabalho : chr [1:420] "0,5" "2,4" "3,6" "1,9" ...
## $ desempenho : num [1:420] 2 3 7 3 6 4 3 2 5 3 ...
## $ salario : num [1:420] 890 1100 1070 1190 1290 1010 990 880 1520 1290 ...
## - attr(*, "spec")=
## .. cols(
## .. id = col_double(),
## .. grau_pagamento = col_double(),
## .. sexo = col_double(),
## .. raca = col_double(),
## .. casado = col_double(),
## .. idade = col_double(),
## .. anos_trabalho = col_character(),
## .. desempenho = col_double(),
## .. salario = col_double()
## .. )
## - attr(*, "problems")=<externalptr>
Diagrama de dispersão:
plot(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho,main = "Diagrama de dispersão",xlab = "Salário",ylab = "Desempenho")
abline(lsfit(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho),col="red")
Coeficiente de correlação:
cor(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho)
## [1] 0.8346379
Matriz de Correlação:
library(corrplot)
M <- cor(Escola_Oliveira_p_Livro_DMQ[,c("salario","desempenho")])
corrplot(M, method="circle")
A base de dados analisada foi “Escola_Oliveira_p_Livro.DMQ”, que contém informações sobre 420 empregados de uma escola. As variáveis, cujos resultados são representados nas tabelas e gráfico (matriz de correlação), foram “salário” e “desempenho”, e analisei a relação das duas variáveis para descobrir se o desempenho afeta o valor do salário dos trabalhadores.
No diagrama de dispersão é possível ver que, pela concentração crescente de outliers no eixo x, sua correlação é positiva forte.
Também é possível ver o mesmo resultado no coeficiente de correlação, que nos mostra 0.8 como seu valor, onde, quanto mais próximo de 1 for o valor encontrado, mais forte é a sua intensidade. Esses resultados também podem ser representados em forma de matriz, que é o caso do último gráfico.
Em todas as análises realizadas, o resultado é claro, quanto maior o desempenho do trabalhador, maior será o seu salário.