R Markdown

O presente relatório tem como objetivo correlacionar duas variáveis quantitativas

Os dados serão extraídos do arquivo de valores da Escola_Oliveira

library(flextable)
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readxl)
library(corrplot)
## Warning: package 'corrplot' was built under R version 4.2.2
## corrplot 0.92 loaded
library(ggplot2)
library(janitor)
## 
## Attaching package: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
library(RColorBrewer)
Carregando a base de dados
library(readr)
Escola_Oliveira_p_Livro_DMQ <- read_delim("C:/Users/wandr/OneDrive/Documentos/ENEM_UNIRIO/2022.2/R/Base_de_dados-master/Escola_Oliveira_p_Livro_DMQ.csv", 
                                          delim = ";", escape_double = FALSE, trim_ws = TRUE)
## Rows: 420 Columns: 9
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (1): anos_trabalho
## dbl (8): id, grau_pagamento, sexo, raca, casado, idade, desempenho, salario
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
head(Escola_Oliveira_p_Livro_DMQ)%>%data.frame()%>%flextable()%>%theme_tron_legacy()

As variáveis escolhidas formam salário e desempenho, e o que se quer saber é qual a influência do salário no desempenho medido dos funcionários.

1. Diagrama de dispersão das variáveis “salário” e “desempenho”

plot(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho,pch=18,col="#1c8718",
     main="Diagrama de dispersão salario x desempenho",
     xlab = "Salário do empregado(a)",
     ylab = "Desempenho do Empregado(a)")
abline(lsfit(Escola_Oliveira_p_Livro_DMQ$salario,Escola_Oliveira_p_Livro_DMQ$desempenho), col="#bf2158")

O diagrama indica que há correlação positiva entre salário e desempenho

2. Correlação medida

cor(Escola_Oliveira_p_Livro_DMQ$salario, Escola_Oliveira_p_Livro_DMQ$desempenho)
## [1] 0.8346379

O valor medido do coeficiente de correlação ou Coeficiente de Pearson (0.8346379) confirma que a correlação é positiva e forte.

3. Matriz de Correlação

selecao = c("salario","desempenho")

Escola_Oliveira_p_Livro_DMQ%>%select(selecao)%>%cor()
## Warning: Using an external vector in selections was deprecated in tidyselect 1.1.0.
## ℹ Please use `all_of()` or `any_of()` instead.
##   # Was:
##   data %>% select(selecao)
## 
##   # Now:
##   data %>% select(all_of(selecao))
## 
## See <https://tidyselect.r-lib.org/reference/faq-external-vector.html>.
##              salario desempenho
## salario    1.0000000  0.8346379
## desempenho 0.8346379  1.0000000
Escola_Oliveira_p_Livro_DMQ%>%select(selecao)%>%cor()%>%corrplot()

A Matriz de correlação acima é a representação gráfica da correlação entre salário e desempenho.

Conclusão:

Analisando os dados estatísticos coletados, podemos concluir que na Escola Oliveira o desempenho dos funcionários está fortemente relacionado com o salário recebido. Quanto maior o salário, melhor é o desempenho medido.