Gráfico de Dispersão

Verificamos a relação entre os dados de salário em função do tempo de trabalho dos funcionários da Escola Oliveira.

plot(dados$anos_trabalho,dados$salario
     ,main="Relação Salário x Tempo de Trabalho"
     ,xlab="Tempo de Trabalho (Anos)"
     ,ylab="Salário (R$)")
abline(lm(dados$salario~dados$anos_trabalho),col='red')

Vemos que existe uma aparente correlação positiva entre o salário e o tempo de trabalho. Ou seja, a tendência do salário é aumentar conforme os anos de trabalho no Colégio.

cor(dados$anos_trabalho,dados$salario)
## [1] 0.7510329

Quanto à correlação entre as duas variáveis, o valor encontrado sugere correlação forte, confirmando, portanto a correlação positiva entre as variáveis.

Linha de regressão

A linha vermelha no gráfico é a função de regressão linear dada para a relação entre salário e tempo de serviço.

summary(lm(dados$salario~dados$anos_trabalho))
## 
## Call:
## lm(formula = dados$salario ~ dados$anos_trabalho)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -910.83 -232.83    5.14  189.10  807.14 
## 
## Coefficients:
##                     Estimate Std. Error t value Pr(>|t|)    
## (Intercept)           722.92      38.38   18.84   <2e-16 ***
## dados$anos_trabalho   279.98      12.04   23.26   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 299.3 on 418 degrees of freedom
## Multiple R-squared:  0.5641, Adjusted R-squared:  0.563 
## F-statistic: 540.8 on 1 and 418 DF,  p-value: < 2.2e-16

Ao calcularmos a função, vemos que a tendência da regressão é de um acréscimo de 280 reais no salário mensal para cada ano de serviço. Porém, há uma dispersão considerável nos dados em relação à regressão. Por isso, o coeficiente de determinação (R-squared) não foi tão elevado (0.56).