Verificamos a relação entre os dados de salário em função do tempo de trabalho dos funcionários da Escola Oliveira.
plot(dados$anos_trabalho,dados$salario
,main="Relação Salário x Tempo de Trabalho"
,xlab="Tempo de Trabalho (Anos)"
,ylab="Salário (R$)")
abline(lm(dados$salario~dados$anos_trabalho),col='red')
Vemos que existe uma aparente correlação positiva entre o salário e o tempo de trabalho. Ou seja, a tendência do salário é aumentar conforme os anos de trabalho no Colégio.
cor(dados$anos_trabalho,dados$salario)
## [1] 0.7510329
Quanto à correlação entre as duas variáveis, o valor encontrado sugere correlação forte, confirmando, portanto a correlação positiva entre as variáveis.
A linha vermelha no gráfico é a função de regressão linear dada para a relação entre salário e tempo de serviço.
summary(lm(dados$salario~dados$anos_trabalho))
##
## Call:
## lm(formula = dados$salario ~ dados$anos_trabalho)
##
## Residuals:
## Min 1Q Median 3Q Max
## -910.83 -232.83 5.14 189.10 807.14
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 722.92 38.38 18.84 <2e-16 ***
## dados$anos_trabalho 279.98 12.04 23.26 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 299.3 on 418 degrees of freedom
## Multiple R-squared: 0.5641, Adjusted R-squared: 0.563
## F-statistic: 540.8 on 1 and 418 DF, p-value: < 2.2e-16
Ao calcularmos a função, vemos que a tendência da regressão é de um acréscimo de 280 reais no salário mensal para cada ano de serviço. Porém, há uma dispersão considerável nos dados em relação à regressão. Por isso, o coeficiente de determinação (R-squared) não foi tão elevado (0.56).