1. Construya un diagrama de dispersión. Comente este gráfico
attach(caso)
plot(desempleo,homicidios, pch=15)
El diagrama de dispersión permite observar que existe una relación directa entre las variables porcentaje de desempleo y tasa de homicidios,de igual manera no es completamente lineal y tiene un patron mas creciente tipo exponencial
2. Halle el coeficiente de correlacion, interprete y determine si es significativo
cor(desempleo,homicidios,use="complete.obs")
## [1] 0.9608183
Existe una fuerte correlacion entre las variables
3. Estime el correspondiente modelo lineal simple e interprete la pendiente del modelo
modelo = lm(homicidios~desempleo)
summary(modelo)
##
## Call:
## lm(formula = homicidios ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
4. Valide los supuestos del Modelo
par(mfrow=c(2,2))
plot(modelo)
El supuesto de aleatoriedad de los modelos no se esta cumpliendo por lo que se requeiere una transformación y la grafica QQ no evidencia una completa normalidad
modelo = lm(log(homicidios)~desempleo)
summary(modelo)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
Se observa un cambio significativo en el R-squeared
par(mfrow=c(2,2))
plot(modelo)
Se logro transformar el modelo teniendo un mejor ajuste logrando un mejor comportamiento de los residuales y un mayor acercamiento a la normalidad
5. Estime la tasa de Homicidios para la eventualidad en la que el gobierno logre disminuir el desemeplo a un nivel de 11%
exp(predict(modelo, newdata = list(desempleo=11)))
## 1
## 75.17389
Si el desempleo se logra disminuir un 11% se espera que los casos correspondas alrededor de 75 por cada 100K habitantes