A. Grafico
plot(CasoVD$desempleo,CasoVD$homicidios)
El Grafico evidencia que hay una relación directa entre el desempleo y los homicidios
B. Coeficiente de Correlación
cor(CasoVD$desempleo,CasoVD$homicidios,use = "complete.obs")
## [1] 0.9608183
#se obtiene un coeficiente de correlación de 0,96 lo cual indica una relacion directa fuerte entre el desempleo y los homicidios
C. Regresión Lineal
mod=lm(CasoVD$homicidios~CasoVD$desempleo)
summary (mod)
##
## Call:
## lm(formula = CasoVD$homicidios ~ CasoVD$desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## CasoVD$desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
#El modelo muestra que la variable de desempleo tiene significancia y el valor de R^2 nos indica que el modelo logra explicar un 92,3% de la relacion entre desempleo y homicidios. #El coeficiente Beta1 del modelo indica que por cada aumento en el desempleo de 1% los homicidios presenta un aumento de 63,751 casos
D. Supuestos
par(mfrow=c(2,2))
plot(mod)
#Analizando los graficos, en los residuales se observa que la relacion no es completamente lineal y el supuesto de aleatoriedad de los errores no se está cumpliendo, en el grafico de normalidad se observan varios datos por fuera de la linea.
#de esta manera se busca una transformación que logre mejorar la situacion encontrada, se utiliza un logaritmo sobre la variable de respuesta
Modelo transformado
mod2=lm(log(homicidios)~desempleo)
summary (mod2)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod2)
#con esta transformación se mejora el modelo, obtenido un R^2 mas alto, asi como mejora en la aleatoriedad y normalidad
E. Predicción
#se busca predecir cual sera la tasa de homicidios de lograrse una reducción al desempleo hasta el 11%, dado que se realizo la transformación se debe volver a las unidades originales por lo cual se utiliza la funcion exponencial como inversa al logaritmo
exp(predict(mod2, newdata = list(desempleo=11)))
## 1
## 75.17389
El Resultado indica que para un desempleo igual al 11% se tendria una tasa de 75,2 homicidios por cada 100 mil habitantes