#A.Construya un diagrama de dispersión. Comente este grÔfico
library(readxl)
caso <- read_excel("~/Unidad 3/caso.xlsx")
View(caso)
attach(caso)
plot(desempleo,homicidios,pch=16)
se evidencia que la realacion es directamente relacional entre variable desempleo y Homicidios
#B. Halle el coeficiente de correlación, interprete y determine si es significativo
cor(desempleo,homicidios)
## [1] 0.9608183
se evidencia un coeficiente de correlación cercano a 1 lo que indica que la relación entre el desempleo y la tasa de homicidios es fuerte
#C. Estime el correspondiente modelo lineal simple e interprete la pendiente del modelo
mod = lm(homicidios~desempleo)
summary(mod)
##
## Call:
## lm(formula = homicidios ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
se puede identificar que por cada incremento de un 1% se esta incrementando se obtiene 63 casos de homicidios por cada 100 mil habitantes.
el coeficiente de correlación es de gran significancia.
adicionalmente el R2 del modelo logra explicar en un 92% a la variable homicidios.
#D.Valide los supuestos del modelo
par(mfrow=c(2,2))
plot(mod)
se identifica que el supuesto de aleatoriedad de los errores no se esta cumpliendo, por lo tanto se aplica la siguiente tranformación
mod = lm(log(homicidios)~desempleo)
summary(mod)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod)
se observa que mejora la aleatoriedad de los residuales e incluso la normalidad . es impor tante destacar que el R2 logra del modelo logra explicar en un 99% a la variable homicidios.
#E. Estime la tasa de homicidios para la eventualidad en la que el gobierno logre disminuir el desempleo a un nivel de 11%.
exp(predict(mod, newdata = list(desempleo=11)))
## 1
## 75.17389
si el desempleo se lograra disminuir se espera que los homicicios sean de 75 por cada 100 mil habitantes