a. Construya el diagrama de dispersion y comente este grafico.

library(readxl)
caso <- read_excel("C:/Users/Big Bang Data/Downloads/caso.xlsx")
View(caso)

attach(caso)

plot(desempleo,homicidios,pch=16)

Analisis:

Este grafico de dispersion nos muestra una relacion directa y algo lineal.

b. Halle el coeficiente de correlacion, interprete y determine si es significativo.

cor(desempleo,homicidios)
## [1] 0.9608183

Analisis:

El coeficiente de correlacion muestra que hay una asociacion fuerte y positiva en un alto porcentaje entre las dos variables analizadas (desempleo y homicidios), por lo tanto si se logra reducir el desempleo se esperaria una reduccion de la tasa de homicidios.

c. Estime el correspondiente modelo lineal simple e interprete la pendiente del modelo.

mod= lm(homicidios~desempleo)
summary(mod)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

Analisis:

  • El coeficiente β1 que acompaña a la variable de desempleo indica cual es el aumento de la tasa de homicidios por cada incremento porcentual en el desempleo, siendo asi que si se aumenta el desempleo en un 1% el efecto que se tendria sobre la tasa de homicidios es de 63 casos por cada 100 mil habitantes.

  • Se puede indicar que el coeficiente β1 es significativo y esta asociado a la tasa de homicidios debido a que en su nivel de significancia se relacionan los ’***’.

  • El coeficiente r2 indica que tanto el modelo logra explicar la variable respuesta, en este caso indica que logra explicar un 92% de la tasa de homicidios.

Ajuste al modelo inicial:

modelo= lm(log(homicidios)~desempleo)
summary(modelo)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16

Analisis:

Al ajustar el modelo a logaritmico se evidencia un aumento en el r2 del 92% al 99%, lo que significa que el modelo mejoró su explicación.

d. Valide los supuestos del modelo.

Supuestos del modelo inicial

par(mfrow=c(2,2))
plot(mod)

Supuestos del modelo ajustado

par(mfrow=c(2,2))
plot(modelo)

Analisis:

Los graficos anteriores permiten validar los supuestos, en el caso del modelo inicial se visualiza que el supuesto de aleatoriedad de los errores no se esta cumpliendo, por lo que se hace necesario realizar el ajuste del modelo para corregir la situacion de aleatoriedad y normalidad como se evidencia en el segundo grupo de graficas.

e. Estime la tasa de homicidios para la eventualidad que el gobierno logre disminuir el desempleo a un nivel del 11%

exp(predict(modelo,newdata =list(desempleo=11)))
##        1 
## 75.17389

Analisis:

Este valor nos indica que si el desempleo se logra reducir a un 11% se espera que la violencia en esa ciudad se disminuya en 75 casos por cada 100 mil habitantes.