Emerson Trujillo Sierra

4/Mayo/2022

a) Gráfica

library(readxl)
casoDH <- read_excel("C:/Users/portatil/Desktop/Datos R/caso_desempleo-homicidios.xlsx")
attach(casoDH)
plot(desempleo, homicidios, pch=16, col="blue")

b) Coeficiente de Correlación

cor(desempleo, homicidios)
## [1] 0.9608183

El resultado obtenido del coeficiente de correlación es r = 0.9608, Por lo tanto, la relación entre el desempleo y los homicidios es directa y fuerte, es decir que entre más número de desempleados haya, mayor va a ser el número de homicidios.

c) Regresión lineal

mod = lm(homicidios~desempleo)
summary(mod)
## 
## Call:
## lm(formula = homicidios ~ desempleo)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -19.335 -11.928  -4.618   6.006  62.193 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -628.936     35.846  -17.55   <2e-16 ***
## desempleo     63.751      2.983   21.37   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared:  0.9232, Adjusted R-squared:  0.9212 
## F-statistic: 456.6 on 1 and 38 DF,  p-value: < 2.2e-16

Se evidencia que, un aumento en un 1% en la tasa de desempleo los homicidios aumentarían en 63.7 casos por cada 100.000 habitantes. El modelo logra explicar un 92.32% los homicidios.

mod1 = lm(log(homicidios)~desempleo)
summary(mod1)
## 
## Call:
## lm(formula = log(homicidios) ~ desempleo)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.08538 -0.02273  0.00001  0.02223  0.09549 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) -1.027556   0.075235  -13.66 3.08e-16 ***
## desempleo    0.486124   0.006262   77.64  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared:  0.9937, Adjusted R-squared:  0.9936 
## F-statistic:  6027 on 1 and 38 DF,  p-value: < 2.2e-16

Al realizar la transformación del modelo con logaritmo se evidencia un aumento en el r2 del 99.37%, lo cual mejora la explicación del modelo.

d) Supuesto

par(mfrow=c(2,2))
plot(mod,pch=16,col="purple")

par(mfrow=c(2,2))
plot(mod1,pch=16,col="blue")

En la transformación del modelo lineal al logarítmico, se puede evidenciar una mejora en el r2, en la gráfica de residuales vs los valores ajustados y la normalidad de los datos.

e) Predicción

exp(predict(mod1, newdata=list(desempleo=11)))
##        1 
## 75.17389

Si el desempleo se lograra diminuir un 11%, se espera que los homicidios en esa comunidad disminuyan 75.17 casos por cada 100.000 habitantes.