Emerson Trujillo Sierra
4/Mayo/2022
a) Gráfica
library(readxl)
casoDH <- read_excel("C:/Users/portatil/Desktop/Datos R/caso_desempleo-homicidios.xlsx")
attach(casoDH)
plot(desempleo, homicidios, pch=16, col="blue")
b) Coeficiente de Correlación
cor(desempleo, homicidios)
## [1] 0.9608183
El resultado obtenido del coeficiente de correlación es r = 0.9608, Por lo tanto, la relación entre el desempleo y los homicidios es directa y fuerte, es decir que entre más número de desempleados haya, mayor va a ser el número de homicidios.
c) Regresión lineal
mod = lm(homicidios~desempleo)
summary(mod)
##
## Call:
## lm(formula = homicidios ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
Se evidencia que, un aumento en un 1% en la tasa de desempleo los homicidios aumentarían en 63.7 casos por cada 100.000 habitantes. El modelo logra explicar un 92.32% los homicidios.
mod1 = lm(log(homicidios)~desempleo)
summary(mod1)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
Al realizar la transformación del modelo con logaritmo se evidencia un aumento en el r2 del 99.37%, lo cual mejora la explicación del modelo.
d) Supuesto
par(mfrow=c(2,2))
plot(mod,pch=16,col="purple")
par(mfrow=c(2,2))
plot(mod1,pch=16,col="blue")
En la transformación del modelo lineal al logarítmico, se puede evidenciar una mejora en el r2, en la gráfica de residuales vs los valores ajustados y la normalidad de los datos.
e) Predicción
exp(predict(mod1, newdata=list(desempleo=11)))
## 1
## 75.17389
Si el desempleo se lograra diminuir un 11%, se espera que los homicidios en esa comunidad disminuyan 75.17 casos por cada 100.000 habitantes.