library(readxl)
Practica <- read_excel("C:/Users/andre/Desktop/Practica.xlsx")
attach(Practica)
Practica
| Año | Desempleo | Homicidios |
|---|---|---|
| 1 | 10.06 | 52.37 |
| 2 | 10.32 | 52.85 |
| 3 | 10.33 | 51.61 |
| 4 | 10.66 | 66.65 |
| 5 | 10.86 | 69.39 |
| 6 | 10.86 | 72.67 |
| 7 | 10.88 | 74.37 |
| 8 | 10.91 | 71.73 |
| 9 | 11.05 | 70.72 |
| 10 | 11.14 | 81.20 |
| 11 | 11.20 | 79.26 |
| 12 | 11.35 | 89.28 |
| 13 | 11.42 | 97.84 |
| 14 | 11.64 | 100.37 |
| 15 | 11.78 | 104.37 |
| 16 | 11.78 | 103.29 |
| 17 | 11.83 | 115.19 |
| 18 | 11.88 | 110.99 |
| 19 | 11.98 | 118.09 |
| 20 | 11.98 | 115.47 |
| 21 | 12.00 | 128.10 |
| 22 | 12.09 | 127.48 |
| 23 | 12.10 | 124.67 |
| 24 | 12.18 | 136.36 |
| 25 | 12.23 | 137.65 |
| 26 | 12.50 | 157.08 |
| 27 | 12.51 | 157.02 |
| 28 | 12.53 | 152.87 |
| 29 | 12.64 | 165.23 |
| 30 | 12.64 | 179.12 |
| 31 | 12.70 | 176.31 |
| 32 | 12.80 | 178.82 |
| 33 | 12.80 | 182.64 |
| 34 | 13.01 | 199.46 |
| 35 | 13.02 | 207.17 |
| 36 | 13.06 | 202.03 |
| 37 | 13.16 | 215.11 |
| 38 | 13.56 | 265.30 |
| 39 | 13.62 | 267.35 |
| 40 | 14.02 | 327.05 |
plot(Desempleo,Homicidios,pch=1,xlab="Tasa de desempleo (%)",ylab="Tasa de Homicidios x 100.000 hab")
Se observa en el gráfico de Dispersión un comportamiento exponencial, es decir, hay una relación creciente y exponencial entre la tasa de desempleo y la tasa de homicidios.
cor(Desempleo,Homicidios)
## [1] 0.9608183
Se evidencia un coeficiente de correlación positivo, por lo que se confirma que efectivamente las variables se encuentran positivamente relacionadas: A mayor tasa de desempleo, mayor será la tasa de homicios.
mod=lm((Homicidios)~Desempleo)
summary(mod)
##
## Call:
## lm(formula = (Homicidios) ~ Desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## Desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
El modelo de regresión, en este momento sin ajustar, permite conocer los valores de \(B_0 = -628.94\) y \(B_1 = 63.75\), es decir, que por cada unidad porcentual que aumente la tasa de desempleo, la tasa de homicidios aumentará en 63.75 por cada 100.000 habitantes.
par(mfrow=c(2,2))
plot(mod)
Al realizar la validación de supuesta, se logra percibir que existe una tendencia parabólica entre los valores redisuales y los valores ajustados, además, en el gráfico Q-Q de normalidad se observan varios puntos alejados de la línea de tendencia lineal, razón por la cual se evidencia la necesidad de ajustar el modelo exponencial a un modelo lineal.
modajustado=lm(log(Homicidios)~Desempleo)
summary(modajustado)
##
## Call:
## lm(formula = log(Homicidios) ~ Desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## Desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
Se realiza la transformación del modelo empleando el Logaritmo Natural de la variable Homicidios, y se emplea este argumento y el desempleo para aplicar nuevamente el modelo de regresión; aquí, el valor del \(B_0\) es de -1.027556 y el de \(B_1\) es 0.486124
par(mfrow=c(2,2))
plot(modajustado)
par(mfrow=c(2,4))
plot(mod)
plot(modajustado)
Al realizar la validación de supuestos, es posible verificar que los valores residuales con respecto a los ajustados ya no siguen ningún tipo de tendencia y son completamente aleatorios; igualmente, el gráfico Q-Q de normalidad deja en evidencia un mayor ajuste a la recta de tendencia, por lo cual, el modelo se ajusta más a la realidad.
exp(predict(modajustado,newdata=list(Desempleo=11)))
## 1
## 75.17389
Se estima que, si se logra reducir la tasa de desempleo a un 11%, la tasa de homicidios por cada 100.000 sería 75.17.