library(readxl)
caso <- read_excel("D:/GUIANCARLO_2022/MAESTRIA CIENCIA DE DATOS/Metodos y Simulacion Estadistica/unidad 3_Modelación_Estadistica/Trabajo_1/caso.xlsx")
View(caso)
Construya el diagrama de dispersión.
attach(caso)
plot(desempleo,homicidios, pch = 16)
En esta gráfica se puede observar el diagrama de dispersión, el cual corresponde a una relación lineal positiva (directa o creciente), esto se puede validar en la anterior gráfica.
Hallar el coeficiente de correlación, interprete y determine si es significativo.
cor(desempleo,homicidios)
## [1] 0.9608183
La asociación es muy fuerte, luego la tasa de desempleo está asociada con la tasa de homicidios, es decir a mayor desempleo mayor es la tasa de homicidios, de esta manera es necesario crear proyectos que active el empleo y de esta manera disminuir la tasa de homicidios, esta decisión la podría emplear un tomador de decisiones que pertenezca a una entidad territorial
Estime el correspondiente modelo lineal simple e interprete la pendiente del modelo.
mod=lm(homicidios~desempleo)
summary(mod)
##
## Call:
## lm(formula = homicidios ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
De acuerdo a los resultados del modelo se puede indicar que por cada aumento del 1% de desempleo en la comunidad el efecto sería de 63 casos aproximadamente de homicidio por cada 100 mil habitantes adicionales, de igual manera el valor de coeficiente de pr indica que se presenta un aumento significativo. Por otra parte, se puede observar el coeficiente r cuadrado el cual indica que este modelo logra explicar un 92% de la violencia que como producto tiene los homicidios generados a raíz del desempleo que se presenta en la región.
Valide los supuestos del modelo.
par (mfrow=c(2,2))
plot(mod)
Al simular la función se logran generar una serie de gráficos, aqui se puede destacar lo siguiente:
Luego se hace necesario realizar unos ajustes a la función para determinar si mejora el comportamiento de la función. De esta manera se hace una transformación mediante un algoritmo sobre la variable respuesta.
modelo=lm(log(homicidios)~desempleo)
summary(modelo)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
Al realizar el cambio de LOG sobre la variable respuesta se puede indicar que por cada aumento del 1% de desempleo en la comunidad el efecto sería de 48 casos aproximadamente de homicidio por cada 100 mil habitantes adicionales, de igual manera el valor de coeficiente de pr indica que se presenta un aumento significativo. Por otra parte, se puede observar el coeficiente r cuadrado el cual indica que este modelo logra explicar un 99% de la violencia que como producto tiene los homicidios generados a raíz del desempleo que se presenta en la región. Luego mejoran los valores.
Valide los supuestos del modelo.
par (mfrow = c(2,2))
plot(modelo)
Al simular la función se logran generar una serie de gráficos, aqui se
puede destacar lo siguiente:
Estime la tasa de homicidios para la eventualidad en la que el Gobierno logre disminuir el desempleo a un nivel del 11%. ###
exp(predict (modelo,newdata = list (desempleo=11)))
## 1
## 75.17389
De esta manera se puede indicar que si el desempleo se lograr disminuir en un 11% se esperaría que la tasa de homicidios fuera de 75 casos por cada 100 mil habitantes.