library(readxl)
Actividad_Caso <- read_excel("~/OneDrive - PUJ Cali/PUJ Msc/Semestre I/MeĢtodos y simulacioĢn estadiĢstica 2022 - B/Unidad 3/Actividad Caso/Actividad Caso.xlsx")
attach(Actividad_Caso) # Atajo para llamar las variables
plot(desempleo,homicidios,pch=18)
cor(desempleo,homicidios,use = "complete.obs") # Se utiliza use para que no tenga en cuenta los datos faltantes
## [1] 0.9608183
Variable de respuesta Homicidios en función de desempleo si hay mas covariables se utiliza el simbolo (+)
modelo=lm(homicidios~desempleo)
summary(modelo)
##
## Call:
## lm(formula = homicidios ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## desempleo 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
La interpretación del beta 1 (Estimate Std/desempleo = 63.751) = cual es el aumento en la tasa de homicidios por cada incremento unidad de desempleo; es decir que si se aumenta en 1% la tasa de desempleo el efecto sobre la tasa de homicidios aumenatria en 63 casos por aumento de 100 habitantes
El valor p tiene significancia debido a que tiene *** tres asteriscos
El coeficiente R-squared tabien esa una medida de bondad y ajuste que me dice que tanto el modelo logra explciar la variable de respuesta, en esta caso logra explicar el 92.32% de la violencia.
par(mfrow=c(2,2))
plot(modelo)
modelo=lm(log(homicidios)~desempleo)
summary(modelo)
##
## Call:
## lm(formula = log(homicidios) ~ desempleo)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## desempleo 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(modelo)
La grafica de residuales vs valores ajustados, me deberia mostrar aleatoredad porque se espera que los residuales no tengan ningun comportamiento, eso quiere decir que los residuales tienen una componenete sistematica que evenetualmente se puede incluir en el modelo.
La grafica de noralidad no tiene el comportamiento esperado
predict(modelo,newdata = list(desempleo=11))
## 1
## 4.319804
# Destrasnformaciòn del logaritmo
exp(predict(modelo,newdata = list(desempleo=11)))
## 1
## 75.17389