library(readxl)
YDRAY_caso <- read_excel("C:/Users/lalal_000/Documents/BIOLOGIA JAVERIANA/5to/BIO-ESTADISTICA/YDRAY-caso.xlsx")
##PUNTO A
library(ggplot2)
ggplot(YDRAY_caso, aes(x = desempleo, y = homicidios)) +
geom_point(colour = 5) + ggtitle("Figura 1. Diagrama de dispersión entre los homicidios y el desempleo")
En este grafico se puede observar una relacion poco lineal (creciente) entre la variable de homicidios y la variable de desempleo, por esto se puede concluir que el desemplo seria una causal que aumenta el caso de homicidios.
##PUNTO B
y=YDRAY_caso$homicidios
x=YDRAY_caso$desempleo
cor(x,y)
## [1] 0.9608183
Segun el coeficiente de correlacion, se puede concluir que es inversamente proporcional pues cada que aumenta la variable de desempleo, aumentan los casos de homicidios.
##PUNTO C
mod=lm(y~x)
summary(mod)
##
## Call:
## lm(formula = y ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -19.335 -11.928 -4.618 6.006 62.193
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -628.936 35.846 -17.55 <2e-16 ***
## x 63.751 2.983 21.37 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 18.06 on 38 degrees of freedom
## Multiple R-squared: 0.9232, Adjusted R-squared: 0.9212
## F-statistic: 456.6 on 1 and 38 DF, p-value: < 2.2e-16
##INTERPRETACION
##PUNTO D
par(mfrow=c(2,2))
plot(mod)
En los siguientes graficos se puede observar que existe una relacion cercana del desempleo con el homicidio, pues aunque los puntos de dispercion no se encuentren siempre sobre la linea, se encuentra cerca a esta. Para ver mejor esta cercania se aplica:
mod1=lm(log(y)~x)
summary(mod1)
##
## Call:
## lm(formula = log(y) ~ x)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.08538 -0.02273 0.00001 0.02223 0.09549
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -1.027556 0.075235 -13.66 3.08e-16 ***
## x 0.486124 0.006262 77.64 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.03791 on 38 degrees of freedom
## Multiple R-squared: 0.9937, Adjusted R-squared: 0.9936
## F-statistic: 6027 on 1 and 38 DF, p-value: < 2.2e-16
par(mfrow=c(2,2))
plot(mod1)
En estas nuevas graficas se representan de una mejor presentacion los graficos con distribucion normal y con valores residuales.
##PUNTO E
exp(predict(mod1,newdata = list(x=11)))
## 1
## 75.17389
Con este valor se puede concluir que si el desempleo disminuye en un 11%, la tasa de homicidio que se espera es de aproximadamente 75/10.000.