setwd("/Users/mau/Dropbox/Cursos mau/Maestria CEI")
data<-read.csv("BaseIP3.csv",header=TRUE)
Pregunta: ¿Como afecta la delincuencia en el goce de espacios publicos de la poblacion? Hipotesis: La poblacion en municipios con mas delitos es menos propensa a usar los espacios publicos.
Usaremos las variables p7_1, p7_2, p7_3 p8 y vamos a crear una variable indicadora de Metro/no Metro
table(data$p7_1)
##
## NS/NC No Si
## 41 8779 2180
table(data$p7_2)
##
## NS/NC No Si
## 64 8728 2208
table(data$p7_3)
##
## NS/NC No Si
## 45 10289 666
table(data$p8)
##
## Ambos NC
## 209 17
## NS No
## 24 8526
## Si, alguien de esta vivienda Si, yo he sido victima
## 945 1279
Vamos a hacer nuestro analisis a nivel municipal
data$lcompras<-ifelse(data$p7_1=="Si",data$ponde,0)
data$lpaseo<-ifelse(data$p7_2=="Si",data$ponde,0)
data$lvive<-ifelse(data$p7_3=="Si",data$ponde,0)
data$delito<-ifelse(data$p8=="Si, alguien de esta vivienda",data$ponde,0)
data$delito<-ifelse(data$p8=="Si, yo he sido victima",data$ponde,data$delito)
data$total<-data$ponde
Agregamos los datos…
data2<-aggregate(cbind(lcompras,lpaseo,lvive,delito,total)~edo+muni,data=data,sum)
Ahora vamos a crear una variable indicadora para saber si el municipio es considerado dentro de alguna zona metropolitana… Para eso usamos el Sistema Urbano Nacional 2012 (SUN 2012) de CONAPO
data2$clave<-(data2$edo*1000)+data2$muni
dataSUN<-read.csv("SUN2012.csv",header=TRUE)
data4<-merge(data2,dataSUN,by.x="clave",by.y="clave1",all.x=T, all.y=F)
Como para aquellos municipios que no se tenia informacion en la base del SUN sabemos que son municipios no metropolitanos, los NA’s que nos quedan realmente significan que el municipio es no metro.
data4$tipo<-ifelse(is.na(data4$tipo),0,data4$tipo)
Creamos nuestras variables de interes como porcentajes
data4$plpaseo<-100*(data4$lpaseo/data4$total)
data4$plcompras<-100*(data4$lcompras/data4$total)
data4$plvive<-100*(data4$lvive/data4$total)
data4$tdelito<-100*(data4$delito/data4$total)
Ahora hacemos nuestro analisis descriptivo
library(ggplot2)
p<-ggplot(data4,aes(tdelito,plcompras))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de compras",
title="Diagrama de dispersion 1")
cor(data4$plcompras,data4$tdelito)
## [1] 0.265463
p<-ggplot(data4,aes(tdelito,plpaseo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de paseo",
title="Diagrama de dispersion 1")
cor(data4$plpaseo,data4$tdelito)
## [1] 0.3287581
p<-ggplot(data4,aes(tdelito,plvive))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de residencia",
title="Diagrama de dispersion 1")
cor(data4$plvive,data4$tdelito)
## [1] 0.2052642
p<-ggplot(data4,aes(tdelito,plcompras, colour=tipo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de compras",
title="Diagrama de dispersion 1")
p<-ggplot(data4,aes(tdelito,plpaseo, colour=tipo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de paseo",
title="Diagrama de dispersion 1")
p<-ggplot(data4,aes(tdelito,plvive,colour=tipo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de residencia",
title="Diagrama de dispersion 1")
t.test(data4$tipo,data4$plcompras)
##
## Welch Two Sample t-test
##
## data: data4$tipo and data4$plcompras
## t = -19.181, df = 347.55, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -17.69547 -14.40397
## sample estimates:
## mean of x mean of y
## 0.2614943 16.3112139
t.test(data4$tipo,data4$plpaseo)
##
## Welch Two Sample t-test
##
## data: data4$tipo and data4$plpaseo
## t = -20.345, df = 347.55, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -18.71932 -15.41900
## sample estimates:
## mean of x mean of y
## 0.2614943 17.3306509
t.test(data4$tipo,data4$plvive)
##
## Welch Two Sample t-test
##
## data: data4$tipo and data4$plvive
## t = -10.338, df = 348.59, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -6.064571 -4.125781
## sample estimates:
## mean of x mean of y
## 0.2614943 5.3566702
t.test(data4$tipo,data4$tdelito)
##
## Welch Two Sample t-test
##
## data: data4$tipo and data4$tdelito
## t = -22.214, df = 347.57, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
## -19.94582 -16.70116
## sample estimates:
## mean of x mean of y
## 0.2614943 18.5849854
Ahora si, estamos listos para el modelo de regresion
modelo1<-lm(plcompras~tdelito,data=data4)
summary(modelo1)
##
## Call:
## lm(formula = plcompras ~ tdelito, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -30.531 -11.306 -2.746 7.962 58.743
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.30632 1.26772 8.919 < 2e-16 ***
## tdelito 0.26930 0.05258 5.122 5.04e-07 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 15.07 on 346 degrees of freedom
## Multiple R-squared: 0.07047, Adjusted R-squared: 0.06778
## F-statistic: 26.23 on 1 and 346 DF, p-value: 5.04e-07
plot(data4$tdelito,data4$plcompras,xlab="Tasa delitos",ylab="% Cambio lugar compras")
abline(modelo1)
anova(modelo1)
## Analysis of Variance Table
##
## Response: plcompras
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 5953 5953.5 26.231 5.04e-07 ***
## Residuals 346 78529 227.0
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo1)
ajuste<-fitted(modelo1)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
Otro modelo
modelo2<-lm(plpaseo~tdelito,data=data4)
summary(modelo2)
##
## Call:
## lm(formula = plpaseo ~ tdelito, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -35.059 -11.116 -2.321 6.871 54.932
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.11580 1.24514 8.927 < 2e-16 ***
## tdelito 0.33440 0.05164 6.475 3.25e-10 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.8 on 346 degrees of freedom
## Multiple R-squared: 0.1081, Adjusted R-squared: 0.1055
## F-statistic: 41.93 on 1 and 346 DF, p-value: 3.248e-10
plot(data4$tdelito,data4$plpaseo,xlab="Tasa delitos",ylab="% Cambio lugar paseo")
abline(modelo2)
anova(modelo2)
## Analysis of Variance Table
##
## Response: plpaseo
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 9180 9180.0 41.928 3.248e-10 ***
## Residuals 346 75756 218.9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo2)
ajuste<-fitted(modelo2)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
Y el otro modelo
modelo3<-lm(plvive~tdelito,data=data4)
summary(modelo3)
##
## Call:
## lm(formula = plvive ~ tdelito, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -11.854 -5.132 -3.079 2.300 56.016
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.07885 0.75746 4.065 5.96e-05 ***
## tdelito 0.12256 0.03142 3.901 0.000115 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 9.001 on 346 degrees of freedom
## Multiple R-squared: 0.04213, Adjusted R-squared: 0.03937
## F-statistic: 15.22 on 1 and 346 DF, p-value: 0.000115
plot(data4$tdelito,data4$plvive,xlab="Tasa delitos",ylab="% Cambio lugar residencia")
abline(modelo3)
anova(modelo3)
## Analysis of Variance Table
##
## Response: plvive
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 1233.2 1233.17 15.219 0.000115 ***
## Residuals 346 28035.1 81.03
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo3)
ajuste<-fitted(modelo3)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
¿Hay diferencias por zonas metropolitanas?
modelo1m<-lm(plcompras~tdelito+tipo,data=data4)
summary(modelo1m)
##
## Call:
## lm(formula = plcompras ~ tdelito + tipo, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -29.268 -11.047 -2.481 7.955 59.174
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 11.04669 1.29140 8.554 3.94e-16 ***
## tdelito 0.25525 0.05425 4.705 3.68e-06 ***
## tipo 1.99159 1.89599 1.050 0.294
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 15.06 on 345 degrees of freedom
## Multiple R-squared: 0.07343, Adjusted R-squared: 0.06806
## F-statistic: 13.67 on 2 and 345 DF, p-value: 1.933e-06
plot(data4$tdelito,data4$plcompras,xlab="Tasa delitos",ylab="% Cambio lugar compras")
abline(modelo1m)
## Warning in abline(modelo1m): only using the first two of 3 regression
## coefficients
anova(modelo1m)
## Analysis of Variance Table
##
## Response: plcompras
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 5953 5953.5 26.2392 5.029e-07 ***
## tipo 1 250 250.3 1.1034 0.2943
## Residuals 345 78278 226.9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo1m)
ajuste<-fitted(modelo1m)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
modelo2m<-lm(plpaseo~tdelito+tipo,data=data4)
summary(modelo2m)
##
## Call:
## lm(formula = plpaseo ~ tdelito + tipo, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -31.403 -10.366 -2.373 7.021 56.177
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 10.36591 1.25279 8.274 2.85e-15 ***
## tdelito 0.29382 0.05263 5.583 4.79e-08 ***
## tipo 5.75228 1.83931 3.127 0.00191 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.61 on 345 degrees of freedom
## Multiple R-squared: 0.1327, Adjusted R-squared: 0.1276
## F-statistic: 26.39 on 2 and 345 DF, p-value: 2.171e-11
plot(data4$tdelito,data4$plpaseo,xlab="Tasa delitos",ylab="% Cambio lugar de paseo")
abline(modelo2m)
## Warning in abline(modelo2m): only using the first two of 3 regression
## coefficients
anova(modelo2m)
## Analysis of Variance Table
##
## Response: plpaseo
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 9180 9180.0 42.9920 2.008e-10 ***
## tipo 1 2088 2088.5 9.7807 0.001913 **
## Residuals 345 73667 213.5
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo2m)
ajuste<-fitted(modelo2m)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
modelo3m<-lm(plvive~tdelito+tipo,data=data4)
summary(modelo3m)
##
## Call:
## lm(formula = plvive ~ tdelito + tipo, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -12.972 -4.833 -3.308 2.226 55.636
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.30803 0.77015 4.295 2.27e-05 ***
## tdelito 0.13497 0.03235 4.172 3.83e-05 ***
## tipo -1.75802 1.13071 -1.555 0.121
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.983 on 345 degrees of freedom
## Multiple R-squared: 0.0488, Adjusted R-squared: 0.04328
## F-statistic: 8.85 on 2 and 345 DF, p-value: 0.0001787
plot(data4$tdelito,data4$plvive,xlab="Tasa delitos",ylab="% Cambio lugar residencia")
abline(modelo3m)
## Warning in abline(modelo3m): only using the first two of 3 regression
## coefficients
anova(modelo3m)
## Analysis of Variance Table
##
## Response: plvive
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 1233.2 1233.17 15.2817 0.0001115 ***
## tipo 1 195.1 195.07 2.4174 0.1209128
## Residuals 345 27840.0 80.70
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo3m)
ajuste<-fitted(modelo3m)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
Vamos a crear una variable dividiendo los municipios segun su poblacion
data4$pobmun<-0
data4$pobmun<-ifelse(data4$total>0 & data4$total<50000,1,data4$pobmun)
data4$pobmun<-ifelse(data4$total>=50000 & data4$total<100000,2,data4$pobmun)
data4$pobmun<-ifelse(data4$total>=100000 & data4$total<500000,3,data4$pobmun)
data4$pobmun<-ifelse(data4$total>=500000,4,data4$pobmun)
table(data4$pobmun)
##
## 1 2 3 4
## 90 65 132 61
Ahora usaremos esa variable
modelo1p<-lm(plcompras~tdelito+tipo+pobmun,data=data4)
summary(modelo1p)
##
## Call:
## lm(formula = plcompras ~ tdelito + tipo + pobmun, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -29.239 -11.225 -2.554 8.021 59.499
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 10.50298 2.11658 4.962 1.10e-06 ***
## tdelito 0.25123 0.05571 4.509 8.93e-06 ***
## tipo 1.83091 1.96197 0.933 0.351
## pobmun 0.26722 0.82356 0.324 0.746
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 15.08 on 344 degrees of freedom
## Multiple R-squared: 0.07372, Adjusted R-squared: 0.06564
## F-statistic: 9.126 on 3 and 344 DF, p-value: 7.94e-06
¿Como se interpreta el coeficiente para pobmun?
Debemos cambiar algo… indicarle a R que la variable no es continua…
modelo1p<-lm(plcompras~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo1p)
##
## Call:
## lm(formula = plcompras ~ tdelito + tipo + factor(pobmun), data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -30.142 -10.458 -2.190 7.589 61.753
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.78909 1.68838 5.206 3.34e-07 ***
## tdelito 0.22888 0.05544 4.128 4.60e-05 ***
## tipo 2.17584 1.94445 1.119 0.2639
## factor(pobmun)2 5.01520 2.44976 2.047 0.0414 *
## factor(pobmun)3 5.01383 2.15386 2.328 0.0205 *
## factor(pobmun)4 -0.79364 2.60691 -0.304 0.7610
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared: 0.1019, Adjusted R-squared: 0.08874
## F-statistic: 7.758 on 5 and 342 DF, p-value: 6.265e-07
¿y por que no pusimos eso para la variable tipo?
modelo1p<-lm(plcompras~tdelito+factor(tipo)+factor(pobmun),data=data4)
summary(modelo1p)
##
## Call:
## lm(formula = plcompras ~ tdelito + factor(tipo) + factor(pobmun),
## data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -30.142 -10.458 -2.190 7.589 61.753
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.78909 1.68838 5.206 3.34e-07 ***
## tdelito 0.22888 0.05544 4.128 4.60e-05 ***
## factor(tipo)1 2.17584 1.94445 1.119 0.2639
## factor(pobmun)2 5.01520 2.44976 2.047 0.0414 *
## factor(pobmun)3 5.01383 2.15386 2.328 0.0205 *
## factor(pobmun)4 -0.79364 2.60691 -0.304 0.7610
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared: 0.1019, Adjusted R-squared: 0.08874
## F-statistic: 7.758 on 5 and 342 DF, p-value: 6.265e-07
Cuando son variables tipo dummy no es necesario…
Otra estrategia para la variable pobmun es crear 4 distintas variables y dejar una fuera del analisis
data4$pobmun1<-ifelse(data4$pobmun==1,1,0)
data4$pobmun2<-ifelse(data4$pobmun==2,1,0)
data4$pobmun3<-ifelse(data4$pobmun==3,1,0)
data4$pobmun4<-ifelse(data4$pobmun==4,1,0)
modelo1p<-lm(plcompras~tdelito+tipo+pobmun2+pobmun3+pobmun4,data=data4)
summary(modelo1p)
##
## Call:
## lm(formula = plcompras ~ tdelito + tipo + pobmun2 + pobmun3 +
## pobmun4, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -30.142 -10.458 -2.190 7.589 61.753
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.78909 1.68838 5.206 3.34e-07 ***
## tdelito 0.22888 0.05544 4.128 4.60e-05 ***
## tipo 2.17584 1.94445 1.119 0.2639
## pobmun2 5.01520 2.44976 2.047 0.0414 *
## pobmun3 5.01383 2.15386 2.328 0.0205 *
## pobmun4 -0.79364 2.60691 -0.304 0.7610
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared: 0.1019, Adjusted R-squared: 0.08874
## F-statistic: 7.758 on 5 and 342 DF, p-value: 6.265e-07
La ventaja es que podemos dejar fuera cualquiera de las pobmun(i) y ese sera nuestro grupo de referencia
modelo1p<-lm(plcompras~tdelito+tipo+pobmun1+pobmun2+pobmun4,data=data4)
summary(modelo1p)
##
## Call:
## lm(formula = plcompras ~ tdelito + tipo + pobmun1 + pobmun2 +
## pobmun4, data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -30.142 -10.458 -2.190 7.589 61.753
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 13.802918 1.833568 7.528 4.62e-13 ***
## tdelito 0.228880 0.055442 4.128 4.60e-05 ***
## tipo 2.175836 1.944455 1.119 0.2639
## pobmun1 -5.013832 2.153856 -2.328 0.0205 *
## pobmun2 0.001367 2.297588 0.001 0.9995
## pobmun4 -5.807473 2.317811 -2.506 0.0127 *
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared: 0.1019, Adjusted R-squared: 0.08874
## F-statistic: 7.758 on 5 and 342 DF, p-value: 6.265e-07
Ahora veamos los modelos
modelo1p<-lm(plcompras~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo1p)
##
## Call:
## lm(formula = plcompras ~ tdelito + tipo + factor(pobmun), data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -30.142 -10.458 -2.190 7.589 61.753
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 8.78909 1.68838 5.206 3.34e-07 ***
## tdelito 0.22888 0.05544 4.128 4.60e-05 ***
## tipo 2.17584 1.94445 1.119 0.2639
## factor(pobmun)2 5.01520 2.44976 2.047 0.0414 *
## factor(pobmun)3 5.01383 2.15386 2.328 0.0205 *
## factor(pobmun)4 -0.79364 2.60691 -0.304 0.7610
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared: 0.1019, Adjusted R-squared: 0.08874
## F-statistic: 7.758 on 5 and 342 DF, p-value: 6.265e-07
plot(data4$tdelito,data4$plcompras,xlab="Tasa delitos",ylab="% Cambio lugar compras")
abline(modelo1p)
## Warning in abline(modelo1p): only using the first two of 6 regression
## coefficients
anova(modelo1p)
## Analysis of Variance Table
##
## Response: plcompras
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 5953 5953.5 26.8345 3.794e-07 ***
## tipo 1 250 250.3 1.1284 0.28886
## factor(pobmun) 3 2402 800.7 3.6089 0.01362 *
## Residuals 342 75876 221.9
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo1p)
ajuste<-fitted(modelo1p)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
modelo2p<-lm(plpaseo~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo2p)
##
## Call:
## lm(formula = plpaseo ~ tdelito + tipo + factor(pobmun), data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -31.360 -9.848 -2.437 7.057 57.036
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 9.59656 1.66117 5.777 1.71e-08 ***
## tdelito 0.28643 0.05455 5.251 2.67e-07 ***
## tipo 5.84310 1.91312 3.054 0.00243 **
## factor(pobmun)2 2.01511 2.41028 0.836 0.40371
## factor(pobmun)3 1.31660 2.11914 0.621 0.53482
## factor(pobmun)4 0.04062 2.56489 0.016 0.98737
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 14.65 on 342 degrees of freedom
## Multiple R-squared: 0.1352, Adjusted R-squared: 0.1226
## F-statistic: 10.7 on 5 and 342 DF, p-value: 1.45e-09
plot(data4$tdelito,data4$plpaseo,xlab="Tasa delitos",ylab="% Cambio lugar de paseo")
abline(modelo2p)
## Warning in abline(modelo2p): only using the first two of 6 regression
## coefficients
anova(modelo2p)
## Analysis of Variance Table
##
## Response: plpaseo
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 9180 9180.0 42.7443 2.271e-10 ***
## tipo 1 2088 2088.5 9.7244 0.001973 **
## factor(pobmun) 3 217 72.4 0.3373 0.798374
## Residuals 342 73450 214.8
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo2p)
ajuste<-fitted(modelo2p)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")
modelo3p<-lm(plvive~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo3p)
##
## Call:
## lm(formula = plvive ~ tdelito + tipo + factor(pobmun), data = data4)
##
## Residuals:
## Min 1Q Median 3Q Max
## -14.150 -5.101 -3.447 2.101 54.865
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 3.99464 1.01770 3.925 0.000105 ***
## tdelito 0.14184 0.03342 4.244 2.83e-05 ***
## tipo -1.40184 1.17205 -1.196 0.232504
## factor(pobmun)2 -1.24423 1.47664 -0.843 0.400034
## factor(pobmun)3 -0.54765 1.29827 -0.422 0.673417
## factor(pobmun)4 -2.66657 1.57136 -1.697 0.090609 .
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 8.978 on 342 degrees of freedom
## Multiple R-squared: 0.05809, Adjusted R-squared: 0.04432
## F-statistic: 4.219 on 5 and 342 DF, p-value: 0.0009815
plot(data4$tdelito,data4$plvive,xlab="Tasa delitos",ylab="% Cambio lugar residencia")
abline(modelo3p)
## Warning in abline(modelo3p): only using the first two of 6 regression
## coefficients
anova(modelo3p)
## Analysis of Variance Table
##
## Response: plvive
## Df Sum Sq Mean Sq F value Pr(>F)
## tdelito 1 1233.2 1233.17 15.2984 0.0001107 ***
## tipo 1 195.1 195.07 2.4200 0.1207194
## factor(pobmun) 3 272.1 90.70 1.1252 0.3388538
## Residuals 342 27567.9 80.61
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
residuos<-rstandard(modelo3p)
ajuste<-fitted(modelo3p)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")
qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")