Laboratorio 18 octubre

setwd("/Users/mau/Dropbox/Cursos mau/Maestria CEI")
data<-read.csv("BaseIP3.csv",header=TRUE)

Pregunta: ¿Como afecta la delincuencia en el goce de espacios publicos de la poblacion? Hipotesis: La poblacion en municipios con mas delitos es menos propensa a usar los espacios publicos.

Usaremos las variables p7_1, p7_2, p7_3 p8 y vamos a crear una variable indicadora de Metro/no Metro

table(data$p7_1)

## 
## NS/NC    No    Si 
##    41  8779  2180

table(data$p7_2)

## 
## NS/NC    No    Si 
##    64  8728  2208

table(data$p7_3)

## 
## NS/NC    No    Si 
##    45 10289   666

table(data$p8)

## 
##                        Ambos                           NC 
##                          209                           17 
##                           NS                           No 
##                           24                         8526 
## Si, alguien de esta vivienda       Si, yo he sido victima 
##                          945                         1279

Vamos a hacer nuestro analisis a nivel municipal

data$lcompras<-ifelse(data$p7_1=="Si",data$ponde,0)
data$lpaseo<-ifelse(data$p7_2=="Si",data$ponde,0)
data$lvive<-ifelse(data$p7_3=="Si",data$ponde,0)
data$delito<-ifelse(data$p8=="Si, alguien de esta vivienda",data$ponde,0)
data$delito<-ifelse(data$p8=="Si, yo he sido victima",data$ponde,data$delito)
data$total<-data$ponde

Agregamos los datos…

data2<-aggregate(cbind(lcompras,lpaseo,lvive,delito,total)~edo+muni,data=data,sum)

Ahora vamos a crear una variable indicadora para saber si el municipio es considerado dentro de alguna zona metropolitana… Para eso usamos el Sistema Urbano Nacional 2012 (SUN 2012) de CONAPO

Creamos una clave unica de cada municipop
Importamos la base del SUN
Hacemos un merge

data2$clave<-(data2$edo*1000)+data2$muni

dataSUN<-read.csv("SUN2012.csv",header=TRUE)

data4<-merge(data2,dataSUN,by.x="clave",by.y="clave1",all.x=T, all.y=F)

Como para aquellos municipios que no se tenia informacion en la base del SUN sabemos que son municipios no metropolitanos, los NA’s que nos quedan realmente significan que el municipio es no metro.

data4$tipo<-ifelse(is.na(data4$tipo),0,data4$tipo)

Creamos nuestras variables de interes como porcentajes

data4$plpaseo<-100*(data4$lpaseo/data4$total)
data4$plcompras<-100*(data4$lcompras/data4$total)
data4$plvive<-100*(data4$lvive/data4$total)
data4$tdelito<-100*(data4$delito/data4$total)

Ahora hacemos nuestro analisis descriptivo

library(ggplot2)

p<-ggplot(data4,aes(tdelito,plcompras))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de compras", 
                    title="Diagrama de dispersion 1")

cor(data4$plcompras,data4$tdelito)

## [1] 0.265463

p<-ggplot(data4,aes(tdelito,plpaseo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de paseo", 
                    title="Diagrama de dispersion 1")

cor(data4$plpaseo,data4$tdelito)

## [1] 0.3287581

p<-ggplot(data4,aes(tdelito,plvive))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de residencia", 
                    title="Diagrama de dispersion 1")

cor(data4$plvive,data4$tdelito)

## [1] 0.2052642

p<-ggplot(data4,aes(tdelito,plcompras, colour=tipo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de compras", 
                    title="Diagrama de dispersion 1")

p<-ggplot(data4,aes(tdelito,plpaseo, colour=tipo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de paseo", 
                    title="Diagrama de dispersion 1")

p<-ggplot(data4,aes(tdelito,plvive,colour=tipo))
p+geom_point()+labs(x="Tasa de delitos",y="% ha cambiado lugar de residencia", 
                    title="Diagrama de dispersion 1")

t.test(data4$tipo,data4$plcompras)

## 
##  Welch Two Sample t-test
## 
## data:  data4$tipo and data4$plcompras
## t = -19.181, df = 347.55, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -17.69547 -14.40397
## sample estimates:
##  mean of x  mean of y 
##  0.2614943 16.3112139

t.test(data4$tipo,data4$plpaseo)

## 
##  Welch Two Sample t-test
## 
## data:  data4$tipo and data4$plpaseo
## t = -20.345, df = 347.55, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -18.71932 -15.41900
## sample estimates:
##  mean of x  mean of y 
##  0.2614943 17.3306509

t.test(data4$tipo,data4$plvive)

## 
##  Welch Two Sample t-test
## 
## data:  data4$tipo and data4$plvive
## t = -10.338, df = 348.59, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -6.064571 -4.125781
## sample estimates:
## mean of x mean of y 
## 0.2614943 5.3566702

t.test(data4$tipo,data4$tdelito)

## 
##  Welch Two Sample t-test
## 
## data:  data4$tipo and data4$tdelito
## t = -22.214, df = 347.57, p-value < 2.2e-16
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##  -19.94582 -16.70116
## sample estimates:
##  mean of x  mean of y 
##  0.2614943 18.5849854

Ahora si, estamos listos para el modelo de regresion

modelo1<-lm(plcompras~tdelito,data=data4)
summary(modelo1)

## 
## Call:
## lm(formula = plcompras ~ tdelito, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -30.531 -11.306  -2.746   7.962  58.743 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11.30632    1.26772   8.919  < 2e-16 ***
## tdelito      0.26930    0.05258   5.122 5.04e-07 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15.07 on 346 degrees of freedom
## Multiple R-squared:  0.07047,    Adjusted R-squared:  0.06778 
## F-statistic: 26.23 on 1 and 346 DF,  p-value: 5.04e-07

plot(data4$tdelito,data4$plcompras,xlab="Tasa delitos",ylab="% Cambio lugar compras")
abline(modelo1)

anova(modelo1)

## Analysis of Variance Table
## 
## Response: plcompras
##            Df Sum Sq Mean Sq F value   Pr(>F)    
## tdelito     1   5953  5953.5  26.231 5.04e-07 ***
## Residuals 346  78529   227.0                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo1)
ajuste<-fitted(modelo1)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

Otro modelo

modelo2<-lm(plpaseo~tdelito,data=data4)
summary(modelo2)

## 
## Call:
## lm(formula = plpaseo ~ tdelito, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -35.059 -11.116  -2.321   6.871  54.932 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11.11580    1.24514   8.927  < 2e-16 ***
## tdelito      0.33440    0.05164   6.475 3.25e-10 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.8 on 346 degrees of freedom
## Multiple R-squared:  0.1081, Adjusted R-squared:  0.1055 
## F-statistic: 41.93 on 1 and 346 DF,  p-value: 3.248e-10

plot(data4$tdelito,data4$plpaseo,xlab="Tasa delitos",ylab="% Cambio lugar paseo")
abline(modelo2)

anova(modelo2)

## Analysis of Variance Table
## 
## Response: plpaseo
##            Df Sum Sq Mean Sq F value    Pr(>F)    
## tdelito     1   9180  9180.0  41.928 3.248e-10 ***
## Residuals 346  75756   218.9                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo2)
ajuste<-fitted(modelo2)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

Y el otro modelo

modelo3<-lm(plvive~tdelito,data=data4)
summary(modelo3)

## 
## Call:
## lm(formula = plvive ~ tdelito, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -11.854  -5.132  -3.079   2.300  56.016 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.07885    0.75746   4.065 5.96e-05 ***
## tdelito      0.12256    0.03142   3.901 0.000115 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 9.001 on 346 degrees of freedom
## Multiple R-squared:  0.04213,    Adjusted R-squared:  0.03937 
## F-statistic: 15.22 on 1 and 346 DF,  p-value: 0.000115

plot(data4$tdelito,data4$plvive,xlab="Tasa delitos",ylab="% Cambio lugar residencia")
abline(modelo3)

anova(modelo3)

## Analysis of Variance Table
## 
## Response: plvive
##            Df  Sum Sq Mean Sq F value   Pr(>F)    
## tdelito     1  1233.2 1233.17  15.219 0.000115 ***
## Residuals 346 28035.1   81.03                     
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo3)
ajuste<-fitted(modelo3)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

¿Hay diferencias por zonas metropolitanas?

modelo1m<-lm(plcompras~tdelito+tipo,data=data4)
summary(modelo1m)

## 
## Call:
## lm(formula = plcompras ~ tdelito + tipo, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -29.268 -11.047  -2.481   7.955  59.174 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 11.04669    1.29140   8.554 3.94e-16 ***
## tdelito      0.25525    0.05425   4.705 3.68e-06 ***
## tipo         1.99159    1.89599   1.050    0.294    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15.06 on 345 degrees of freedom
## Multiple R-squared:  0.07343,    Adjusted R-squared:  0.06806 
## F-statistic: 13.67 on 2 and 345 DF,  p-value: 1.933e-06

plot(data4$tdelito,data4$plcompras,xlab="Tasa delitos",ylab="% Cambio lugar compras")
abline(modelo1m)

## Warning in abline(modelo1m): only using the first two of 3 regression
## coefficients

anova(modelo1m)

## Analysis of Variance Table
## 
## Response: plcompras
##            Df Sum Sq Mean Sq F value    Pr(>F)    
## tdelito     1   5953  5953.5 26.2392 5.029e-07 ***
## tipo        1    250   250.3  1.1034    0.2943    
## Residuals 345  78278   226.9                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo1m)
ajuste<-fitted(modelo1m)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

modelo2m<-lm(plpaseo~tdelito+tipo,data=data4)
summary(modelo2m)

## 
## Call:
## lm(formula = plpaseo ~ tdelito + tipo, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -31.403 -10.366  -2.373   7.021  56.177 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 10.36591    1.25279   8.274 2.85e-15 ***
## tdelito      0.29382    0.05263   5.583 4.79e-08 ***
## tipo         5.75228    1.83931   3.127  0.00191 ** 
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.61 on 345 degrees of freedom
## Multiple R-squared:  0.1327, Adjusted R-squared:  0.1276 
## F-statistic: 26.39 on 2 and 345 DF,  p-value: 2.171e-11

plot(data4$tdelito,data4$plpaseo,xlab="Tasa delitos",ylab="% Cambio lugar de paseo")
abline(modelo2m)

## Warning in abline(modelo2m): only using the first two of 3 regression
## coefficients

anova(modelo2m)

## Analysis of Variance Table
## 
## Response: plpaseo
##            Df Sum Sq Mean Sq F value    Pr(>F)    
## tdelito     1   9180  9180.0 42.9920 2.008e-10 ***
## tipo        1   2088  2088.5  9.7807  0.001913 ** 
## Residuals 345  73667   213.5                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo2m)
ajuste<-fitted(modelo2m)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

modelo3m<-lm(plvive~tdelito+tipo,data=data4)
summary(modelo3m)

## 
## Call:
## lm(formula = plvive ~ tdelito + tipo, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -12.972  -4.833  -3.308   2.226  55.636 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  3.30803    0.77015   4.295 2.27e-05 ***
## tdelito      0.13497    0.03235   4.172 3.83e-05 ***
## tipo        -1.75802    1.13071  -1.555    0.121    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.983 on 345 degrees of freedom
## Multiple R-squared:  0.0488, Adjusted R-squared:  0.04328 
## F-statistic:  8.85 on 2 and 345 DF,  p-value: 0.0001787

plot(data4$tdelito,data4$plvive,xlab="Tasa delitos",ylab="% Cambio lugar residencia")
abline(modelo3m)

## Warning in abline(modelo3m): only using the first two of 3 regression
## coefficients

anova(modelo3m)

## Analysis of Variance Table
## 
## Response: plvive
##            Df  Sum Sq Mean Sq F value    Pr(>F)    
## tdelito     1  1233.2 1233.17 15.2817 0.0001115 ***
## tipo        1   195.1  195.07  2.4174 0.1209128    
## Residuals 345 27840.0   80.70                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo3m)
ajuste<-fitted(modelo3m)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

Vamos a crear una variable dividiendo los municipios segun su poblacion

data4$pobmun<-0
data4$pobmun<-ifelse(data4$total>0 & data4$total<50000,1,data4$pobmun)
data4$pobmun<-ifelse(data4$total>=50000 & data4$total<100000,2,data4$pobmun)
data4$pobmun<-ifelse(data4$total>=100000 & data4$total<500000,3,data4$pobmun)
data4$pobmun<-ifelse(data4$total>=500000,4,data4$pobmun)
table(data4$pobmun)

## 
##   1   2   3   4 
##  90  65 132  61

Ahora usaremos esa variable

modelo1p<-lm(plcompras~tdelito+tipo+pobmun,data=data4)
summary(modelo1p)

## 
## Call:
## lm(formula = plcompras ~ tdelito + tipo + pobmun, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -29.239 -11.225  -2.554   8.021  59.499 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 10.50298    2.11658   4.962 1.10e-06 ***
## tdelito      0.25123    0.05571   4.509 8.93e-06 ***
## tipo         1.83091    1.96197   0.933    0.351    
## pobmun       0.26722    0.82356   0.324    0.746    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 15.08 on 344 degrees of freedom
## Multiple R-squared:  0.07372,    Adjusted R-squared:  0.06564 
## F-statistic: 9.126 on 3 and 344 DF,  p-value: 7.94e-06

¿Como se interpreta el coeficiente para pobmun?

Debemos cambiar algo… indicarle a R que la variable no es continua…

modelo1p<-lm(plcompras~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo1p)

## 
## Call:
## lm(formula = plcompras ~ tdelito + tipo + factor(pobmun), data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -30.142 -10.458  -2.190   7.589  61.753 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      8.78909    1.68838   5.206 3.34e-07 ***
## tdelito          0.22888    0.05544   4.128 4.60e-05 ***
## tipo             2.17584    1.94445   1.119   0.2639    
## factor(pobmun)2  5.01520    2.44976   2.047   0.0414 *  
## factor(pobmun)3  5.01383    2.15386   2.328   0.0205 *  
## factor(pobmun)4 -0.79364    2.60691  -0.304   0.7610    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared:  0.1019, Adjusted R-squared:  0.08874 
## F-statistic: 7.758 on 5 and 342 DF,  p-value: 6.265e-07

¿y por que no pusimos eso para la variable tipo?

modelo1p<-lm(plcompras~tdelito+factor(tipo)+factor(pobmun),data=data4)
summary(modelo1p)

## 
## Call:
## lm(formula = plcompras ~ tdelito + factor(tipo) + factor(pobmun), 
##     data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -30.142 -10.458  -2.190   7.589  61.753 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      8.78909    1.68838   5.206 3.34e-07 ***
## tdelito          0.22888    0.05544   4.128 4.60e-05 ***
## factor(tipo)1    2.17584    1.94445   1.119   0.2639    
## factor(pobmun)2  5.01520    2.44976   2.047   0.0414 *  
## factor(pobmun)3  5.01383    2.15386   2.328   0.0205 *  
## factor(pobmun)4 -0.79364    2.60691  -0.304   0.7610    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared:  0.1019, Adjusted R-squared:  0.08874 
## F-statistic: 7.758 on 5 and 342 DF,  p-value: 6.265e-07

Cuando son variables tipo dummy no es necesario…

Otra estrategia para la variable pobmun es crear 4 distintas variables y dejar una fuera del analisis

data4$pobmun1<-ifelse(data4$pobmun==1,1,0)
data4$pobmun2<-ifelse(data4$pobmun==2,1,0)
data4$pobmun3<-ifelse(data4$pobmun==3,1,0)
data4$pobmun4<-ifelse(data4$pobmun==4,1,0)

modelo1p<-lm(plcompras~tdelito+tipo+pobmun2+pobmun3+pobmun4,data=data4)
summary(modelo1p)

## 
## Call:
## lm(formula = plcompras ~ tdelito + tipo + pobmun2 + pobmun3 + 
##     pobmun4, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -30.142 -10.458  -2.190   7.589  61.753 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  8.78909    1.68838   5.206 3.34e-07 ***
## tdelito      0.22888    0.05544   4.128 4.60e-05 ***
## tipo         2.17584    1.94445   1.119   0.2639    
## pobmun2      5.01520    2.44976   2.047   0.0414 *  
## pobmun3      5.01383    2.15386   2.328   0.0205 *  
## pobmun4     -0.79364    2.60691  -0.304   0.7610    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared:  0.1019, Adjusted R-squared:  0.08874 
## F-statistic: 7.758 on 5 and 342 DF,  p-value: 6.265e-07

La ventaja es que podemos dejar fuera cualquiera de las pobmun(i) y ese sera nuestro grupo de referencia

modelo1p<-lm(plcompras~tdelito+tipo+pobmun1+pobmun2+pobmun4,data=data4)
summary(modelo1p)

## 
## Call:
## lm(formula = plcompras ~ tdelito + tipo + pobmun1 + pobmun2 + 
##     pobmun4, data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -30.142 -10.458  -2.190   7.589  61.753 
## 
## Coefficients:
##              Estimate Std. Error t value Pr(>|t|)    
## (Intercept) 13.802918   1.833568   7.528 4.62e-13 ***
## tdelito      0.228880   0.055442   4.128 4.60e-05 ***
## tipo         2.175836   1.944455   1.119   0.2639    
## pobmun1     -5.013832   2.153856  -2.328   0.0205 *  
## pobmun2      0.001367   2.297588   0.001   0.9995    
## pobmun4     -5.807473   2.317811  -2.506   0.0127 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared:  0.1019, Adjusted R-squared:  0.08874 
## F-statistic: 7.758 on 5 and 342 DF,  p-value: 6.265e-07

Ahora veamos los modelos

modelo1p<-lm(plcompras~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo1p)

## 
## Call:
## lm(formula = plcompras ~ tdelito + tipo + factor(pobmun), data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -30.142 -10.458  -2.190   7.589  61.753 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      8.78909    1.68838   5.206 3.34e-07 ***
## tdelito          0.22888    0.05544   4.128 4.60e-05 ***
## tipo             2.17584    1.94445   1.119   0.2639    
## factor(pobmun)2  5.01520    2.44976   2.047   0.0414 *  
## factor(pobmun)3  5.01383    2.15386   2.328   0.0205 *  
## factor(pobmun)4 -0.79364    2.60691  -0.304   0.7610    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.89 on 342 degrees of freedom
## Multiple R-squared:  0.1019, Adjusted R-squared:  0.08874 
## F-statistic: 7.758 on 5 and 342 DF,  p-value: 6.265e-07

plot(data4$tdelito,data4$plcompras,xlab="Tasa delitos",ylab="% Cambio lugar compras")
abline(modelo1p)

## Warning in abline(modelo1p): only using the first two of 6 regression
## coefficients

anova(modelo1p)

## Analysis of Variance Table
## 
## Response: plcompras
##                 Df Sum Sq Mean Sq F value    Pr(>F)    
## tdelito          1   5953  5953.5 26.8345 3.794e-07 ***
## tipo             1    250   250.3  1.1284   0.28886    
## factor(pobmun)   3   2402   800.7  3.6089   0.01362 *  
## Residuals      342  75876   221.9                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo1p)
ajuste<-fitted(modelo1p)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

modelo2p<-lm(plpaseo~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo2p)

## 
## Call:
## lm(formula = plpaseo ~ tdelito + tipo + factor(pobmun), data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -31.360  -9.848  -2.437   7.057  57.036 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      9.59656    1.66117   5.777 1.71e-08 ***
## tdelito          0.28643    0.05455   5.251 2.67e-07 ***
## tipo             5.84310    1.91312   3.054  0.00243 ** 
## factor(pobmun)2  2.01511    2.41028   0.836  0.40371    
## factor(pobmun)3  1.31660    2.11914   0.621  0.53482    
## factor(pobmun)4  0.04062    2.56489   0.016  0.98737    
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 14.65 on 342 degrees of freedom
## Multiple R-squared:  0.1352, Adjusted R-squared:  0.1226 
## F-statistic:  10.7 on 5 and 342 DF,  p-value: 1.45e-09

plot(data4$tdelito,data4$plpaseo,xlab="Tasa delitos",ylab="% Cambio lugar de paseo")
abline(modelo2p)

## Warning in abline(modelo2p): only using the first two of 6 regression
## coefficients

anova(modelo2p)

## Analysis of Variance Table
## 
## Response: plpaseo
##                 Df Sum Sq Mean Sq F value    Pr(>F)    
## tdelito          1   9180  9180.0 42.7443 2.271e-10 ***
## tipo             1   2088  2088.5  9.7244  0.001973 ** 
## factor(pobmun)   3    217    72.4  0.3373  0.798374    
## Residuals      342  73450   214.8                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo2p)
ajuste<-fitted(modelo2p)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

modelo3p<-lm(plvive~tdelito+tipo+factor(pobmun),data=data4)
summary(modelo3p)

## 
## Call:
## lm(formula = plvive ~ tdelito + tipo + factor(pobmun), data = data4)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -14.150  -5.101  -3.447   2.101  54.865 
## 
## Coefficients:
##                 Estimate Std. Error t value Pr(>|t|)    
## (Intercept)      3.99464    1.01770   3.925 0.000105 ***
## tdelito          0.14184    0.03342   4.244 2.83e-05 ***
## tipo            -1.40184    1.17205  -1.196 0.232504    
## factor(pobmun)2 -1.24423    1.47664  -0.843 0.400034    
## factor(pobmun)3 -0.54765    1.29827  -0.422 0.673417    
## factor(pobmun)4 -2.66657    1.57136  -1.697 0.090609 .  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 8.978 on 342 degrees of freedom
## Multiple R-squared:  0.05809,    Adjusted R-squared:  0.04432 
## F-statistic: 4.219 on 5 and 342 DF,  p-value: 0.0009815

plot(data4$tdelito,data4$plvive,xlab="Tasa delitos",ylab="% Cambio lugar residencia")
abline(modelo3p)

## Warning in abline(modelo3p): only using the first two of 6 regression
## coefficients

anova(modelo3p)

## Analysis of Variance Table
## 
## Response: plvive
##                 Df  Sum Sq Mean Sq F value    Pr(>F)    
## tdelito          1  1233.2 1233.17 15.2984 0.0001107 ***
## tipo             1   195.1  195.07  2.4200 0.1207194    
## factor(pobmun)   3   272.1   90.70  1.1252 0.3388538    
## Residuals      342 27567.9   80.61                      
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

residuos<-rstandard(modelo3p)
ajuste<-fitted(modelo3p)
plot(residuos~ajuste, main="Residuales")
m.residuos<-lm(residuos~ajuste)
abline(m.residuos,col="red")

qqnorm(residuos,main="QQ-Plot")
qqline(residuos,col="red")

Laboratorio 18 octubre

Mauricio Rodriguez Abreu

17/10/2017