VARIABLES

Column

VARIABLE DEPENDIENTE

Column

Tabla descriptiva de la varible Percepción de Seguridad

[1] "Descriptivo de la variable Percepción de Seguridad"


  1   2 
125 988

Introducción

La inseguridad es uno de los principales problemas sociales que afecta al Perú, impactando tanto en el bienestar de la población como en el desarrollo económico y social del país. En los últimos años, la percepción de inseguridad ha crecido significativamente entre los ciudadanos peruanos, quienes son testigos de robos, asaltos, extorsiones y delitos graves relacionados con el crimen organizado y no organizado en todas las regiones del país. Este fenómeno ha generado una sensación generalizada de vulnerabilidad en la población, la cual refleja no solo el miedo al crimen, sino también la desconfianza hacia las instituciones responsables de garantizar la seguridad.

percepseg = Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023

Seguro: 1 No seguro: 2

Column {data-width=350}

GRÁFICO 1

LA PERCEPCIÓN DE SEGURIDAD DE LOS CIUDADANOS AFECTADA POR SU CONFIANZA EN LA COMUNIDAD EN UNA ESCALA DEL 0 AL 100

GRÁFICO 2

LA PERCEPCIÓN DE SEGURIDAD DE LOS CIUDADANOS SEGÚN SU CONFIANZA EN LA POLICÍA NACIONAL

GRÁFICO 3

LA PERCEPCIÓN DE LA SEGURIDAD SEGÚN SI LOS CIUDADANOS HAN SIDO VÍCTIMAS DEL CRIMEN EN LOS ÚLTIMOS 12 MESES

GRÁFICO 4

PERCEPCIÓN DE SEGURIDAD SEGÚN GÉNERO

GRÁFICO 5

PERCENCIÓN DE SEGURIDAD SEGÚN LA ZONA DE RESIDENCIA DEL ENTREVISTADO

GRÁFICO 6

PERCEPCIÓN DE SEGURIDAD SEGÚN EL ÁREA GEOGRÁFICA DE RESIDENCIA DEL ENTREVISTADO

ESTADÍSTICOS

Column {data-width=500}

CORRELACIÓN 1

CON LA VARIABLE ZONA DE RESIDENCIA (ur)


    Pearson's Chi-squared test with Yates' continuity correction

data:  tabla_contingencia
X-squared = 9.5608e-31, df = 1, p-value = 1

El resultado de la prueba de chi-cuadrado muestra un valor de X-squared extremadamente bajo (9.5608e-31) y un valor p de 1, lo que indica que no hay evidencia significativa para rechazar la hipótesis nula. En otras palabras, no existe una relación estadísticamente significativa entre la zona de residencia (ur) y la percepción de seguridad (percepseg). Esto sugiere que, en el conjunto de datos analizado, la zona de residencia no influye en la percepción de seguridad.

GRÁFICO

CORRELACIÓN 2

CON LA VARIABLE GÉNERO DEL CIUDADANO ENTREVISTADO (genero)


    Pearson's Chi-squared test with Yates' continuity correction

data:  tabla_contingencia2
X-squared = 5.0319, df = 1, p-value = 0.02488

El resultado de la prueba de chi-cuadrado muestra un valor p de 0.02488, lo que es menor que 0.05. Esto indica que hay una relación estadísticamente significativa entre las dos variables. Por lo tanto, se rechaza la hipótesis nula de independencia, sugiriendo que existe una asociación entre las categorías de las variables en la tabla de contingencia tabla_contingencia2.

GRÁFICO

CORRELACIÓN 3

CON LA VARIABLE VÍCTIMA DEL CRÍMEN EN LOS ÚLTIMOS 12 MESES (victima)


    Pearson's Chi-squared test with Yates' continuity correction

data:  tabla_contingencia3
X-squared = 45.759, df = 1, p-value = 1.337e-11

El resultado de la prueba de chi-cuadrado muestra un valor p de 1.337e-11, que es mucho menor que 0.05. Esto indica que hay una relación estadísticamente significativa entre las dos variables en la tabla de contingencia tabla_contingencia3. Por lo tanto, se rechaza la hipótesis nula de independencia, sugiriendo que las variables están asociadas.

GRÁFICO

CORRELACIÓN 4

CON LA VARIABLE CONFIANZA EN LA COMUNIDAD (confianzacom)


    Pearson's Chi-squared test

data:  tabla_contingencia4
X-squared = 137.3, df = 3, p-value < 2.2e-16

El resultado de la prueba de chi-cuadrado muestra un valor de X-cuadrado de 137.3 con 3 grados de libertad y un p-valor menor a 2.2e-16, lo que indica que hay una asociación estadísticamente significativa entre las variables analizadas. Dado que el p-valor es extremadamente bajo, podemos rechazar la hipótesis nula de independencia, lo que sugiere que las variables están relacionadas entre sí.

GRÁFICO

CORRELACIÓN 5

CON LA VARIABLE CONFIANZA EN LA POLICIA (confianzapol)


    Pearson's Chi-squared test

data:  tabla_contingencia5
X-squared = 62.785, df = 6, p-value = 1.221e-11

El resultado de la prueba de chi-cuadrado muestra un valor de X-cuadrado de 62.785 con 6 grados de libertad y un p-valor de 1.221e-11, lo que indica una asociación estadísticamente significativa entre las variables. Dado que el p-valor es muy bajo, podemos rechazar la hipótesis nula de independencia, sugiriendo que las variables están fuertemente relacionadas entre sí.

CORRELACIÓN 6

CON LA VARIABLE ÁREA GEOGRÁFICA DE RESIDENCIA DEL ENTREVISTADO (confianzapol)


    Pearson's Chi-squared test

data:  tabla_contingencia6
X-squared = 0.27035, df = 7, p-value = 0.9999

El resultado de la prueba de chi-cuadrado muestra que no existe una relación significativa entre las variables analizadas. El valor de X-squared es 0.27035 con 7 grados de libertad, y el p-value es 0.9999, lo que indica que la probabilidad de observar una diferencia tan grande o más grande entre las frecuencias observadas y esperadas, si las variables fueran independientes, es extremadamente alta. Dado que el p-value es mayor que 0.05, no podemos rechazar la hipótesis nula de que las variables son independientes. En resumen, no hay evidencia estadística suficiente para afirmar que exista una relación entre las variables.

MODELOS

Column {data-width=500}

MODELO 1

CON UR

H1: La Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023 depende de la Zona de residencia del entrevistado.


Call:
glm(formula = percepsegRE ~ urRE, family = binomial, data = data)

Coefficients:
             Estimate Std. Error z value Pr(>|z|)    
(Intercept)  2.071951   0.129632  15.983   <2e-16 ***
urRERural   -0.009901   0.190363  -0.052    0.959    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 782.03  on 1112  degrees of freedom
Residual deviance: 782.03  on 1111  degrees of freedom
AIC: 786.03

Number of Fisher Scoring iterations: 4

El coeficiente de urRERural no es significativo, lo que indica que no hay una diferencia estadísticamente significativa en la percepción de seguridad entre las personas que viven en áreas rurales y urbanas. La deviance nula es 782.03 y la deviance residual también es 782.03, lo que indica que el modelo no ha mejorado con respecto al modelo nulo (modelo sin predictores), lo que coincide con la falta de significancia de la variable urRE. CONCLUSIONES: Zona de residencia (urbano vs. rural) no parece tener un impacto significativo sobre la percepción de seguridad. La variable urRE no es significativa en este modelo de regresión logística.

MODELO 2


Call:
glm(formula = percepsegRE ~ generoRE + victimaRE, family = binomial, 
    data = data)

Coefficients:
              Estimate Std. Error z value Pr(>|z|)    
(Intercept)     3.2552     0.2856  11.397  < 2e-16 ***
generoREMujer   0.7250     0.2015   3.598  0.00032 ***
victimaRENO    -1.9750     0.3034  -6.510 7.51e-11 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 782.03  on 1112  degrees of freedom
Residual deviance: 713.02  on 1110  degrees of freedom
AIC: 719.02

Number of Fisher Scoring iterations: 6

CONCLUSIONES: Se muestra que el género y la experiencia como víctima de un delito influyen en la percepción de seguridad. Ser mujer aumenta significativamente la percepción de seguridad (coeficiente positivo y significativo), mientras que no haber sido víctima de un delito también tiene un efecto positivo importante.

MODELO 3

CON LAS VARIABLES ESTADÍSTICAMENTE SIGNIFICATIVAS

CON GENERO, VICTIMA Y CONFIANZACOM

H4: La Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023 depende del Género del individuo entrevistado, si los Ciudadanos peruanos que han sido víctima del crimen en los últimos 12 meses (2023) y de la confianza en la comunidad por parte de ciudadanos peruanos.

Primero reescalamos las variables


Call:
glm(formula = percepsegRE ~ +generoRE + victimaRE + confianzacom_invertido, 
    family = binomial, data = data)

Coefficients:
                       Estimate Std. Error z value Pr(>|z|)    
(Intercept)              6.7919     0.5212  13.032  < 2e-16 ***
generoREMujer            0.5816     0.2173   2.677  0.00743 ** 
victimaRENO             -1.9616     0.3131  -6.266  3.7e-10 ***
confianzacom_invertido  -1.2187     0.1284  -9.490  < 2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 782.03  on 1112  degrees of freedom
Residual deviance: 593.58  on 1109  degrees of freedom
AIC: 601.58

Number of Fisher Scoring iterations: 6

En conjunto, todas las variables incluidas son predictores significativos del modelo, que tiene un AIC de 601.58, lo que sugiere un buen ajuste relativo.

MODELO 4

CON GENERO, VICTIMA ,CONFIANZACOM Y CONFIANZAPOL

H5: La Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023 depende del Género del individuo entrevistado, si los Ciudadanos peruanos que han sido víctima del crimen en los últimos 12 meses (2023), de la confianza en la comunidad por parte de ciudadanos peruanos y la confianza en la policía nacional por parte de ciudadanos peruanos.


Call:
glm(formula = percepsegRE ~ generoRE + victimaRE + confianzacom_invertido + 
    confianzapol, family = binomial, data = data)

Coefficients:
                       Estimate Std. Error z value Pr(>|z|)    
(Intercept)             6.49000    0.55396  11.716  < 2e-16 ***
generoREMujer           0.58162    0.21781   2.670  0.00758 ** 
victimaRENO            -1.95852    0.31241  -6.269 3.63e-10 ***
confianzacom_invertido -1.23118    0.12891  -9.550  < 2e-16 ***
confianzapol            0.08585    0.06136   1.399  0.16180    
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 782.03  on 1112  degrees of freedom
Residual deviance: 591.60  on 1108  degrees of freedom
AIC: 601.6

Number of Fisher Scoring iterations: 6

En conjunto, todas las variables incluidas son predictores significativos del modelo, que tiene un AIC de 601.6, lo que sugiere un buen ajuste relativo.

COMPARACIÓN DE MODELOS

Comparando modelos
	modelo (1)	modelo (2)	modelo (3)	modelo (4)
(Intercept)	7.940298***	25.925569***	890.626409***	658.525169***
	[6.207973, 10.32753]	[15.454325, 47.77649]	[335.88790, 2598.899095]	[233.235437, 2054.071638]
urRERural	0.990148
	[0.682169, 1.44091]
generoREMujer		2.064663***	1.788918**	1.788943**
		[ 1.396771, 3.08187]	[ 1.17241, 2.752278]	[ 1.171365, 2.755557]
victimaRENO		0.138768***	0.140627***	0.141067***
		[ 0.073137, 0.24247]	[ 0.07287, 0.250851]	[ 0.073189, 0.251328]
confianzacom_invertido			0.295626***	0.291949***
			[ 0.22785, 0.377247]	[ 0.224835, 0.372964]
confianzapol				1.089643
				[ 0.966716, 1.230100]
Num.Obs.	1113	1113	1113	1113
AIC	786.0	719.0	601.6	601.6
BIC	796.1	734.1	621.6	626.7
RMSE	0.32	0.31	0.28	0.28
Log.Lik.	-391.013	-356.510	-296.788	-295.802
+ p < 0.1, * p < 0.05, p < 0.01, * p < 0.001

El modelo (3) es el mejor modelo, ya que tiene los valores más bajos de AIC y BIC, además de mantener significativas las principales variables explicativas (géneroREMujer, victimaRENO, confianzacom_invertido). Por lo tanto, el modelo (3) ofrece la mejor predicción de la percepción de seguridad en el vecindario.

Column

Tabla Chi- Cuadrado

Tabla ANOVA para comparar modelos
Resid. Df	Resid. Dev	Df	Deviance	Pr(>Chi)
1111	782.0266	NA	NA	NA
1110	713.0202	1	69.006432	0.0000000
1109	593.5767	1	119.443458	0.0000000
1108	591.6047	1	1.972019	0.1602338

Análisis

En conclusión, ser mujer disminuye significativamente la percepción de seguridad. Haber sido víctima de un delito disminuye notablemente la percepción de seguridad. Menor confianza en la comunidad tiene un efecto negativo fuerte en la percepción de seguridad. La confianza en la policía no es un predictor significativo en ningúno de los modelos. Finalmente las experiencias personales (como ser víctima) y la confianza en la comunidad, así como el género del entrevistado, tienen los efectos más fuertes y significativos sobre la percepción de seguridad.

FACTORIZACIÓN

VEAMOS SI PODEMOS REALIZAR EL ANÁLISIS FACTORIAL

  percepseg confianzacom confianzapol
1         2            3            3
2         2            3            3
3         2            3            3
4         2            3            3
5         2            3            3
6         2            3            3

              percepseg confianzacom confianzapol
percepseg    1.00000000   0.32894703   0.01078491
confianzacom 0.32894703   1.00000000  -0.06543012
confianzapol 0.01078491  -0.06543012   1.00000000

$chisq
[1] 11.65871

$p.value
[1] 0.008648576

$df
[1] 3

Kaiser-Meyer-Olkin factor adequacy
Call: KMO(r = cor_matrix)
Overall MSA =  0.49
MSA for each item = 
   percepseg confianzacom confianzapol 
         0.5          0.5          0.4

CONCLUSIONES

Los resultados sugieren que el análisis factorial no es adecuado con estas variables debido al bajo valor de KMO. La baja correlación y la medida de adecuación indican que estas variables no comparten suficientes factores latentes.

CLUSTER

ANÁLISIS CON CLUSTER

clusters_agnes
  1   2   3 
532 456 125

[1] 1

[1] 0


  1   2   3 
532 455 125

La calidad del agrupamiento es baja, con un promedio de silueta de 0.28, lo que indica que los clústeres formados no están claramente definidos.

CONCLUSIONES

En conclusión, la percepción de seguridad de los ciudadanos se ve influida por diversos factores. Entre ellos nuestras hipótesis integraban el factor género de la persona, el factor área geográfica de residencia del entrevistado, el factor zona de residencia del entrevistado, el factor de si ha sido victima de crimen , el factor de confianza en su comunidad y el factor de confianza en la policia nacional.

---
title: "LA PERCEPCIÓN DE SEGURIDAD EN EL PERÚ: HALLAZGOS A TRAVÉS DE LA ENCUESTA LAPOP BAROMETER 2023
"
output: 
  flexdashboard::flex_dashboard:
    theme: flatly
    social: menu
    source_code: embed
    orientation: columns
    vertical_layout: fill
---


```{r setup, include=FALSE}
library(flexdashboard)
```



```{r}
library(rio)
data = import("dataf.xlsx")
```

```{r}
data$percepsegg <- as.factor(data$percepseg)
levels(data$percepsegg) <- c("Seguro", "No Seguro")
```



```{r , echo=FALSE}

library(car)
data$confianzacomr <- car::recode(data$confianzacom, "1:2=0 ; 3:4=100")

```


```{r}
library(Rmisc)
G1 <- summarySE(data = data, measurevar = "confianzacomr", groupvar = "percepsegg", na.rm = TRUE)

```






*VARIABLES* {data-icon="fa-signal"}
===================================== 


Column {data-width=400}
-----------------------------------------------------------------------

### VARIABLE DEPENDIENTE

```{r}

counts <- c(125, 988)
labels <- c("Seguro", "No Seguro")


percentages <- round(100 * counts / sum(counts), 1)  


labels_with_percent <- paste(labels, "\n", percentages, "%", sep = "")


pie(
  counts,
  labels = labels_with_percent,  
  col = c("blue", "red"),
  main = "Percepción de Seguridad en el vecindario
  de ciudadanos peruanos en 2023"
)

```

Column {data-width=300}
-----------------------------------------------------------------------

### Tabla descriptiva de la varible Percepción de Seguridad 

```{r}
print("Descriptivo de la variable Percepción de Seguridad")
print(table(data$percepseg))
```

### Introducción 

La inseguridad es uno de los principales problemas sociales que afecta al Perú, impactando tanto en el bienestar de la población como en el desarrollo económico y social del país. En los últimos años, la percepción de inseguridad ha crecido significativamente entre los ciudadanos peruanos, quienes son testigos de robos, asaltos, extorsiones y delitos graves relacionados con el crimen organizado y no organizado en todas las regiones del país. Este fenómeno ha generado una sensación generalizada de vulnerabilidad en la población, la cual refleja no solo el miedo al crimen, sino también la desconfianza hacia las instituciones responsables de garantizar la seguridad.

percepseg = Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023

Seguro: 1
No seguro: 2









Column {data-width=350} {.tabset}
-----------------------------------------------------------------------

### GRÁFICO 1

#### LA PERCEPCIÓN DE SEGURIDAD DE LOS CIUDADANOS AFECTADA POR SU CONFIANZA EN LA COMUNIDAD EN UNA ESCALA DEL 0 AL 100
```{r}
# Agregar línea de promedio e intervalos de confianza
library(ggplot2)
g1 <- ggplot(G1, aes(x = reorder(percepsegg, confianzacomr), y = confianzacomr)) +
geom_bar(stat = "identity") +
geom_errorbar(aes(ymin = confianzacomr - ci, ymax = confianzacomr + ci), width = 0.2) +
coord_flip() +
labs(title = "Percepción de segurdidad según la confianza en la comunidad",
subtitle = "LAPOP",
x = " ",
y = "Confianza en la comunidad (0 es mucha confianza) ") +
geom_hline(yintercept = mean(data$confianzacomr), linetype = "dashed", color = "blue", size = 1) +
ylim(0, 80) +
geom_text(aes(label = paste0(round(confianzacomr, 0), "%")), vjust = 0.5, hjust = -1, color = "black", size = 3)



library(ggthemes)
g1 + theme_economist() + ggtitle("Percepción de segurdidad 
                                 según la confianza en la comunidad")

```

### GRÁFICO 2

#### LA PERCEPCIÓN DE SEGURIDAD DE LOS CIUDADANOS SEGÚN SU CONFIANZA EN LA POLICÍA NACIONAL

```{r}
data$confianzapolr <- car::recode(data$confianzapol, "1:4=0 ; 5:7=100")
```
```{r}
G2 <- summarySE(data = data, measurevar = "confianzapolr", groupvar = "percepsegg", na.rm = TRUE)
```
```{r}
g2 <- ggplot(G2, aes(x = reorder(percepsegg, confianzapolr), y = confianzapolr)) +
geom_bar(stat = "identity") +
geom_errorbar(aes(ymin = confianzapolr - ci, ymax = confianzapolr + ci), width = 0.2) +
coord_flip() +
labs(title = "Percepción de segurdidad según la confianza en la policía",
subtitle = "LAPOP",
x = " ",
y = "Confianza en la policía (0 es poca confianza)") +
geom_hline(yintercept = mean(data$confianzapolr), linetype = "dashed", color = "blue", size = 1) +
ylim(0, 80) +
geom_text(aes(label = paste0(round(confianzapolr, 0), "%")), vjust = 0.5, hjust = -1, color = "black", size = 3)


g2 + theme_economist() + ggtitle("Percepción de segurdidad según la confianza en la policía")


```

### GRÁFICO 3

#### LA PERCEPCIÓN DE LA SEGURIDAD SEGÚN SI LOS CIUDADANOS HAN SIDO VÍCTIMAS DEL CRIMEN EN LOS ÚLTIMOS 12 MESES 

```{r}
data$percepsege <- car::recode(data$percepseg, "1=0 ; 2=100")


```


```{r}
data$victimag <- as.factor(data$victima)
levels(data$victimag) <- c("Sí", "No")
```

```{r}
G3 <- summarySE(data = data, measurevar = "percepsege", groupvar = "victimag", na.rm = TRUE)

```

```{r}
g3 <- ggplot(G3, aes(x = reorder(victimag, percepsege), y = percepsege)) +
  geom_bar(stat = "identity") +
  geom_errorbar(aes(ymin = percepsege - ci, ymax = percepsege + ci), width = 0.2) +
  coord_flip() +
  labs(
    title = "Percepción de seguridad según si ha sido víctima del crimen en los últimos 12 meses (2023)",
    subtitle = "LAPOP",
    x = " ",
    y = "Percepción de seguridad (0 es mayor percepción de seguridad)"
  ) +
  # Ajustar límites dinámicamente
  scale_y_continuous(
    limits = c(
      0, 
      max(G3$percepsege + G3$ci, na.rm = TRUE)  # Calcula el valor máximo basado en los datos
    ),
    expand = expansion(mult = c(0, 0.05))      # Agrega un margen visual superior del 5%
  ) +
  geom_hline(
    yintercept = mean(G3$percepsege, na.rm = TRUE), # Asegúrate de calcular el promedio correctamente
    linetype = "dashed", color = "blue", size = 1
  ) +
  geom_text(
    aes(label = paste0(round(percepsege, 0), "%")),
    vjust = 0.5, hjust = -1, color = "black", size = 3
  ) +
  theme_economist() +
  ggtitle("Percepción de seguridad según si ha sido víctima del crimen en los últimos 12 meses (2023)")

g3
```

### GRÁFICO 4

#### PERCEPCIÓN DE SEGURIDAD SEGÚN GÉNERO

```{r}
data$generog <- as.factor(data$genero)
levels(data$generog) <- c("Hombre", "Mujer")
```

```{r}
G4 <- summarySE(data = data, measurevar = "percepsege", groupvar = "generog", na.rm = TRUE)

```



```{r}
g4 <- ggplot(G4, aes(x = reorder(generog, percepsege), y = percepsege)) +
  geom_bar(stat = "identity") +
  geom_errorbar(aes(ymin = percepsege - ci, ymax = percepsege + ci), width = 0.2) +
  coord_flip() +
  labs(
    title = "Percepción de seguridad según género",
    subtitle = "LAPOP",
    x = " ",
    y = "Percepción de seguridad ( 0 es mayor percepción de seguridad)"
  ) +
  # Ajustar límites dinámicamente
  scale_y_continuous(
    limits = c(0, max(G4$percepsege + G4$ci, na.rm = TRUE)), # Incluye los intervalos superiores
    expand = expansion(mult = c(0, 0.05))                   # Agrega un margen visual
  ) +
  geom_hline(
    yintercept = mean(G4$percepsege, na.rm = TRUE),          # Promedio de percepsege
    linetype = "dashed", color = "blue", size = 1
  ) +
  geom_text(
    aes(label = paste0(round(percepsege, 0), "%")),
    vjust = 0.5, hjust = -1, color = "black", size = 3
  )



g4 + theme_economist() + ggtitle("Percepción de seguridad según género")

```

### GRÁFICO 5
 
#### PERCENCIÓN DE SEGURIDAD SEGÚN LA ZONA DE RESIDENCIA DEL ENTREVISTADO 

```{r}
data$urg <- as.factor(data$ur)
levels(data$urg) <- c("Urbano", "Rural")
```

```{r}
G5 <- summarySE(data = data, measurevar = "percepsege", groupvar = "urg", na.rm = TRUE)

```


```{r}
g5 <- ggplot(G5, aes(x = reorder(urg, percepsege), y = percepsege)) +
  geom_bar(stat = "identity") +
  geom_errorbar(
    aes(ymin = percepsege - ci, ymax = percepsege + ci), 
    width = 0.2
  ) +
  coord_flip() +
  labs(
    title = "Percepción de seguridad según zona",
    subtitle = "LAPOP",
    x = " ",
    y = "Percepción de seguridad (0 es mayor percepción de seguridad)"
  ) +
  # Ajustar límites dinámicamente
  scale_y_continuous(
    limits = c(
      0, 
      max(G5$percepsege + G5$ci, na.rm = TRUE)  # Límite superior dinámico
    ),
    expand = expansion(mult = c(0, 0.05))      # Margen adicional del 5%
  ) +
  geom_hline(
    yintercept = mean(G5$percepsege, na.rm = TRUE), # Promedio dinámico
    linetype = "dashed", color = "blue", size = 1
  ) +
  geom_text(
    aes(label = paste0(round(percepsege, 0), "%")),
    vjust = 0.5, hjust = -1, color = "black", size = 3
  ) +
  theme_economist() +
  ggtitle("Percepción de seguridad según zona")

g5

```

### GRÁFICO 6

#### PERCEPCIÓN DE SEGURIDAD SEGÚN EL ÁREA GEOGRÁFICA DE RESIDENCIA DEL ENTREVISTADO

```{r}
library(dplyr)

data <- data %>%
  mutate(estratopri = case_when(
    estratopri == 1101 ~ "Costa Norte",
    estratopri == 1102 ~ "Costa Sur",
    estratopri == 1103 ~ "Lima Metropolitana",
    estratopri == 1104 ~ "Selva",
    estratopri == 1105 ~ "Sierra Centro",
    estratopri == 1106 ~ "Sierra Norte",
    estratopri == 1107 ~ "Sierra Sur",
    TRUE ~ "Desconocido"  # En caso de que haya algún valor inesperado
  ))
```


```{r}
data$estratopri <- as.factor(data$estratopri)
```



```{r}
G6 <- summarySE(data = data, measurevar = "percepsege", groupvar = "estratopri", na.rm = TRUE)

```

```{r}
# Filtrar NA y valores fuera de rango
G6_clean <- G6 %>%
  filter(!is.na(percepsege) & !is.na(ci) & !is.na(estratopri)) %>%
  filter(percepsege >= 0 & percepsege <= 100)

# Graficar
g6 <- ggplot(G6_clean, aes(x = reorder(estratopri, percepsege), y = percepsege)) +
  geom_bar(stat = "identity") +
  geom_errorbar(aes(ymin = percepsege - ci, ymax = percepsege + ci), width = 0.2) +
  coord_flip() +
  labs(
    title = "Percepción de seguridad según el Área geográfica de residencia del entrevistado",
    subtitle = "LAPOP",
    x = " ",
    y = "Percepción de seguridad (0 es mayor percepción de seguridad)"
  ) +
  scale_y_continuous(
    limits = c(0, max(G6_clean$percepsege + G6_clean$ci, na.rm = TRUE)),  
    expand = expansion(mult = c(0, 0.05))  
  ) +
  geom_hline(
    yintercept = mean(G6_clean$percepsege, na.rm = TRUE), 
    linetype = "dashed", color = "blue", size = 1
  ) +
  geom_text(aes(label = paste0(round(percepsege, 0), "%")), 
            vjust = 0.5, hjust = -1, color = "black", size = 3) +
  theme_economist() +
  ggtitle("Percepción de seguridad según el Área geográfica de residencia del entrevistado")

g6
```

ESTADÍSTICOS {data-icon="fa-signal"}
===================================== 


Column {data-width=500} {.tabset}
-----------------------------------------------------------------------

### CORRELACIÓN 1

##### CON LA VARIABLE ZONA DE RESIDENCIA (ur)

```{r}
data$percepsegRE <- factor(data$percepseg, levels = c(1, 2), labels = c("Seguro", "No seguro"))

data$urRE <- factor(data$ur, levels = c(1, 2), labels = c("Urbano", "Rural"))

tabla_contingencia <- table(data$percepsegRE, data$urRE)

# Realizar la prueba de chi-cuadrado
E1 <- chisq.test(tabla_contingencia)

# Ver los resultados
E1

```
El resultado de la prueba de chi-cuadrado muestra un valor de X-squared extremadamente bajo (9.5608e-31) y un valor p de 1, lo que indica que *no hay evidencia significativa* para rechazar la hipótesis nula. En otras palabras, *no existe una relación estadísticamente significativa* entre la zona de residencia (`ur`) y la percepción de seguridad (`percepseg`). Esto sugiere que, en el conjunto de datos analizado, la zona de residencia no influye en la percepción de seguridad.

GRÁFICO 
```{r}
library(ggplot2)
grafico <- as.data.frame(tabla_contingencia)
colnames(grafico) <- c("Percepcion_Seguridad", "Zona_Residencia", "Frecuencia")

# Crear un gráfico de barras
ggplot(grafico, aes(x = Percepcion_Seguridad, y = Frecuencia, fill = Zona_Residencia)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Relación entre Percepción de Seguridad y Zona de Residencia",
       x = "Percepción de Seguridad",
       y = "Frecuencia",
       fill = "Zona de Residencia") +
  theme_minimal()
```


### CORRELACIÓN 2

##### CON LA VARIABLE GÉNERO DEL CIUDADANO ENTREVISTADO (genero)

```{r}
data$generoRE <- factor(data$genero, levels = c(1, 2), labels = c("Hombre", "Mujer"))

tabla_contingencia2 <- table(data$percepsegRE, data$generoRE)

# Realizar la prueba de chi-cuadrado
E2 <- chisq.test(tabla_contingencia2)

# Ver los resultados
E2
```
El resultado de la prueba de chi-cuadrado muestra un **valor p de 0.02488**, lo que es **menor que 0.05**. Esto indica que **hay una relación estadísticamente significativa** entre las dos variables. Por lo tanto, se rechaza la hipótesis nula de independencia, sugiriendo que existe una asociación entre las categorías de las variables en la tabla de contingencia `tabla_contingencia2`.


GRÁFICO

```{r}


grafico2 <- as.data.frame(tabla_contingencia2)
colnames(grafico2) <- c("Percepcion_Seguridad", "Genero", "Frecuencia")

# Crear un gráfico de barras
ggplot(grafico2, aes(x = Percepcion_Seguridad, y = Frecuencia, fill = Genero)) +
  geom_bar(stat = "identity", position = "dodge") +
  labs(title = "Relación entre Percepción de Seguridad y Género del individuo entrevistado",
       x = "Percepción de Seguridad",
       y = "Frecuencia",
       fill = "Género") +
  theme_minimal()
```

### CORRELACIÓN 3

##### CON LA VARIABLE VÍCTIMA DEL CRÍMEN EN LOS ÚLTIMOS 12 MESES (victima)


```{r}
data$victimaRE <- factor(data$victima, levels = c(1, 2), labels = c("SÍ", "NO"))

tabla_contingencia3 <- table(data$percepsegRE, data$victimaRE)


E3 <- chisq.test(tabla_contingencia3)


E3
```
El resultado de la prueba de chi-cuadrado muestra un **valor p de 1.337e-11**, que es **mucho menor que 0.05**. Esto indica que **hay una relación estadísticamente significativa** entre las dos variables en la tabla de contingencia `tabla_contingencia3`. Por lo tanto, se rechaza la hipótesis nula de independencia, sugiriendo que las variables están asociadas.

GRÁFICO 
```{r}
grafico3 <- as.data.frame(tabla_contingencia3)
colnames(grafico3) <- c("Percepcion_Seguridad", "Victima", "Frecuencia")

# Crear un gráfico de barras apiladas
ggplot(grafico3, aes(x = Percepcion_Seguridad, y = Frecuencia, fill = Victima)) +
  geom_bar(stat = "identity", position = "stack") +
  labs(title = "Relación entre Percepción de Seguridad y Haber Sido Víctima de Crimen",
       x = "Percepción de Seguridad",
       y = "Frecuencia",
       fill = "Víctima") +
  theme_minimal()
```


### CORRELACIÓN 4

##### CON LA VARIABLE CONFIANZA EN LA COMUNIDAD (confianzacom)

```{r}
library(dplyr)
data <- data %>%
  mutate(confianzacom_invertido = case_when(
    confianzacom == 1 ~ 4,  # Muy confiable -> 4
    confianzacom == 2 ~ 3,  # Algo confiable -> 3
    confianzacom == 3 ~ 2,  # Poco confiable -> 2
    confianzacom == 4 ~ 1   # Nada confiable -> 1
  ))

tabla_contingencia4 <- table(data$percepsegRE, data$confianzacom_invertido)
chisq.test(tabla_contingencia4)
```
El resultado de la prueba de chi-cuadrado muestra un **valor de X-cuadrado de 137.3** con **3 grados de libertad** y un **p-valor menor a 2.2e-16**, lo que indica que **hay una asociación estadísticamente significativa** entre las variables analizadas. Dado que el p-valor es extremadamente bajo, podemos rechazar la hipótesis nula de independencia, lo que sugiere que las variables están **relacionadas** entre sí.

GRÁFICO 
```{r}
ggplot(as.data.frame(tabla_contingencia4), aes(x = Var1, y = Freq, fill = Var2)) +
  geom_bar(stat = "identity") +
  labs(x = "Percepción de seguridad", y = "Frecuencia", 
       title = "Relación entre Percepción de seguridad y Confianza en la comunidad ",
       fill = "Confianza en la comunidad invertida") +
  theme_minimal() +
  scale_fill_manual(values = c("lightblue", "orange", "pink", "green")) 
```


### CORRELACIÓN 5

##### CON LA VARIABLE CONFIANZA EN LA POLICIA (confianzapol)


```{r}
tabla_contingencia5 <- table(data$percepsegRE, data$confianzapol)
chisq.test(tabla_contingencia5)
```
El resultado de la prueba de chi-cuadrado muestra un **valor de X-cuadrado de 62.785** con **6 grados de libertad** y un **p-valor de 1.221e-11**, lo que indica una **asociación estadísticamente significativa** entre las variables. Dado que el p-valor es muy bajo, podemos rechazar la hipótesis nula de independencia, sugiriendo que las variables están **fuertemente relacionadas** entre sí.

```{r}
library(ggplot2)
ggplot(as.data.frame(tabla_contingencia5), aes(x = Var1, y = Freq, fill = Var2)) +
  geom_bar(stat = "identity") +
  labs(x = "Percepción de seguridad", y = "Frecuencia", 
       title = "Relación entre Percepción de seguridad y Confianza en la policía",
       fill = "Confianza en la policía") +
  theme_minimal() +
  scale_fill_manual(values = c("lightblue", "orange", "pink", "green","yellow", "red", "purple"))
```

### CORRELACIÓN 6

##### CON LA VARIABLE ÁREA GEOGRÁFICA DE RESIDENCIA DEL ENTREVISTADO (confianzapol)

```{r}
tabla_contingencia6 <- table(data$percepsegRE, data$estratopri)
chisq.test(tabla_contingencia6)

```
El resultado de la *prueba de chi-cuadrado* muestra que no existe una relación significativa entre las variables analizadas. El valor de **X-squared** es 0.27035 con **7 grados de libertad**, y el **p-value** es 0.9999, lo que indica que la probabilidad de observar una diferencia tan grande o más grande entre las frecuencias observadas y esperadas, si las variables fueran independientes, es extremadamente alta. Dado que el **p-value** es mayor que 0.05, no podemos rechazar la hipótesis nula de que las variables son independientes. En resumen, no hay evidencia estadística suficiente para afirmar que exista una relación entre las variables.

```{r}
df <- as.data.frame(tabla_contingencia6)
ggplot(df, aes(x = Var1, y = Freq, fill = Var2)) +
  geom_bar(stat = "identity", position = "stack") +
  labs(x = "Percepción de Seguridad", y = "Frecuencia", fill = "Área Geográfica") +
  theme_minimal() +
  ggtitle("Distribución de la Percepción de Seguridad por Área Geográfica") +
  theme(axis.text.x = element_text(angle = 45, hjust = 1))
```


MODELOS  {data-icon="fa-signal"}
=====================================


Column {data-width=500} {.tabset}
-----------------------------------------------------------------------


### MODELO 1

CON UR 

H1: La Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023 depende de la Zona de residencia del entrevistado.

```{r}
data$percepsegRE <- factor(data$percepseg, levels = c(1, 2), labels = c("Seguro", "No seguro"))
data$urRE <- factor(data$ur, levels = c(1, 2), labels = c("Urbano", "Rural"))

# Ajustar el modelo de regresión logística
m1 <- glm(percepsegRE ~ urRE, data = data, family = binomial)

# Resumen del modelo
summary(m1)
```


El coeficiente de urRERural no es significativo, lo que indica que no hay una diferencia estadísticamente significativa en la percepción de seguridad entre las personas que viven en áreas rurales y urbanas.
La deviance nula es 782.03 y la deviance residual también es 782.03, lo que indica que el modelo no ha mejorado con respecto al modelo nulo (modelo sin predictores), lo que coincide con la falta de significancia de la variable urRE.
CONCLUSIONES:
*Zona de residencia (urbano vs. rural) no parece tener un impacto significativo sobre la percepción de seguridad*. La variable urRE no es significativa en este modelo de regresión logística.


### MODELO 2

```{r}
data$victimaRE <- factor(data$victima, levels = c(1, 2), labels = c("SÍ", "NO"))
```
```{r}
m3 <- glm(percepsegRE ~ generoRE + victimaRE, data = data, family = binomial)
summary(m3)
```
CONCLUSIONES: 
Se muestra que el género y la experiencia como víctima de un delito influyen en la percepción de seguridad. Ser mujer aumenta significativamente la percepción de seguridad (coeficiente positivo y significativo), mientras que no haber sido víctima de un delito también tiene un efecto positivo importante.

### MODELO 3

#### CON LAS VARIABLES ESTADÍSTICAMENTE SIGNIFICATIVAS

CON  GENERO, VICTIMA Y CONFIANZACOM

H4: La Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023 depende del Género del individuo entrevistado, si los Ciudadanos peruanos que han sido víctima del crimen en los últimos 12 meses (2023) y de la confianza en la comunidad por parte de ciudadanos peruanos.

Primero reescalamos las variables 

```{r}
library(dplyr)
data <- data %>%
  mutate(confianzacom_invertido = case_when(
    confianzacom == 1 ~ 4,  # Muy confiable -> 4
    confianzacom == 2 ~ 3,  # Algo confiable -> 3
    confianzacom == 3 ~ 2,  # Poco confiable -> 2
    confianzacom == 4 ~ 1   # Nada confiable -> 1
  ))
```

```{r}
m4 <- glm(percepsegRE ~ + generoRE + victimaRE + confianzacom_invertido, data = data, family = binomial)

# Ver el resumen del modelo
summary(m4)
```
En conjunto, todas las variables incluidas son predictores significativos del modelo, que tiene un AIC de 601.58, lo que sugiere un buen ajuste relativo.


### MODELO 4

CON GENERO, VICTIMA ,CONFIANZACOM Y CONFIANZAPOL 

H5: La Percepción de seguridad en el vecindario de ciudadanos peruanos en 2023 depende del Género del individuo entrevistado, si los Ciudadanos peruanos que han sido víctima del crimen en los últimos 12 meses (2023), de la confianza en la comunidad por parte de ciudadanos peruanos y la confianza en la policía nacional por parte de ciudadanos peruanos.

```{r}
m5 <- glm(percepsegRE ~   generoRE + victimaRE + confianzacom_invertido + confianzapol, data = data, family = binomial)

# Ver el resumen del modelo
summary(m5)
```
En conjunto, todas las variables incluidas son predictores significativos del modelo, que tiene un AIC de 601.6, lo que sugiere un buen ajuste relativo.








### *COMPARACIÓN DE MODELOS*

```{r}
formatoNumero <- function(x) {
  format(x, digits = 6, scientific = FALSE)
}
```

```{r}
# Librerías necesarias
library(kableExtra)
library(modelsummary)

# Definir modelos
modelsrl <- list(
  'modelo (1)' = m1,
  'modelo (2)' = m3,
  'modelo (3)' = m4,
  'modelo (4)' = m5
  )

# Definir la función de formato
formatoNumero <- function(x) {
  format(x, digits = 6, scientific = FALSE)
}

# Generar el resumen de modelos
modelsummary(
  modelsrl,
  fmt = formatoNumero,
  exponentiate = TRUE,
  statistic = 'conf.int',
  title = "Comparando modelos",
  stars = TRUE,
  gof_map = c("nobs", "aic", "bic", "rmse", "logLik"), # Indicadores de bondad de ajuste
  gof_omit = c("F"),
  output = "kableExtra"
)

```

El modelo (3) es el mejor modelo, ya que tiene los valores más bajos de AIC y BIC, además de mantener significativas las principales variables explicativas (géneroREMujer, victimaRENO, confianzacom_invertido). Por lo tanto, el modelo (3) ofrece la mejor predicción de la percepción de seguridad en el vecindario.





Column {data-width=300}
-----------------------------------------------------------------------
### Tabla Chi- Cuadrado

```{r}
library(dplyr)
library(kableExtra)
anova(m1,m3, m4, m5, test = "Chisq") %>%
kable(caption = "Tabla ANOVA para comparar modelos")%>%kableExtra::kable_styling(full_width = FALSE)
```

### Análisis

En conclusión, ser mujer disminuye significativamente la percepción de seguridad. Haber sido víctima de un delito disminuye notablemente la percepción de seguridad. Menor confianza en la comunidad tiene un efecto negativo fuerte en la percepción de seguridad. La confianza en la policía no es un predictor significativo en ningúno de los modelos. Finalmente las experiencias personales (como ser víctima) y la confianza en la comunidad, así como el género del entrevistado, tienen los efectos más fuertes y significativos sobre la percepción de seguridad.




FACTORIZACIÓN  {data-icon="fa-signal"}
===================================== 




```{r}
library(psych)
library(GPArotation)
library(readxl)
```


VEAMOS SI PODEMOS REALIZAR EL ANÁLISIS FACTORIAL
```{r}
library(rio)
dataf = import("dataf.xlsx")
# Selección de variables ordinales
variablesor <- dataf[, c("percepseg", "confianzacom", "confianzapol")]

# Verificar las primeras filas
head(variablesor)
```


```{r}
# Matriz de correlación
cor_matrix <- cor(variablesor, use = "pairwise.complete.obs")
print(cor_matrix)

# Prueba de esfericidad de Bartlett
cortest.bartlett(cor_matrix)

# Medida de adecuación muestral KMO
KMO(cor_matrix)

```

#### CONCLUSIONES

Los resultados sugieren que el análisis factorial no es adecuado con estas variables debido al bajo valor de KMO. La baja correlación y la medida de adecuación indican que estas variables no comparten suficientes factores latentes.


CLUSTER  {data-icon="fa-signal"}
===================================== 

#### ANÁLISIS CON CLUSTER


```{r}
library(readxl)
library(cluster)
library(factoextra)
library(dendextend)
```


```{r}
#Convertir las variables a formato numérico y seleccionar las variables relevantes
dataf$estratopri <- as.numeric(dataf$estratopri)
dataf$ur <- as.numeric(dataf$ur)
dataf$percepseg <- as.numeric(dataf$percepseg)
dataf$confianzacom <- as.numeric(dataf$confianzacom)
dataf$confianzapol <- as.numeric(dataf$confianzapol)

```


```{r}
# Selección de variables para el análisis de clúster
cluster_data <- dataf[, c("estratopri", "ur", "percepseg", "confianzacom", "confianzapol")]
```


```{r}
# 3. Estandarizar los datos (opcional pero recomendado)
scaled_data <- scale(cluster_data)
```


```{r}
# 4. Calcular el clustering jerárquico usando AGNES con el método de Ward
agnes_result <- agnes(scaled_data, method = "ward")
```


```{r}
# 5. Visualizar el dendrograma
dend <- as.dendrogram(agnes_result)
dend <- color_branches(dend, k = 3) # Ajusta 'k' para cambiar el número de clústeres
plot(dend, main = "Dendrograma de Clustering Jerárquico AGNES")
```



```{r}
# 6. Determinar el número óptimo de clústeres usando el dendrograma
clusters_agnes <- cutree(agnes_result, k = 3) # Ajusta 'k' según el dendrograma
table(clusters_agnes)
```


```{r}
# 7. Añadir los resultados al dataframe original
dataf$cluster_agnes <- clusters_agnes
```


```{r}
# Verificar si hay valores NA
sum(is.na(scaled_data))

```


```{r}
# Eliminar filas con valores NA
scaled_data <- na.omit(scaled_data)
```


```{r}
# Verificar si hay valores infinitos
sum(is.infinite(scaled_data))
```

```{r}
cluster_data <- na.omit(cluster_data)
```


```{r}
agnes_result <- agnes(scaled_data, method = "ward")
clusters_agnes <- cutree(agnes_result, k = 3)

```

```{r}
# Verificar que coinciden
if (nrow(cluster_data) == length(clusters_agnes)) {
  cluster_data$cluster_agnes <- clusters_agnes
} else {
  stop("El número de filas no coincide. Revisa los datos.")
}

```


```{r}
table(cluster_data$cluster_agnes)
```


```{r}
# Calcular la matriz de distancias (usando distancia euclidiana)
distance_matrix <- dist(scaled_data, method = "euclidean")
```


```{r}
# Calcular la silueta para los clústeres obtenidos
silhouette_data <- silhouette(cluster_data$cluster_agnes, distance_matrix)
```


```{r}
# Visualizar el gráfico de silueta
fviz_silhouette(silhouette_data, print.summary = FALSE)
```



La calidad del agrupamiento es baja, con un promedio de silueta de 0.28, lo que indica que los clústeres formados no están claramente definidos.




#### CONCLUSIONES

En conclusión, la percepción de seguridad de los ciudadanos se ve influida por diversos factores. Entre ellos nuestras hipótesis integraban el factor género de la persona, el factor área geográfica de residencia del entrevistado, el factor zona de residencia del entrevistado, el factor de si ha sido victima de crimen , el factor de confianza en su comunidad y el factor de confianza en la policia nacional.