Primera entrega
Segunda Entrega
En Colombia, la violencia de género sigue siendo una problemática persistente que se da especialmente en contextos locales donde el acceso a la justicia y los mecanismos de protección son limitados o ineficientes. El departamento de Cundinamarca, a pesar de su cercanía a la capital del país, evidencia un número preocupante de casos de violencia física, sexual, psicológica y económica basadas en género en sus municipios.
Analizar las condiciones socioeconómicas, institucionales y geográficas asociadas a la incidencia de la violencia de género en los municipios del departamento, con base en datos correspondientes a los años 2023 y 2024.
library(readxl)
TABLA_DE_DATOS_violencia_de_genero <- read_excel("TABLA DE DATOS. violencia de genero.xlsx", col_types = c("text", "text", "text", "text", "numeric", "text", "text", "text", "text", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric"))
colnames(TABLA_DE_DATOS_violencia_de_genero)=c("Municipio","Región","Zona","Estratoprom","Desempleo","NEducativo", "AJusticia", "PUP", "PRAI", "Casos2024", "Casos2023", "Llamadas2024", "Llamadas2023", "Denuncias2024", "Denuncias2023", "Habitantes", "MujeresHab")
print(TABLA_DE_DATOS_violencia_de_genero, n=Inf, width = Inf)
## # A tibble: 60 × 17
## Municipio Región Zona Estratoprom Desempleo NEducativo
## <chr> <chr> <chr> <chr> <dbl> <chr>
## 1 Agua de Dios Sabana Rural 2.0 0.179 Media
## 2 Albán Ubaté Urbana 3.0 0.12 Alta
## 3 Anapoima Tequendama Rural 1.0 0.172 Baja
## 4 Anolaima Rionegro Urbana 2.0 0.105 Alta
## 5 Apulo Oriente Urbana 2.0 0.139 Media
## 6 Arbeláez Rionegro Rural 3.0 0.164 Media
## 7 Beltrán Oriente Rural 3.0 0.112 Baja
## 8 Bituima Tequendama Rural 3.0 0.16 Alta
## 9 Bojacá Tequendama Urbana 2.0 0.102 Baja
## 10 Cabrera Alto Magdalena Rural 1.0 0.139 Baja
## 11 Cachipay Tequendama Rural 3.0 0.156 Alta
## 12 Cajicá Guavio Rural 3.0 0.113 Alta
## 13 Caparrapí Sumapaz Rural 2.0 0.164 Baja
## 14 Caqueza Oriente Urbana 4.0 0.082 Media
## 15 Carmen de Carupa Oriente Rural 1.0 0.175 Media
## 16 Chaguaní Tequendama Urbana 4.0 0.137 Baja
## 17 Chía Sabana Urbana 4.0 0.106 Alta
## 18 Chipaque Ubaté Rural 1.0 0.147 Alta
## 19 Choachí Alto Magdalena Urbana 2.0 0.09 Baja
## 20 Chocontá Sumapaz Rural 2.0 0.144 Alta
## 21 Cogua Oriente Rural 4.0 0.171 Alta
## 22 Cota Guavio Rural 4.0 0.118 Baja
## 23 Cucunubá Guavio Rural 2.0 0.147 Baja
## 24 El Colegio Oriente Rural 4.0 0.138 Alta
## 25 El Peñón Ubaté Rural 4.0 0.147 Alta
## 26 El Rosal Oriente Urbana 2.0 0.095 Baja
## 27 Facatativá Alto Magdalena Rural 4.0 0.128 Alta
## 28 Fómeque Guavio Urbana 1.0 0.107 Baja
## 29 Fosca Guavio Rural 2.0 0.178 Alta
## 30 Funza Alto Magdalena Urbana 1.0 0.107 Alta
## 31 Fúquene Tequendama Rural 2.0 0.109 Media
## 32 Fusagasugá Ubaté Urbana 3.0 0.095 Baja
## 33 Gachalá Guavio Rural 1.0 0.14 Baja
## 34 Gachancipá Sabana Rural 3.0 0.158 Media
## 35 Gachetá Guavio Urbana 2.0 0.137 Baja
## 36 Gama Alto Magdalena Urbana 1.0 0.134 Alta
## 37 Girardot Sumapaz Rural 1.0 0.111 Alta
## 38 Granada Guavio Urbana 1.0 0.107 Alta
## 39 Guachetá Sumapaz Rural 4.0 0.171 Media
## 40 Guaduas Guavio Urbana 4.0 0.124 Media
## 41 Guasca Guavio Urbana 1.0 0.081 Media
## 42 Guataquí Alto Magdalena Urbana 3.0 0.125 Baja
## 43 Guatavita Tequendama Rural 4.0 0.104 Baja
## 44 Guayabal de Síquima Rionegro Rural 2.0 0.152 Media
## 45 Guayabetal Sabana Urbana 4.0 0.101 Media
## 46 Gutiérrez Tequendama Rural 4.0 0.105 Baja
## 47 Jerusalén Alto Magdalena Urbana 1.0 0.102 Alta
## 48 Junín Oriente Urbana 4.0 0.113 Alta
## 49 La Calera Ubaté Urbana 2.0 0.086 Baja
## 50 La Mesa Ubaté Rural 1.0 0.16 Baja
## 51 La Palma Guavio Rural 2.0 0.15 Baja
## 52 La Peña Rionegro Urbana 3.0 0.086 Alta
## 53 La Vega Sabana Rural 2.0 0.178 Media
## 54 Lenguazaque Oriente Urbana 1.0 0.094 Media
## 55 Machetá Ubaté Urbana 2.0 0.083 Media
## 56 Madrid Ubaté Urbana 3.0 0.084 Alta
## 57 Manta Tequendama Rural 3.0 0.114 Media
## 58 Medina Alto Magdalena Urbana 3.0 0.093 Media
## 59 Mosquera Ubaté Rural 1.0 0.124 Media
## 60 Nariño Ubaté Rural 3.0 0.171 Baja
## AJusticia PUP PRAI Casos2024 Casos2023 Llamadas2024 Llamadas2023
## <chr> <chr> <chr> <dbl> <dbl> <dbl> <dbl>
## 1 Baja Sí No 1308 1242 1400 1290
## 2 Media Sí Sí 624 593 614 482
## 3 Alta No Sí 1539 1462 1650 1530
## 4 Baja No No 546 519 705 596
## 5 Baja No Sí 637 605 730 613
## 6 Media No No 923 877 1005 882
## 7 Media Sí Sí 114 108 97 88
## 8 Media No No 236 224 215 187
## 9 Alta Sí Sí 1184 717 820 741
## 10 Media Sí No 414 398 445 395
## 11 Alta No No 949 578 665 586
## 12 Baja Sí No 421 400 315 275
## 13 Alta Sí Sí 1305 1236 1310 1200
## 14 Baja Sí Sí 567 538 635 572
## 15 Baja No No 789 407 500 430
## 16 Baja No No 314 205 230 197
## 17 Baja Sí Sí 12786 7172 7890 7072
## 18 Baja Sí Sí 603 541 640 555
## 19 Baja No Sí 1012 654 765 695
## 20 Media Sí No 1520 981 1170 1078
## 21 Alta No Sí 2061 1131 1330 1225
## 22 Media No No 2059 1657 1850 1730
## 23 Media No Sí 568 456 520 469
## 24 Alta No Sí 1897 1181 1320 1235
## 25 Baja No No 422 396 430 392
## 26 Media Sí Sí 1360 1010 1150 1065
## 27 Baja Sí No 15549 8267 9275 8700
## 28 Media Sí No 724 573 670 605
## 29 Alta No No 367 326 370 328
## 30 Alta No Sí 10299 5456 6130 5690
## 31 Alta No Sí 644 571 648 590
## 32 Baja Sí Sí 8892 7767 8640 7992
## 33 Baja No No 153 153 155 144
## 34 Alta No No 1143 1166 1340 1206
## 35 Alta No Sí 729 827 920 870
## 36 Media No Sí 209 149 148 133
## 37 Alta Sí No 6058 5227 5530 5116
## 38 Media No Sí 2146 1423 1520 1423
## 39 Baja Sí Sí 847 591 670 601
## 40 Baja Sí Sí 2310 2302 2450 2300
## 41 Baja Sí No 1479 818 890 814
## 42 Baja No No 248 182 210 181
## 43 Baja No Sí 488 489 540 495
## 44 Baja No Sí 109 99 101 92
## 45 Baja Sí Sí 203 152 160 139
## 46 Media Sí No 123 139 140 124
## 47 Media No Sí 126 123 120 108
## 48 Media Sí Sí 510 427 468 420
## 49 Baja No Sí 2770 1592 1750 1610
## 50 Media No Sí 2484 1493 1680 1525
## 51 Alta Sí Sí 363 366 410 365
## 52 Alta No Sí 437 298 330 294
## 53 Alta Sí No 1363 838 920 841
## 54 Baja Sí Sí 719 540 570 512
## 55 Baja Sí No 303 330 365 321
## 56 Media No No 12383 6505 7050 6440
## 57 Media Sí No 144 163 175 157
## 58 Baja Sí Sí 199 218 245 211
## 59 Media Sí No 12617 7056 7520 7000
## 60 Media No Sí 409 216 239 206
## Denuncias2024 Denuncias2023 Habitantes MujeresHab
## <dbl> <dbl> <dbl> <dbl>
## 1 120 109 14082 7307
## 2 42 38 7349 5203
## 3 173 157 17713 8946
## 4 100 91 10389 5203
## 5 70 64 9159 4583
## 6 113 103 11257 5626
## 7 63 57 2047 1019
## 8 116 105 2957 1476
## 9 147 134 14829 7403
## 10 44 40 6036 3015
## 11 106 96 12166 6081
## 12 176 162 74787 3727
## 13 106 96 15929 7956
## 14 381 346 13833 6906
## 15 73 66 9016 4504
## 16 39 35 4551 2275
## 17 7249 6590 151393 75495
## 18 64 58 11398 5694
## 19 154 140 13789 6884
## 20 178 162 20719 10338
## 21 211 192 24141 12059
## 22 1291 1174 34934 17439
## 23 87 79 9635 4812
## 24 217 197 25838 12903
## 25 114 104 5748 2871
## 26 2136 1942 21274 10627
## 27 10211 9283 175589 87492
## 28 107 97 12076 6035
## 29 194 176 6861 3426
## 30 5476 4980 114885 57328
## 31 112 102 12027 6012
## 32 6135 5580 163789 81761
## 33 65 59 3213 1606
## 34 97 88 16395 8186
## 35 461 419 12103 6045
## 36 72 65 3132 1566
## 37 3742 3402 109348 55028
## 38 1078 980 27188 13578
## 39 110 100 12379 6180
## 40 1453 1321 34473 17218
## 41 215 195 17241 8611
## 42 86 78 4508 2251
## 43 169 154 7828 3910
## 44 33 30 2088 1043
## 45 75 68 3193 1596
## 46 64 58 2923 1460
## 47 52 47 2471 1234
## 48 260 236 9055 4524
## 49 952 865 34684 17314
## 50 968 880 33149 16558
## 51 144 131 8511 4252
## 52 171 155 6608 3301
## 53 472 429 18688 9335
## 54 329 299 11988 5988
## 55 171 155 7309 3650
## 56 6911 6283 144989 72399
## 57 58 53 3441 1720
## 58 136 124 4787 2391
## 59 7762 6421 148848 74270
## 60 113 103 4785 2390
Filas: 17 Columnas: 61
Departamento de Cundinamarca, con énfasis en los siguientes municipios: Agua de Dios, Albán, Anapoima, Anolaima, Apulo, Arbeláez, Beltrán, Bituima, Bojacá, Cabrera, Cachipay, Cajicá, Caparrapí, Cáqueza, Carmen de Carupa, Chaguaní, Chía, Chipaque, Choachí, Chocontá, Cogua, Cota, Cucunubá, El Colegio, El Peñón, El Rosal, Facatativá, Fómeque, Fosca, Funza, Fúquene, Fusagasugá, Gachalá, Gachancipá, Gachetá, Gama, Girardot, Granada, Guachetá, Guaduas, Guasca, Guataquí, Guatavita, Guayabal de Síquima, Guayabetal, Gutiérrez, Jerusalén, Junín, La Calera, La Mesa, La Palma, La Peña, La Vega, Lenguazaque, Machetá, Madrid, Manta, Medina, Mosquera, Nariño.
Porcentaje de mujeres desempleadas en los municipios de cundinamarca.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo),var(TABLA_DE_DATOS_violencia_de_genero$Desempleo),sd(TABLA_DE_DATOS_violencia_de_genero$Desempleo),100*sd(TABLA_DE_DATOS_violencia_de_genero$Desempleo)/mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo),median(TABLA_DE_DATOS_violencia_de_genero$Desempleo),100*mad(TABLA_DE_DATOS_violencia_de_genero$Desempleo),mad(TABLA_DE_DATOS_violencia_de_genero$Desempleo)/median(TABLA_DE_DATOS_violencia_de_genero$Desempleo)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1.272333e-01
## Varianza 8.773006e-04
## Desv_estandar 2.961926e-02
## cve_media 2.327948e+01
## Mediana 1.240000e-01
## MAD 3.409980e+00
## cve_mediana 2.749984e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0810 0.1047 0.1240 0.1272 0.1505 0.1790
La tasa de desempleo femenino promedio en los municipios de Cundinamarca es de aproximadamente 12.7%, con una mediana cercana 12.4%, esto indica que se podría sugerir una distribución bastante simétrica, sin embargo, la alta desviación estándar 2.96% y un coeficiente de variación superior al 20% son reflejo de una fuerte y marcada desigualdad territorial en el acceso al empleo para las mujeres; esta disparidad, también puede ser consecuencia de una desviación absoluta mediana robusta (MAD 3.41%) lo que sugiere que en algunos municipios las mujeres enfrentan mayores barreras económicas y sociales esto puede limitar su autonomía y aumenta su vulnerabilidad frente a situaciones de violencia de género. El primer cuartil indica que el 25% de los municipios tienen tasas de desempleo iguales o inferiores al 10.47%, lo que representa territorios con menor presión laboral dentro del grupo analizado y socialmente se puede decir que estas zonas pueden ofrecer más oportunidades económicas. Por último el tecer cuartil indica que este 25% de los municipios presentan tasas mayores al 15.05%, lo cual es bastante elevado y significa que estas zonas enfrentan una crisis laboral más aguda para las mujeres.
Casos de violencia de género reportados en Cundinamarca durante el año 2024.
media_c=mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
varianza_c=var(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
sd_c=sd(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
#calcular cve
cve_media_c=100*sd_c/media_c
medianaC=median(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
MAD_c=mad(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
cve_mediana_c=100*MAD_c/medianaC
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024),var(TABLA_DE_DATOS_violencia_de_genero$Casos2024),sd(TABLA_DE_DATOS_violencia_de_genero$Casos2024),100*sd(TABLA_DE_DATOS_violencia_de_genero$Casos2024)/mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024),median(TABLA_DE_DATOS_violencia_de_genero$Casos2024),100*mad(TABLA_DE_DATOS_violencia_de_genero$Casos2024),mad(TABLA_DE_DATOS_violencia_de_genero$Casos2024)/median(TABLA_DE_DATOS_violencia_de_genero$Casos2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 2.061750e+03
## Varianza 1.266985e+07
## Desv_estandar 3.559473e+03
## cve_media 1.726433e+02
## Mediana 7.215000e+02
## MAD 7.398174e+04
## cve_mediana 1.025388e+00
summary(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 109.0 398.5 721.5 2061.8 1524.8 15549.0
Los datos sobre violencia de género en 2024 revelan una alarmante desigualdad en la distribución de los casos, pues por un lado la media es mucho mayor que la mediana, lo que indica que hay valores extremos elevando el promedio, así mismo la alta desviación estándar y el alto CVE de la media refuerzan esta idea de gran dispersión que puede deberse a que dentro de los municipios analizados hay unos pocos que tienen un numero de de población mucho mas alto comparado con municipios pequeños. Sin embargo, el CVE de la mediana es bajo, lo que sugiere que la mayoría de los valores están relativamente cerca entre sí, pero existen algunos valores extremadamente altos que distorsionan la media. El primer cuartil establece que el primer 25% de los municipios tuvieron menos de 398.5 casos, lo que puede reflejar baja ocurrencia real. Y el tercer cuartil significa que el 25% superior de los municipios tuvo más de 1524.8 casos, lo que indica una alta concentración de la violencia de género en una parte específica de los territorios.
Casos de violencia de género reportados en Cundinamarca durante el año 2023.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023),var(TABLA_DE_DATOS_violencia_de_genero$Casos2023),sd(TABLA_DE_DATOS_violencia_de_genero$Casos2023),100*sd(TABLA_DE_DATOS_violencia_de_genero$Casos2023)/mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023),median(TABLA_DE_DATOS_violencia_de_genero$Casos2023),100*mad(TABLA_DE_DATOS_violencia_de_genero$Casos2023),mad(TABLA_DE_DATOS_violencia_de_genero$Casos2023)/median(TABLA_DE_DATOS_violencia_de_genero$Casos2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1.368833e+03
## Varianza 4.270798e+06
## Desv_estandar 2.066591e+03
## cve_media 1.509746e+02
## Mediana 5.755000e+02
## MAD 5.411490e+04
## cve_mediana 9.403110e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 99.0 329.0 575.5 1368.8 1194.8 8267.0
Estos resultados para el año 2023 permiten establecer una distribución desigual, por un lado tenemos una media de 1,368.83 casos y una mediana considerablemente menor 575.5, lo que denota una concentración de casos en ciertas regiones que elevan el promedio general. Adicionalmente la alta desviación estándar y el coeficiente de variación de la media 150.97% también reflejan una marcada dispersión en los datos, reiterando que aunque en muchas zonas los casos pueden ser relativamente bajos, existen contextos donde la violencia se presenta con una intensidad muy grande atendiendo también a que hay un mayor numero de habitantes, esta situación también evidenciada por una MAD elevada, lo que permite decir que hay una necesidad de una intervención social urgente y focalizada. Por último el primer cuartil indica que el primer 25% representa bajas ocurrencias y el tercer cuartil indica que el 25% superior de los municipios reportó más de 1194.8 casos, lo que significa una mayor concentración de la violencia en ciertos territorios.
Llamadas presentadas a la línea 155 en el año 2024.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),100*sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)/mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),100*mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)/median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1512.5000
## Varianza 5146261.1695
## Desv_estandar 2268.5372
## cve_media 149.9859
## Mediana 667.5000
## MAD 65975.7000
## cve_mediana 0.9884
summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 97.0 356.2 667.5 1512.5 1332.5 9275.0
Para el año 2024 las llamadas a la línea de emergencia 155 reflejan un patrón similar al de los casos reportados de violencia para el mismo año. Se presenta una media de 1,512.5 llamadas y una mediana de 667.5, lo que permite establecer que la mayoría de las zonas tienen una frecuencia moderada de reportes, pero hay municipios con un volumen significativamente mayor por su diferencia en cuanto a tamaño y cantidad de población, lo que causa que se eleve la media; consecuentemente la alta dispersión y variabilidad que se manifiesta en la desviación estándar y el coeficiente de variación, sugieren que el hecho de pedir ayuda a través de una línea telefónica es muy desigual. Esto podría responder a la falta de promoción para el conocimiento de estas líneas o la carencia de medios para el acceso a las mismas. Por último el primer cuartil indica que el 25% de los municipios reportaron menos de 356 llamadas, lo que determina que en muchas zonas la denuncia telefónica es poco frecuente, y el tercer cuartil especifíca que solo el 25% de los municipios supera las 1336 llamadas, mostrando que unos pocos concentran la mayoría de llamadas.
Llamadas presentadas a la línea 155 en el año 2023.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),100*sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)/mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),100*mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)/median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1.385550e+03
## Varianza 4.407421e+06
## Desv_estandar 2.099386e+03
## cve_media 1.515200e+02
## Mediana 5.930000e+02
## MAD 5.945226e+04
## cve_mediana 1.002568e+00
summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 88.0 314.2 593.0 1385.5 1227.5 8700.0
Las llamadas a la línea de emergencia 155 en el año 2023 presentan un promedio de aproximadamente 1.386 reportes y una mediana de 593, lo que indica que aunque la mayoría de las regiones mantienen un nivel moderado de denuncias, existen zonas con volúmenes de llamadas mucho mayores que elevan el promedio. La alta variabilidad y dispersión reflejadas en la desviación estándar y coeficientes de variación pueden dejar en evidencia la carencia de accesibilidad a estas líneas o desconocimiento de su funcionalidad. Estos datos evidencian la necesidad de reforzar las estrategias de difusión y atención en las zonas mas afectadas.El primer cuartil determina que en muchas zonas la denuncia telefónica es poco frecuente, y el tercer cuartil especifíca que este 25% concentra la mayoría de llamadas, puede explicarse por la cantidad de población o el conocimiento y acceso a este tipo de servicios.
Denuncias formales realizadas por las victimas en el 2024.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),100*sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)/mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),100*mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)/median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1.033733e+03
## Varianza 5.001442e+06
## Desv_estandar 2.236390e+03
## cve_media 2.163411e+02
## Mediana 1.455000e+02
## MAD 1.082298e+04
## cve_mediana 7.438474e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 33.00 86.75 145.50 1033.73 401.00 10211.00
Durante 2024 se presentaron denuncias formales por violencia de género en estos municipios de cundinamarca, los cuales luego de la estadística descriptiva reflejan una marcada desigualdad en su distribución, teniendo un promedio de 1033 denuncias, pero una mediana considerablemente menor 145.5, lo que significa que en la mayoría de los contextos y zonas el número de denuncias es reducido, la varianza también resumen esta situación, pues al ser muy alta, implica que algunas regiones presentan cifras de denuncias extraordinariamente altas, mientras que muchas otras presentan números muy bajos, resultado del tamaño del municipio, lo cual eleva el promedio general. Adicional a esto la alta desviación estándar y un coeficiente de variación de la media que es superior al 200% deja en evidencia una fuerte dispersión, lo que sugiere la presencia de factores sociales o estructurales que influyen en decisión de denunciar. Esta situación revela profundas brechas sociales y territoriales.Por últimi el primer cuartil indica que en una cuarta parte de los territorios analizados el nivel de judicialización por violencia de género es muy relativamente bajo y el tercer cualtil nos menciona que el 75% de los municipios tuve menos de 401 denuncias,lo cual es muy bajo en comparación con la cantidad de casos de violencia de género y que solo el 25% tuvo un número de denuncias mayor a este, estos municipios concentran la mayor cantidad de las mismas.
Denuncias formales realizadas por las victimas en el 2023.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),100*sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)/mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),100*mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)/median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 9.292167e+02
## Varianza 4.009315e+06
## Desv_estandar 2.002327e+03
## cve_media 2.154855e+02
## Mediana 1.325000e+02
## MAD 9.933420e+03
## cve_mediana 7.496921e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 30.00 78.75 132.50 929.22 364.25 9283.00
Las denuncias formales realizadas en el año 2023 por violencia de género presentaron una media de 929 casos, pero una mediana mucho menor 132.5, lo que nos indica que la mayoría de los municipios reportaron cifras bajas en cuanto a denuncias, mientras que unas pocas concentraron niveles significativamente altos atendiendo a que la su población es mucho mas grande, sus casos de violencia son más y consecuentemente las denuncias se elevan. Por otro lado, la varianza 4009,315 es muy elevada y junto a la desviación estándar (2,002) reflejan una marcada dispersión en los datos, lo que sugiere desigualdades estructurales en cuanto al acceso a la justicia, esta tendencia se refuerza con el coeficiente de variación de la media de más del 215%. El hecho de que tanto en 2023 como en 2024 las denuncias formales tengan una mediana muy baja en relación con la media establece que en efecto las víctimas se pueden enfrentar a barreras sociales para denunciar. Los cuartiles revelan importantes desigualdades territoriales en los municipios analizados en cuanto a la judicialización de la violencia de género.
Habitantes de los municipios de Cundinamarca.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes),var(TABLA_DE_DATOS_violencia_de_genero$Habitantes),sd(TABLA_DE_DATOS_violencia_de_genero$Habitantes),100*sd(TABLA_DE_DATOS_violencia_de_genero$Habitantes)/mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes),median(TABLA_DE_DATOS_violencia_de_genero$Habitantes),100*mad(TABLA_DE_DATOS_violencia_de_genero$Habitantes),mad(TABLA_DE_DATOS_violencia_de_genero$Habitantes)/median(TABLA_DE_DATOS_violencia_de_genero$Habitantes)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 2.875868e+04
## Varianza 1.981254e+09
## Desv_estandar 4.451127e+04
## cve_media 1.547751e+02
## Mediana 1.205150e+04
## MAD 1.030481e+06
## cve_mediana 8.550646e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2047 6465 12052 28759 21991 175589
La población promedio por municipio en Cundinamarca fue aproximadamente de 28,758 habitantes y la mediana de 12,051 mucho menor, lo que indica que la mayoría de los municipios tienen poblaciones pequeñas y unos pocos son mucho más poblados, lo cuales elevan el promedio comportándose como datos atípicos; por su lado la alta varianza y la desviación estándar, reflejan una desigualdad significativa en la distribución demográfica del departamento, esto se traduce en un coeficiente de variación significativamente alto 154.77%. El primer cuartil representa zonas pequeñas con un número de habitantes no tan elevado y por el contrario el tercer cuartil indica que solo un 25% de los municipios contienen casi el triple del primer cuarto de la población estando todos por encima de los 21.000 habitantes, una cantidad considerable.
Mujeres habitantes de los municipios de Cundinamarca.
media_col=mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),var(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),sd(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),100*sd(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)/mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),100*mad(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),mad(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)/median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1.383350e+04
## Varianza 4.857453e+08
## Desv_estandar 2.203963e+04
## cve_media 1.593207e+02
## Mediana 6.000000e+03
## MAD 4.791763e+05
## cve_mediana 7.986272e-01
summary(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1019 3230 6000 13834 10410 87492
La población femenina promedio por municipio en Cundinamarca fue de 13833 mujeres y la mediana de 6000, lo que revela que más de la mitad de los municipios tienen una población femenina inferior al promedio, esto podría suponer una fuerte concentración en unos pocos municipios de gran tamaño; esta desigualdad se afianza por una varianza alta de 485 millones y una desviación estándar de más de 22000, lo que significa la existencia de una gran dispersión en la distribución de mujeres entre municipios, así mismo el coeficiente de variación de la media también muestra una heterogeneidad significativa. En consideraciones sociales, esta estructura poblacional fomenta las desigualdades y las cifras refuerzan la necesidad de enfocar esfuerzos territorializados. Los cuartiles permiten determinar que los datos aquí analizados reflejan una alta concentración de la población femenina en un número reducido de municipios, mientras que la mayoría de los territorios tiene poblaciones femeninas más pequeñas. Esta desigualdad poblacional impacta directamente las condiciones sociales a las que se someten las mujeres y tambien nos da un panorama del porque la gran varianza de los datos estadísticos antes analizados.
table(TABLA_DE_DATOS_violencia_de_genero$Región)
##
## Alto Magdalena Guavio Oriente Rionegro Sabana
## 8 11 9 4 5
## Sumapaz Tequendama Ubaté
## 4 9 10
barplot(table(TABLA_DE_DATOS_violencia_de_genero$Región),col="pink4", main="Frecuencias de la variable Región", las=2)
La gráfica representa el número de municipios que pertenecen a cada una de las regiones de Cundinamarca según el conjunto de datos que se están analizando en la tabla, por lo que es importante mencionar que la no uniformidad de esta distribución se puede deber se han registrado datos de municipios al azar, más no porque sean la totalidad de municipios para cada región. La región de Guavio es la que más municipios contiene en la muestra con más de 10 zonas mencionadas, le siguen Ubaté, Oriente e Almeidas y Tequendama, todas con una presencia mayor a ocho municipios en el conjunto de datos. Y las regiones de Rionegro y Sumapaz tienen la menor representación. Las regiones con más municipios representados pueden estar más visibilizadas en los datos, pero no necesariamente son las más afectadas.
table(TABLA_DE_DATOS_violencia_de_genero$Zona)
##
## Rural Urbana
## 33 27
barplot(table(TABLA_DE_DATOS_violencia_de_genero$Zona),col="pink3", main="Frecuencias de la variable Zona")
Esta gráfica muestra la cantidad de municipios clasificados como zona rural o zona urbana dentro del conjunto de datos de nuestra tabla. Se observa que la mayoría corresponde a zonas rurales representado en más de 30 municipios, mientras que las zonas urbanas tienen una menor frecuencia, siendo alrededor de 27 para esta muestra. Aunque la diferencia no es enorme, es suficiente para notar que el análisis tiene un mayor peso en contextos rurales y sugerir que estas zonas pueden tener mayores barreras socioculturales para que las víctimas denuncien o busquen ayuda.
table(TABLA_DE_DATOS_violencia_de_genero$Estratoprom)
##
## 1.0 2.0 3.0 4.0
## 15 17 14 14
barplot(table(TABLA_DE_DATOS_violencia_de_genero$Estratoprom),col="pink2", main="Frecuencias de la variable Estrato socioeconómico")
Esta gráfica representa la cantidad de datos clasificados según el estrato socioeconómico (del 1 al 4) más común en cada municipio de cundinamarca considerados en esta muestra. El estrato 2 es el más frecuente, con alrededor 17 registros, le siguen los estratos 1, 3 y 4, con frecuencias bastante similares rondando entre 13 y 15 registros cada uno. Al no haber datos para los estratos 5 y 6 se puede determinar que la muestra se concentrada en niveles socioeconómicos bajos y medios-bajos, lo cual es coherente con la realidad de muchos municipios de Cundinamarca.
tabla_frecuencias <- table(TABLA_DE_DATOS_violencia_de_genero$NEducativo)
leyenda <- c("Media","Alta","Baja")
colores_personalizados <- c("pink", "pink2", "pink4")
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main="Nivel educativo promedio", col = colores_personalizados)
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)
Este diagrama representa la distribución del nivel educativo promedio en los municipios analizados, categorizado en tres niveles: Alta (35%), Media (33%) y Baja (35%). El gráfico muestra una distribución que sugiere un sistema polarizado, donde 2 de cada 3 municipios (sumando “Baja” y “Media”) no alcanzan estándares óptimos, revelando desigualdades estructurales. La cercanía entre los porcentajes indica que pequeñas intervenciones podrían inclinar la balanza y mejorar la calidad en los municipios categorizados en “Media” mediante capacitación docente o infraestructura.
tabla_frecuencias <- table(TABLA_DE_DATOS_violencia_de_genero$AJusticia)
leyenda <- c("Media", "Alta", "Baja")
colores_personalizados <- c("pink", "pink2", "pink4")
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main = "Acceso a la justicia", col = colores_personalizados)
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)
Este diagrama circular muestra la distribución del acceso a la justicia en los municipios analizados, clasificado en tres niveles:
La predominancia del acceso a la justicia “Baja” en los municipios analizados agrava la situación de violencia de género en Cundinamarca, ya que limita la capacidad de las víctimas para denunciar, acceder a protección legal o recibir reparación. El 25% de municipios con acceso a la justicia (probablemente urbanos) refleja una desigualdad territorial que incrementa los casos y sugiere la implementación de políticas que prioricen la infraestructura judicial en zonas vulnerables, junto con campañas de sensibilización y capacitación a funcionarios, para romper el círculo entre acceso limitado a la justicia.
casos_log <- log10(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
stem(casos_log)
##
## The decimal point is 1 digit(s) to the left of the |
##
## 20 | 469068
## 22 | 01279
## 24 | 8066
## 26 | 12234914558
## 28 | 0016660378
## 30 | 1672233789
## 32 | 81136
## 34 | 04
## 36 | 8
## 38 | 5
## 40 | 19019
casos_log1 <- log10(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
stem(casos_log1)
##
## The decimal point is 1 digit(s) to the left of the |
##
## 18 |
## 20 | 0394788
## 22 | 161345
## 24 | 7126
## 26 | 00013692333666778
## 28 | 2612249
## 30 | 057799567
## 32 | 026
## 34 |
## 36 | 24
## 38 | 15692
boxplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,TABLA_DE_DATOS_violencia_de_genero$Llamadas2023, names = c("2024", "2023"), main = "Distribución de llamadas a la línea 155",col = c("pink", "pink3"))
stripchart(list(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, TABLA_DE_DATOS_violencia_de_genero$Llamadas2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"), vertical = TRUE)
El diagrama de cajas comparativo revela una distribución similar en la cantidad de llamadas a la línea 155 entre los años 2024 y 2023 en Cundinamarca. Para ambos años, la mediana del número de llamadas se sitúa alrededor de los 600-700, indicando una tendencia central comparable. Sin embargo, se observa una mayor dispersión en los datos de 2024, evidenciado por una caja ligeramente más alta y bigotes más extendidos, lo que sugiere una mayor variabilidad en el número de llamadas recibidas en ese año en comparación con 2023. Adicionalmente, ambos años presentan valores atípicos significativos, representados por los círculos por encima del bigote superior, lo que indica la existencia de días con un número inusualmente alto de llamadas, siendo más pronunciados y con valores extremos superiores en el año 2024, alcanzando incluso cifras superiores a las 9000 llamadas en algunos casos, en contraste con los valores atípicos de 2023 que se extienden hasta aproximadamente 8000 llamadas, sin embargo, esto se debe a que la población de habitantes varia mucho de acuerdo al municipio.
boxplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, names = c("2024", "2023"), main = "Distribución de denuncias formales presentadas en Cundinamarca",col = c("pink", "pink3"))
stripchart(list(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, TABLA_DE_DATOS_violencia_de_genero$Denuncias2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"), vertical = TRUE)
Este diagrama de caja distribución de denuncias formales de violencia de género en Cundinamarca, comparando los años 2023 y 2024. La gráfica muestra que la mayoría de los municipios de Cundinamarca presentan un número reducido de denuncias formales de violencia de género tanto en 2023 como en 2024, con una distribución altamente asimétrica marcada por unos pocos municipios con cifras muy elevadas, posiblemente urbanos, con mayor acceso institucional, mayor extensión o mayor cantidad de población; esta situación sugiere la existencia de un subregistro generalizado, probablemente asociado a barreras sociales, culturales o institucionales que impiden la denuncia, mientras que los municipios con cifras altas podrían tener mejor infraestructura para recibirlas. Por último la similitud entre ambos años indica que no hubo cambios significativos en la dinámica de denuncia, lo que refleja una persistencia estructural del problema y la necesidad urgente de fortalecer el acceso a la justicia y las estrategias de prevención, especialmente en territorios con cifras muy bajas.
hist(TABLA_DE_DATOS_violencia_de_genero$Habitantes,col="pink1",freq=T,main="Distribución de frecuencias de los habitantes de Cundinamarca",xlab="Habitantes",ylab="Frecuencias")
Este histograma describe la distribución de frecuencias del número de habitantes en los municipios de Cundinamarca. Se observa una clara asimetría hacia la derecha, donde la mayoría de los municipios (más de 40) tienen poblaciones inferiores a 50.000 habitantes, y solo unos pocos concentran una población considerablemente mayor, incluso por encima de los 150.000 habitantes. Esto indica que el departamento está compuesto mayoritariamente por municipios pequeños en términos poblacionales, con unos pocos centros urbanos que concentran gran parte de la población. Para consideraciones sociales, esto sugiere que muchas comunidades podrían enfrentar dificultades estructurales para acceder a servicios como justicia, salud o educación, lo que también puede influir en el bajo número de denuncias registradas en esos territorios, por lo que es indispensable que a nivel gubernamental y departamental se consideren estas diferencias demográficas al asignar recursos y diseñar estrategias de intervención.
hist(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,col="pink1",freq=T,main="Distribución de frecuencias de las mujeres habitantes de Cundinamarca",xlab="Mujeres Habitantes",ylab="Frecuencias")
Esta gráfica muestra un histograma de la distribución de frecuencias de mujeres habitantes en los municipios de Cundinamarca. Se percibe una forma altamente asimétrica hacia la derecha, pues la mayoría de los municipios cuentan con una población femenina inferior a 20.000, mientras que muy pocos municipios concentran entre 40.000 y más de 80.000 mujeres; este diagrama refleja un patrón demográfico similar al general del departamento, por lo que también predominan municipios pequeños con baja densidad poblacional femenina. Esta situación es muy relevante para el diseño de políticas públicas enfocadas al bienestar de las mujeres, pues esto permite intuir que muchas de ellas viven en municipios con menos cobertura institucional y mayor vulnerabilidad territorial.
TablaCruzada <- table(TABLA_DE_DATOS_violencia_de_genero$Zona,TABLA_DE_DATOS_violencia_de_genero$PUP)
TablaCruzada
##
## No Sí
## Rural 18 15
## Urbana 13 14
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores2 <- c("pink2", "pink4")
barplot(TablaCruzada, col = colores2)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Urbano", "Rural"), fill = colores2)
Esta gráfica muestra la presencia de unidades policiales según la zona (urbana o rural) en los municipios analizados de Cundinamarca. Se observa que tanto en los municipios que sí tienen unidad policial como en los que no, hay una representación significativa de zonas rurales y urbanas, sin embargo, en ambos casos la zona rural tiene una participación ligeramente mayor, lo cual es relevante dado que las zonas rurales suelen enfrentar más dificultades de acceso institucional, por lo que es importante mencionar que esta muestra de municipios es aleatoria y no representa en su totalidad a todos lo que componen el departamento de cundinamarca, en consecuencia los resultados obtenidos de este análisis varian a la realidad absoluta; aun así, hay una cantidad considerable de municipios rurales sin unidad policial, lo que representa una barrera crítica en la garantía de acceso a la justicia y protección, especialmente en contextos de violencia de género.
TablaCruzada <- table(TABLA_DE_DATOS_violencia_de_genero$Estratoprom,TABLA_DE_DATOS_violencia_de_genero$PRAI)
TablaCruzada
##
## No Sí
## 1.0 7 8
## 2.0 6 11
## 3.0 8 6
## 4.0 5 9
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores4 <- c("pink", "pink4", "pink1", "pink3")
barplot(TablaCruzada, col = colores4)
par(mfrow = c(1, 2))
legend("topleft", legend = c("1", "2", "3", "4"), fill = colores4)
Esta gráfica de barras apiladas permite visualizar cómo se distribuye la existencia de rutas de atención integral según los estratos socioeconómicos (1 a 4) en diferentes municipios de Cundinamarca. Se evidencia que la mayor parte de los municipios encuestados se concentran en los estratos 1, 2 y 3, lo que es coherente con la composición social del departamento, donde predominan poblaciones de ingresos bajos y medios. En los municipios donde sí existen rutas de atención integral, se observa una mayor representación del estrato 2, seguido de los estratos 3 y 4, adicional a esto, en los municipios donde no existen dichas rutas, la presencia de los estratos 1 y 3 es más destacada, mientras que el estrato 2 tiene una participación relativamente menor. Esto indica que aunque las rutas de atención integral existen en diversos contextos socioeconómicos, no necesariamente están priorizando los municipios más desfavorecidos (proponderancia de estrato 1), lo que podría representar una falla en la focalización de políticas públicas orientadas a la atención de víctimas de violencia de género.
TablaCruzada <- table(TABLA_DE_DATOS_violencia_de_genero$Región,TABLA_DE_DATOS_violencia_de_genero$AJusticia)
TablaCruzada
##
## Alta Baja Media
## Alto Magdalena 1 4 3
## Guavio 3 4 4
## Oriente 2 4 3
## Rionegro 1 2 1
## Sabana 2 3 0
## Sumapaz 2 1 1
## Tequendama 4 2 3
## Ubaté 0 5 5
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores8 <- c("pink2", "palevioletred4", "pink1","palevioletred3","pink4","palevioletred","pink3", "pink")
barplot(TablaCruzada, col = colores8)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Alto Magdalena", "Guavio", "Oriente", "Rio Negro", "Sabana", "Sumapaz", "Tequendama", "Ubaté"), fill = colores8)
Esta gráfica representa la distribución del acceso a la justicia clasificado en alta, media y baja, según las regiones de Cundinamarca. Se observan desigualdades territoriales muy relevantes, tambien se percibe que la categoría de bajo acceso a la justicia es la más frecuente, especialmente en regiones como Guavio, Ubaté y Oriente, lo que indica una concentración de condiciones desfavorables para estas zonas; las regiones con acceso alto son menos frecuentes y se destaca en Alto Magdalena, Sumapaz y Sabana, sugiriendo una mejor infraestructura judicial o mayor presencia institucional en estos territorios. Se puede establecer que la distribución no es uniforme, lo que apunta a una desigualdad estructural en la disponibilidad y calidad de los servicios de justicia en el departamento, esto puede traducirse en una mayor vulnerabilidad de las víctimas, en regiones donde la oferta institucional es más limitada y donde se perpetúan ciclos de impunidad y desprotección, especialmente frente a fenómenos como la violencia de género.
plot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,main="Casos 2024 Vs. Llamadas a la línea 155",xlab="Casos 2024",ylab="Llamadas a la línea 155", col = "pink2", pch = 19)
cor(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, method = "pearson")
## [1] 0.9754291
Esta gráfica de dispersión muestra la relación entre el número de casos reportados en 2024 y las llamadas realizadas a la línea 155. Se evidencia una correlación positiva, de 0.9754291, es decir a mayor número de casos reportados también mayor es el número de llamadas a la línea 155, lo cual sugiere que en los municipios donde se registra un mayor número de casos formales, también existe una mayor demanda de apoyo a través de esta línea telefónica. También es posible decir que esta relación indica que la línea 155 se está utilizando como un canal inicial o paralelo de ayuda en los contextos con mayor incidencia de violencia, socialmente, esta tendencia puede interpretarse como un indicador de mayor conciencia o confianza en los servicios de atención, pero también refleja la magnitud del problema, sin embargo, la dispersión en los valores más altos sugiere que hay municipios con muchas llamadas pero relativamente menos casos formales, lo que podría evidenciar barreras en el acceso a la justicia o en la formalización de las denuncias. Esto refuerza la importancia de fortalecer el contacto inicial orientado a un servicio integral, concreto y que facilite el acceso a mecanismos judiciales.
plot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,TABLA_DE_DATOS_violencia_de_genero$Casos2024,main="Tasa de desempleo femenino Vs. Casos 2024",xlab="Tasa de desempleo femenino",ylab="Casos 2024", col = "pink3",pch = 19)
cor(TABLA_DE_DATOS_violencia_de_genero$Desempleo,TABLA_DE_DATOS_violencia_de_genero$Casos2024, method = "pearson")
## [1] -0.1943176
Este gráfico de dispersión relaciona la tasa de desempleo femenino con los casos reportados de violencia contra la mujer en 2024. Para la población de datos escogida (no es la totalidad de minucipios del departamento) no se percibe una correlación lineal clara entre ambas variables, es del -0.1943176, lo que sugiere que el desempleo por sí solo no explica directamente la cantidad de casos de violencia de genero en estas zonas. La concentración de puntos en la parte baja del eje vertical indica que la mayoría de los municipios reportan pocos casos, independientemente del nivel de desempleo femenino, sin embargo, se observan varios municipios con altos niveles de casos (datos atípicos), lo cual podría corresponder a zonas urbanas más pobladas; Para consideraciones sociales esta particularidad resalta cómo la violencia contra la mujer es un fenómeno complejo y multifactorial, donde el desempleo si puede ser un factor de riesgo, pero no actúa como único propulsor, por el contrario factores como la densidad poblacional, el acceso a canales de denuncia, la cultura institucional y el nivel educativo también influyen en la incidencia de violencia para las mujeres y su capacidad para reconocer y reportar estas situaciones. La ausencia de una relación directa en el gráfico no niega la influencia del desempleo, sino que invita a un análisis más integral y contextualizado.
plot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,main="Casos 2024 Vs. Denuncias formales 2024",xlab="Casos 2024",ylab="Denuncias formales 2024", col = "pink1", pch = 19)
cor(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, method = "pearson")
## [1] 0.9845069
Gráfico de dispersión que relaciona los casos reportados de violencia contra la mujer en 2024 con las denuncias formales del mismo año. Este gráfico revela una asociación positiva clara y creciente entre ambas variables, ya que se observa una correlación del 0.9845069, es decir a mayor número de casos, mayor cantidad de denuncias formales, lo que indica que aunque no todos los casos llegan al sistema judicial, existe una relación consistente entre el volumen de hechos reportados y los que se judicializan, lo que podría reflejar cierto nivel de confianza ciudadana en las rutas formales de denuncia. Sin embargo, la dispersión de puntos en el rango bajo sugiere que muchos municipios reportan pocos casos y denuncias, lo cual puede estar asociado a barreras de acceso, desconfianza institucional o normalización de la violencia, también entendiendo que esta dispersión es fomentada por datos atípicos, que pueden ser zonas urbanizadas mas grandes en relación con la mayoría de municipios analizados que son zonas pequeñas. Por último, este patrón manifiesta que si bien hay avances en la canalización formal de los casos, aún persisten desafíos importantes en la garantía de acceso equitativo a la justicia para todas las mujeres, especialmente en territorios con baja capacidad institucional o culturalmente restrictivos.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
muestra_15 <- TABLA_DE_DATOS_violencia_de_genero %>% arrange(desc(Habitantes)) %>% slice(1:15)
print(muestra_15, n=Inf, width = Inf)
## # A tibble: 15 × 17
## Municipio Región Zona Estratoprom Desempleo NEducativo AJusticia
## <chr> <chr> <chr> <chr> <dbl> <chr> <chr>
## 1 Facatativá Alto Magdalena Rural 4.0 0.128 Alta Baja
## 2 Fusagasugá Ubaté Urbana 3.0 0.095 Baja Baja
## 3 Chía Sabana Urbana 4.0 0.106 Alta Baja
## 4 Mosquera Ubaté Rural 1.0 0.124 Media Media
## 5 Madrid Ubaté Urbana 3.0 0.084 Alta Media
## 6 Funza Alto Magdalena Urbana 1.0 0.107 Alta Alta
## 7 Girardot Sumapaz Rural 1.0 0.111 Alta Alta
## 8 Cajicá Guavio Rural 3.0 0.113 Alta Baja
## 9 Cota Guavio Rural 4.0 0.118 Baja Media
## 10 La Calera Ubaté Urbana 2.0 0.086 Baja Baja
## 11 Guaduas Guavio Urbana 4.0 0.124 Media Baja
## 12 La Mesa Ubaté Rural 1.0 0.16 Baja Media
## 13 Granada Guavio Urbana 1.0 0.107 Alta Media
## 14 El Colegio Oriente Rural 4.0 0.138 Alta Alta
## 15 Cogua Oriente Rural 4.0 0.171 Alta Alta
## PUP PRAI Casos2024 Casos2023 Llamadas2024 Llamadas2023 Denuncias2024
## <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 Sí No 15549 8267 9275 8700 10211
## 2 Sí Sí 8892 7767 8640 7992 6135
## 3 Sí Sí 12786 7172 7890 7072 7249
## 4 Sí No 12617 7056 7520 7000 7762
## 5 No No 12383 6505 7050 6440 6911
## 6 No Sí 10299 5456 6130 5690 5476
## 7 Sí No 6058 5227 5530 5116 3742
## 8 Sí No 421 400 315 275 176
## 9 No No 2059 1657 1850 1730 1291
## 10 No Sí 2770 1592 1750 1610 952
## 11 Sí Sí 2310 2302 2450 2300 1453
## 12 No Sí 2484 1493 1680 1525 968
## 13 No Sí 2146 1423 1520 1423 1078
## 14 No Sí 1897 1181 1320 1235 217
## 15 No Sí 2061 1131 1330 1225 211
## Denuncias2023 Habitantes MujeresHab
## <dbl> <dbl> <dbl>
## 1 9283 175589 87492
## 2 5580 163789 81761
## 3 6590 151393 75495
## 4 6421 148848 74270
## 5 6283 144989 72399
## 6 4980 114885 57328
## 7 3402 109348 55028
## 8 162 74787 3727
## 9 1174 34934 17439
## 10 865 34684 17314
## 11 1321 34473 17218
## 12 880 33149 16558
## 13 980 27188 13578
## 14 197 25838 12903
## 15 192 24141 12059
Porcentaje de mujeres desempleadas en los municipios de cundinamarca.
media_col=mean(muestra_15$Desempleo)
varianza_col=var(muestra_15$Desempleo)
sd_col=sd(muestra_15$Desempleo)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Desempleo)
MAD_col=mad(muestra_15$Desempleo)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Desempleo),var(muestra_15$Desempleo),sd(muestra_15$Desempleo),100*sd(muestra_15$Desempleo)/mean(muestra_15$Desempleo),median(muestra_15$Desempleo),100*mad(muestra_15$Desempleo),mad(muestra_15$Desempleo)/median(muestra_15$Desempleo)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 1.181333e-01
## Varianza 5.938381e-04
## Desv_estandar 2.436879e-02
## cve_media 2.062821e+01
## Mediana 1.130000e-01
## MAD 1.630860e+00
## cve_mediana 1.443239e-01
summary(muestra_15$Desempleo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0840 0.1065 0.1130 0.1181 0.1260 0.1710
Casos de violencia de género reportados en Cundinamarca durante el año 2024.
media_col=mean(muestra_15$Casos2024)
varianza_col=var(muestra_15$Casos2024)
sd_col=sd(muestra_15$Casos2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Casos2024)
MAD_col=mad(muestra_15$Casos2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Casos2024),var(muestra_15$Casos2024),sd(muestra_15$Casos2024),100*sd(muestra_15$Casos2024)/mean(muestra_15$Casos2024),median(muestra_15$Casos2024),100*mad(muestra_15$Casos2024),mad(muestra_15$Casos2024)/median(muestra_15$Casos2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 6.315467e+03
## Varianza 2.695627e+07
## Desv_estandar 5.191943e+03
## cve_media 8.220997e+01
## Mediana 2.770000e+03
## MAD 3.482627e+05
## cve_mediana 1.257266e+00
summary(muestra_15$Casos2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 421 2104 2770 6315 11341 15549
Casos de violencia de género reportados en Cundinamarca durante el año 2023.
media_col=mean(muestra_15$Casos2023)
varianza_col=var(muestra_15$Casos2023)
sd_col=sd(muestra_15$Casos2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Casos2023)
MAD_col=mad(muestra_15$Casos2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Casos2023),var(muestra_15$Casos2023),sd(muestra_15$Casos2023),100*sd(muestra_15$Casos2023)/mean(muestra_15$Casos2023),median(muestra_15$Casos2023),100*mad(muestra_15$Casos2023),mad(muestra_15$Casos2023)/median(muestra_15$Casos2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 3.908600e+03
## Varianza 8.414907e+06
## Desv_estandar 2.900846e+03
## cve_media 7.421701e+01
## Mediana 2.302000e+03
## MAD 2.819905e+05
## cve_mediana 1.224981e+00
summary(muestra_15$Casos2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 400 1458 2302 3909 6780 8267
Llamadas presentadas a la línea 155 en el año 2024.
media_col=mean(muestra_15$Llamadas2024)
varianza_col=var(muestra_15$Llamadas2024)
sd_col=sd(muestra_15$Llamadas2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Llamadas2024)
MAD_col=mad(muestra_15$Llamadas2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Llamadas2024),var(muestra_15$Llamadas2024),sd(muestra_15$Llamadas2024),100*sd(muestra_15$Llamadas2024)/mean(muestra_15$Llamadas2024),median(muestra_15$Llamadas2024),100*mad(muestra_15$Llamadas2024),mad(muestra_15$Llamadas2024)/median(muestra_15$Llamadas2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 4.283333e+03
## Varianza 1.024033e+07
## Desv_estandar 3.200052e+03
## cve_media 7.470939e+01
## Mediana 2.450000e+03
## MAD 3.165351e+05
## cve_mediana 1.291980e+00
summary(muestra_15$Llamadas2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 315 1600 2450 4283 7285 9275
Llamadas presentadas a la línea 155 en el año 2023.
media_col=mean(muestra_15$Llamadas2023)
varianza_col=var(muestra_15$Llamadas2023)
sd_col=sd(muestra_15$Llamadas2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Llamadas2023)
MAD_col=mad(muestra_15$Llamadas2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Llamadas2023),var(muestra_15$Llamadas2023),sd(muestra_15$Llamadas2023),100*sd(muestra_15$Llamadas2023)/mean(muestra_15$Llamadas2023),median(muestra_15$Llamadas2023),100*mad(muestra_15$Llamadas2023),mad(muestra_15$Llamadas2023)/median(muestra_15$Llamadas2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 3.955533e+03
## Varianza 8.730841e+06
## Desv_estandar 2.954800e+03
## cve_media 7.470041e+01
## Mediana 2.300000e+03
## MAD 3.002265e+05
## cve_mediana 1.305333e+00
summary(muestra_15$Llamadas2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 275 1474 2300 3956 6720 8700
Denuncias formales realizadas por las victimas en el 2024.
media_col=mean(muestra_15$Denuncias2024)
varianza_col=var(muestra_15$Denuncias2024)
sd_col=sd(muestra_15$Denuncias2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Denuncias2024)
MAD_col=mad(muestra_15$Denuncias2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Denuncias2024),var(muestra_15$Denuncias2024),sd(muestra_15$Denuncias2024),100*sd(muestra_15$Denuncias2024)/mean(muestra_15$Denuncias2024),median(muestra_15$Denuncias2024),100*mad(muestra_15$Denuncias2024),mad(muestra_15$Denuncias2024)/median(muestra_15$Denuncias2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 3.588800e+03
## Varianza 1.144029e+07
## Desv_estandar 3.382350e+03
## cve_media 9.424737e+01
## Mediana 1.453000e+03
## MAD 1.893280e+05
## cve_mediana 1.303015e+00
summary(muestra_15$Denuncias2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 176 960 1453 3589 6523 10211
Denuncias formales realizadas por las victimas en el 2023.
media_col=mean(muestra_15$Denuncias2023)
varianza_col=var(muestra_15$Denuncias2023)
sd_col=sd(muestra_15$Denuncias2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Denuncias2023)
MAD_col=mad(muestra_15$Denuncias2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Denuncias2023),var(muestra_15$Denuncias2023),sd(muestra_15$Denuncias2023),100*sd(muestra_15$Denuncias2023)/mean(muestra_15$Denuncias2023),median(muestra_15$Denuncias2023),100*mad(muestra_15$Denuncias2023),mad(muestra_15$Denuncias2023)/median(muestra_15$Denuncias2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 3.220667e+03
## Varianza 9.138270e+06
## Desv_estandar 3.022957e+03
## cve_media 9.386122e+01
## Mediana 1.321000e+03
## MAD 1.718333e+05
## cve_mediana 1.300782e+00
summary(muestra_15$Denuncias2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 162.0 872.5 1321.0 3220.7 5931.5 9283.0
Habitantes de los municipios de Cundinamarca.
media_col=mean(muestra_15$Habitantes)
varianza_col=var(muestra_15$Habitantes)
sd_col=sd(muestra_15$Habitantes)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Habitantes)
MAD_col=mad(muestra_15$Habitantes)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Habitantes),var(muestra_15$Habitantes),sd(muestra_15$Habitantes),100*sd(muestra_15$Habitantes)/mean(muestra_15$Habitantes),median(muestra_15$Habitantes),100*mad(muestra_15$Habitantes),mad(muestra_15$Habitantes)/median(muestra_15$Habitantes)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 8.653567e+04
## Varianza 3.491301e+09
## Desv_estandar 5.908723e+04
## cve_media 6.828079e+01
## Mediana 7.478700e+04
## MAD 7.057028e+06
## cve_mediana 9.436169e-01
summary(muestra_15$Habitantes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 24141 33811 74787 86536 146918 175589
Mujeres habitantes de los municipios de Cundinamarca.
media_col=mean(muestra_15$MujeresHab)
varianza_col=var(muestra_15$MujeresHab)
sd_col=sd(muestra_15$MujeresHab)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$MujeresHab)
MAD_col=mad(muestra_15$MujeresHab)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$MujeresHab),var(muestra_15$MujeresHab),sd(muestra_15$MujeresHab),100*sd(muestra_15$MujeresHab)/mean(muestra_15$MujeresHab),median(muestra_15$MujeresHab),100*mad(muestra_15$MujeresHab),mad(muestra_15$MujeresHab)/median(muestra_15$MujeresHab)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
## Estadísticos_Descriptivos_univariados
## Promedio 4.097127e+04
## Varianza 9.726031e+08
## Desv_estandar 3.118659e+04
## cve_media 7.611819e+01
## Mediana 1.743900e+04
## MAD 2.032941e+06
## cve_mediana 1.165744e+00
summary(muestra_15$MujeresHab)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 3727 15068 17439 40971 73334 87492
table(muestra_15$Región)
##
## Alto Magdalena Guavio Oriente Sabana Sumapaz
## 2 4 2 1 1
## Ubaté
## 5
barplot(table(muestra_15$Región),col="pink4", main="Frecuencias de una muestra de la variable Región", las=2)
tabla_frecuencias <- table(muestra_15$NEducativo)
leyenda <- c("Media","Alta","Baja")
colores_personalizados <- c("pink", "pink2", "pink4")
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main="Nivel educativo promedio de una muestra de 15", col = colores_personalizados)
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)
tabla_frecuencias <- table(muestra_15$AJusticia)
leyenda <- c("Media", "Alta", "Baja")
colores_personalizados <- c("pink", "pink2", "pink4")
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main = "Acceso a la justicia de una muestra de 15", col = colores_personalizados)
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)
casos_log <- log10(muestra_15$Casos2024)
stem(casos_log)
##
## The decimal point is at the |
##
## 2 | 6
## 3 | 3333444
## 3 | 89
## 4 | 01112
casos_log1 <- log10(muestra_15$Casos2023)
stem(casos_log1)
##
## The decimal point is at the |
##
## 2 | 6
## 3 | 1122224
## 3 | 7788999
boxplot(muestra_15$Llamadas2024,muestra_15$Llamadas2023, names = c("2024", "2023"), main = "Distribución de llamadas a la línea 155 para una muestra de 15",col = c("pink", "pink3"))
stripchart(list(muestra_15$Llamadas2024, muestra_15$Llamadas2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"), vertical = TRUE)
boxplot(muestra_15$Denuncias2024,muestra_15$Denuncias2023, names = c("2024", "2023"), main = "Distribución de denuncias formales presentadas en Cundinamarca",col = c("pink", "pink3"))
stripchart(list(muestra_15$Denuncias2024, muestra_15$Denuncias2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"), vertical = TRUE)
hist(muestra_15$Habitantes,col="pink1",freq=T,main="Distribución de frecuencias de los habitantes de Cundinamarca",xlab="Habitantes",ylab="Frecuencias")
hist(muestra_15$MujeresHab,col="pink1",freq=T,main="Distribución de frecuencias de las mujeres habitantes de Cundinamarca",xlab="Mujeres Habitantes",ylab="Frecuencias")
TablaCruzada <- table(muestra_15$Zona,muestra_15$PUP)
TablaCruzada
##
## No Sí
## Rural 4 4
## Urbana 4 3
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores2 <- c("pink2", "pink4")
barplot(TablaCruzada, col = colores2)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Urbano", "Rural"), fill = colores2)
TablaCruzada <- table(muestra_15$Estratoprom,muestra_15$PRAI)
TablaCruzada
##
## No Sí
## 1.0 2 3
## 2.0 0 1
## 3.0 2 1
## 4.0 2 4
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores4 <- c("pink", "pink4", "pink1", "pink3")
barplot(TablaCruzada, col = colores4)
par(mfrow = c(1, 2))
legend("topleft", legend = c("1", "2", "3", "4"), fill = colores4)
TablaCruzada <- table(muestra_15$Región,muestra_15$AJusticia)
TablaCruzada
##
## Alta Baja Media
## Alto Magdalena 1 1 0
## Guavio 0 2 2
## Oriente 2 0 0
## Sabana 0 1 0
## Sumapaz 1 0 0
## Ubaté 0 2 3
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores8 <- c("pink2", "palevioletred4", "pink1","palevioletred3","pink4","palevioletred","pink3", "pink")
barplot(TablaCruzada, col = colores8)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Alto Magdalena", "Guavio", "Oriente", "Rio Negro", "Sabana", "Sumapaz", "Tequendama", "Ubaté"), fill = colores8)
plot(muestra_15$Casos2024,muestra_15$Llamadas2024,main="Casos 2024 Vs. Llamadas a la línea 155",xlab="Casos 2024",ylab="Llamadas a la línea 155", col = "pink2", pch = 19)
cor(muestra_15$Casos2024,muestra_15$Llamadas2024, method = "pearson")
## [1] 0.9548431
plot(muestra_15$Desempleo,muestra_15$Casos2024,main="Tasa de desempleo femenino Vs. Casos 2024",xlab="Tasa de desempleo femenino",ylab="Casos 2024", col = "pink3", pch = 19)
cor (muestra_15$Desempleo,muestra_15$Casos2024, method = "pearson")
## [1] -0.3190279
plot(muestra_15$Casos2024,muestra_15$Denuncias2024,main="Casos 2024 Vs. Denuncias formales 2024",xlab="Casos 2024",ylab="Denuncias formales 2024", col = "pink1", pch = 19)
cor(muestra_15$Casos2024,muestra_15$Denuncias2024, method = "pearson")
## [1] 0.9880002
Para efectos comparativos de nuestro análisis acerca de la violencia de género en los años 2023 y 2024 en el departamento de Cundinamarca, tomamos una muestra de los 15 municipios más poblados del departamento, con el fin de hacer una interpretación de resultados focalizada a las zonas mas relevantes del departamento y a las que por lo general van destinadas las políticas públicas, sin embargo es importante mencionar que sesgar el análisis a estas zonas puede omitir realidades territoriales clave.
Centrandose en las medidas univariadas de estadistica descriptiva, encontramos significativas diferencias entre ambas muestras, por un lado, esta muestra reducida resalta para el desempleo una media y una madiana mas bajas, lo que indica que los municipios más poblados del departamento tienen menores tasas de desempleo, lo que sugiere que la urbanización está asociada a una mayor diversificación laboral para mujeres, lo que trae consigo condiciones laborales más homogeneas y más oportunidades de trabajo, en contraste con la muestra completa de los municipios que si refleja valores extremos de zonas rurales con problemas como Fosca que tiene una tasa de desempleo de 17.9%. Esto da respuesta a que el coeficiente de variación y la desviación estandar de esta muestra reducida sean menores.
Por otro lado, en los casos de violencia reportandos en la muestra reducida, se percibe una media drásticamnete alta en comparación a la media de la totalidad de los datos evidenciando la concentración de casos en grandes núcleos urbanos, idea soportada por el análisis de los percentiles, pues mientras el 50% de municipios en la muestra completa reportan menos de 721.5 casos, en la muestra de 15 municipios el 50% supera los 2,770 casos. La desviación estándar absoluta es mayor en la muestra redicida, pero el coeficiente de variación es significativamente menor, lo que revela que los municipios más grandes tienen cifras absolutas más altas pero relativamente más consistentes entre sí.
La disparidad en las llamadas a la línea 155 entre ambas muestras revela un problema estructural e institucional, pues la media en la muestra de 15 es 2.8 veces mayor, lo que demuestra una mayor utilización del servio en los municipios más grandes, lo que se evidencia en los resultados de los cuartiles, pues en la muestra completa 25% de municipios realiza cerca de 356 llamadas y el 75% realiza 1,336, mientras que la muestra reducida el 25% realiza 1,600 llamadas y el 75% realiza 7,285 llamadas. Por otro lado la desviación estándar es mayor en la muestra de 15 y el coeficiente de variación es significativamente menor, lo que revela que los grandes municipios tienen patrones de uso más estable entre sí.
En cuanto a la variable de denuncias formales para ambas muestras la diferencia es grande, pues aunque la media y la mediana presentan una menor asimetría que la de la muestra total, aún se percibe una concentración en algunas zonas urbanas. La muestra de 15 tiene una mediana 10 veces mayor, probando que la mayoría de municipios pequeños están sub-representados en el sistema judicial. Así, se sigue observando un brecha social y zonal, pues la mediana de la muestra de 15 (1,453) supera el tercer cuartíl de la muestra completa, probando que el 75% de municipios está por debajo del estándar urbano.
Para la variable de habitantes por municipio se percibe una gran brecha demográfica, pues la muestra de 15 municipios más poblados presenta una media 3 veces mayor y una mediana 6.2 veces superior, lo que revela gracias a los cuartiles que el 25% de los municipios en la muestra completa no supera los 6,465 habitantes, mientras en la muestra de 15, el 25% inferior ya supera los 33,811.
Los resultados de la variable habitantes mujeres revelan una desigualdad demográfica, pues mientras que la muestra completa presenta una media de 13,834 mujeres y una mediana de 6,000, la muestra de 15 municipios más poblados triplica estos valores. La desviación estándar es mayor en la muestra de 15, pero el coeficiente de variación es menor, demostrando así que los municipios grandes tienen una distribución relativamente más homogénea en proporción a su tamaño y confirmando que pocos municipios concentran la mayoría de la población femenina, lo que a su vez puede explicar la incidencia en más casos de violencia de género. La muestra de 15 excluye el 75% de municipios con alrededor de 10,410 mujeres (tercer cuartíl de la muestra completa), lo que distorsiona la percepción de la distribución real.
La ilustración e interpretación de las gráficas realizadas para cada muestra nos permite evidenciar cierto comportaminto. Empezando por la gráfica de barras que representa la frecuencia de la variable Región, pues tanto la muestra reducida como la muestra completa están dominadas por las regiones de Ubaté y Guavio, sin embargo para la totalidad de la muestra Guavio es la región más representada, mientras que en la muestra reducida Ubaté lleva la delantera, lo que determina que los municipios de Ubaté tienen poblaciones más grandes o con mayores tasas de violencia. Por otro lado para el análisis de la frecuencia de la variable zona, es preciso mencionar que el gráfico de la muestra completa refleja mejor la realidad del departamento, donde la mayoría de los municipios son rurales y son los que enfrentan mayores desafíos institucionales y estructurales, mientras que el de la muestra reducida al centrarse en los territorios más grandes con las tendencias a la urbanización puede oscurecer desigualdades críticas. Para terminar de comparar los gráficos de barras es importante mencionar los de la frecuencia de la variable estrato socioeconómico, donde los municipios de estratos bajos (1 y 2) representan más del 53% de la muestra total, mientras que en la muestra reducida hay un cambio drástico en la distribución, pues el estrato 4 pasa de ser minoritario (23.3%) a ser el más frecuente (33.3%), lo que podría subestimar la relación entre pobreza y violencia de género, pues esta muestra priorizó los municipios más poblados y con más oportunidades.
Siguiendo con el análisis comparativo para la gráfica que reprensenta el nivel educativo promedio en los municipios se puede decir que, para la muestra de 60 municipios existe un equilibrio cercano entre los tres niveles, con un ligero predominio de niveles altos y bajos, mientras que en la muestra reducida se percibe un aumento en educación “Alta” (del 35% al 60%) y una caída de “Media” (del 30% al 13%), lo que sugiere que la mayoría de los municipios tienen educación “Alta”, ocultando la desigualdad educativa como un factor crítico para entender barreras culturales y de denuncia. Así mismo la gráfica que representa el acceso a la justicia indica que, aunque las proporciones son similares, para la muestra reducida hay un ligero aumento en acceso “Alta” (del 25% al 27%) y menos municipios con acceso “Baja” (del 42% al 40%), ,lo que sugiere que los municipios con acceso “Alta” son urbanos y poblados, lo que distorsiona la realidad de las zonas más aisladas.
Los diagramas de caja tambien proporcionan una visión comparativa entre muestras pues, la distribución de llamadas a la línea 155 en los años 2023 y 2024 revela que, la mediana de la muestra reducida para 2024 es 3.7 veces mayor que en la completa, lo que confirma que la muestra reducida solo incluye municipios grandes con alta demanda del servicio y que esta muestra tiene menos valores atípicos porque ya está sesgada hacia municipios con altos volúmenes de llamadas, sin emabargo esto distorsiona la realidad al sugerir que el uso de la línea 155 es alto en general y que es un fenómeno urbano. En el gráfico que representa la distribución de denuncias formales presentadas en el departamento para ambos años se observa que, la mediana de la muestra reducida es 10 veces mayor que en la completa, confirmando que los unicipios grandes tienen mayor capacidad de denuncia o también que como ya se observo los casos de violencia también se presentan en mayor medida, lo que invisibiliza la falta de acceso a la justicia en municipios pequeños. La muestra total expone la crisis de subregistro en municipios pequeños y la reducida distorsiona la escala del problema.
Por su parte los histogramas de ambas muestras revelan una brecha crítica en la representación demográfica de Cundinamarca, ya que la muestra completa expone una estructura desigual, teniendo el 80% son municipios pequeños, con mayoría de poblaciones rurales y acceso limitado a servicios, lo que agrava el subregistro de violencia de género y por el contrario la muestra reducida sesga la realidad al incluir solo zonas urbanas y medianas, todas con mas de 20.000 habitantes, ocultando la vulnerabilidad de áreas rurales donde las mujeres enfrentan mayores barreras y sobredimensionando la capacidad requerida en ciudades, ignorando que el problema es estructural en municipios pequeños.
El estudio de la distribución de recursos institucionales en los 15 municipios más poblados de Cundinamarca muestra patrones que no siguen las expectativas comunes. Contrario a lo que se esperaría de una mayor cobertura en áreas densamente pobladas, la presencia de unidades policiales en esta muestra no favorece claramente ni a las zonas rurales ni a las urbanas, en el campo hay una distribución pareja (4 con y 4 sin), mientras que en las ciudades hay incluso más lugares sin presencia policial (4 sin y 3 con). Esto contrasta con la muestra total, donde sí se ve una ligera mayor cobertura urbana, lo que sugiere que ni el tamaño del municipio ni su desarrollo urbano aseguran una asignación prioritaria de policías, indicando posibles desequilibrios en el reparto de la seguridad.
En cuanto a la disponibilidad de rutas de atención integral, se nota que están más presentes en los estratos 1 y 4, con poca o igual cobertura en los estratos 2 y 3. Este patrón significa que el acceso a estas rutas en los municipios más grandes no sigue una lógica sencilla por nivel económico, y no siempre prioriza a los estratos más vulnerables. Esto podría deberse a decisiones institucionales que no se ajustan bien a las necesidades reales de cada grupo social. Esta distribución desigual también se observa parcialmente en los datos completos, lo que sugiere una falta general de un plan claro para repartir estos servicios importantes de manera equitativa.
A su vez, la relación entre el acceso a la justicia y la región en estos 15 municipios poblados muestra diferencias importantes. Algunas regiones como Oriente y Sumapaz tienen solo niveles altos de acceso, lo que podría indicar más presencia institucional o mejores condiciones para ayudar a las víctimas. Por el contrario, regiones como Guavio y Ubaté concentran sus casos en niveles medio y bajo, lo que sugiere posibles limitaciones en los servicios disponibles. Aunque este patrón regional también se ve en la muestra total, el análisis en los municipios más grandes ayuda a identificar con mayor claridad dónde existen las falencias en la cobertura y efectividad de los servicios de justicia, destacando la necesidad de reforzar la atención en las regiones donde las barreras aún son significativas.
Los diagramas de dispersión revelan patrones diferenciados en la relación entre variables clave de violencia de género al comparar la muestra total de municipios con los 15 más poblados de Cundinamarca. En la relación entre llamadas a la línea 155 y casos reportados, la muestra general muestra una conexión positiva pero dispersa, indicando variaciones entre municipios. En contraste, los 15 municipios más grandes exhiben una tendencia más agrupada, con un volumen consistentemente más alto en ambas variables. Esto sugiere que las áreas más pobladas no solo registran más incidentes, sino que también presentan una correlación más clara entre las llamadas de auxilio y el registro formal de casos, posiblemente por una mayor capacidad institucional para documentarlos.
Por otro lado, el análisis de la relación entre el desempleo femenino y los casos reportados no muestra una tendencia lineal clara en ninguna de las muestras. Los puntos se dispersan aleatoriamente, sin indicar que un aumento en el desempleo femenino se traduzca en un incremento proporcional de casos de violencia. Incluso en los municipios grandes, donde se observan tasas de desempleo ligeramente mayores, los casos de violencia no aumentan en la misma medida. Esto sugiere que el desempleo femenino no es un factor determinante directo en la variación de los casos reportados, y que otros elementos, como el acceso a servicios o políticas locales, podrían tener una influencia más significativa en los registros de violencia.
Finalmente, al examinar la relación entre los casos reportados y las denuncias formales, se observa una fuerte asociación positiva en ambos conjuntos de datos. Su alineación indica que a medida que aumentan los casos reportados, las denuncias formales crecen proporcionalmente. En la muestra total, esta relación es moderadamente dispersa, con algunos municipios que se desvían de la tendencia general. Sin embargo, en los 15 municipios más poblados, esta relación es más compacta y cercana a una línea, con valores consistentemente altos en ambas variables (denuncias superiores a 4000 y casos por encima de 5000). Esta coherencia más robusta en las áreas urbanas sugiere mecanismos de denuncia más eficientes o una mayor incidencia real de casos que son documentados formalmente.
El análisis estadístico de la violencia de género en Cundinamarca durante 2023 y 2024, comparando una muestra general de municipios con otra centrada en los 15 más poblados, muestra diferencias importantes que deben tenerse en cuenta al diseñar políticas públicas. En los municipios más grandes se concentra la mayor parte de la población femenina, así como un número significativamente mayor de denuncias y llamadas a la línea 155. Esto podría interpretarse como una mayor visibilidad de la problemática en zonas urbanas, pero también refleja una mayor facilidad para acceder a los canales de atención y denuncia.
En contraste, los municipios con menor población tienden a mostrar menos casos reportados, lo que no necesariamente significa que haya menos violencia, sino que puede deberse a barreras en el acceso a la justicia y a la falta de mecanismos de atención. Las diferencias en las medianas, promedios y medidas de dispersión entre las dos muestras, así como la presencia de valores extremos en los municipios grandes, refuerzan esta idea.
Estos resultados evidencian una desigualdad territorial en la forma en que la violencia de género se registra y atiende. Si bien los datos de las zonas urbanas son útiles para tomar decisiones, es clave no dejar de lado las realidades de los municipios más pequeños, donde la violencia puede ser igual o incluso más grave, pero menos visible. Por eso, es necesario que las estrategias de prevención, atención y justicia lleguen a todo el departamento, adaptándose a las condiciones específicas de cada municipio, para garantizar una respuesta más justa, equitativa y efectiva para todas las mujeres.
library(moments)
library(ecostats)
## Loading required package: mvabund
library(vcd)
## Loading required package: grid
library(Rgof)
hist(TABLA_DE_DATOS_violencia_de_genero$Desempleo,col="pink",freq=T,main="Distribución de frecuencias del desempleo femenino",xlab="Desempleo femenino",ylab="Frecuencias")
Teniendo en cuenta que el rango de datos está entre aproximadamente 0.08 y 0.18, que tiene varias modas o agrupaciones de valores sugiriendo asimetría, que no tiene forma de campana y que no tiene cola alargada a la derecha ni a la izquierda. Se puede determinar entonces que la distribución de probabilidad más apropiada es Beta, dado que está definida en el intervalo [0, 1], lo que es coherente con proporciones o tasas como el desempleo, además presenta una forma irregular, por lo que esta distribución resulta útil comúnmente en estudios sociales y económicos para modelar tasas o porcentajes.
summary(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 0.0810 0.1047 0.1240 0.1272 0.1505 0.1790
mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 0.1272333
median(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 0.124
skewness (TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 0.1974911
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 1.817957
(Asimetría) Skewness = 0.197: Este valor de asimetría es positivo pero bajo, lo que indica que la distribución es ligeramente sesgada a la derecha. En una distribución Beta, esto podría corresponder a un caso donde los parámetros α y β son ligeramente diferentes, con α ligeramente menor que β.
Kurtosis = 1.82: La curtosis está por debajo de 3, lo que indica que la distribución tiene colas más ligeras y es más plana que una normal, por tanto se rechaza dicha distribución. Esto sugiere que hay menos valores extremos de los esperados bajo una distribución normal, lo cual es coherente con una Beta de forma más concentrada en torno a la media.
hist(TABLA_DE_DATOS_violencia_de_genero$Casos2024,col="pink1",freq=T,main="Distribución de frecuencias de los casos en 2024",xlab="Casos 2024",ylab="Frecuencias")
Teniendo en cuenta que el eje X (Casos 2024) va desde 0 hasta más de 15,000 casos y el eje Y (Frecuencias) tiene la mayoría de datos concentrados en los primeros valores cercanos a 0, es decir una gran concentración de municipios con pocos casos (más de 40 municipios tienen menos de 2,000 casos). Se puede decir que además de ser altamente simétrica, tiene una cola larga hacia la derecha (sesgo positivo). Por lo que la distribución de probabilidad más adecuada es la distribución Gamma donde la media y la varianza son diferentes.
summary(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 109.0 398.5 721.5 2061.8 1524.8 15549.0
mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 2061.75
median(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 721.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 2.55395
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 8.31008
(Asimetría) Skewness = 2.55: La distribución tiene fuerte sesgo positivo, lo que significa que la mayoría de los municipios tiene relativamente pocos casos, pero algunos tienen valores extremadamente altos, lo cual empuja la media muy por encima de la mediana. Este comportamiento es típico de la distribución Gamma, que puede capturar esa cola larga a la derecha.
Kurtosis = 8.31: Este valor indica con colas pesadas y concentración alrededor de la media. La Gamma también es apta para este tipo de comportamiento si se ajustan adecuadamente sus parámetros. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$Casos2023,col="pink2",freq=T,main="Distribución de frecuencias de los casos en 2023",xlab="Casos 2023",ylab="Frecuencias")
Teniendo en cuenta que el eje X (Casos 2023) tiene valores desde 0 hasta aproximadamente 9000 y que la mayoría están entre 0 y 2000 casos, podemos decir que hay una cola larga a la derecha, con algunos municipios que tienen cantidades muy superiores al resto (mayor dispersión), lo que la hace una distribución muy asimétrica con sesgo positivo y además presenta una varianza significativamente mayor que la media. La distribución de probabilidad más adecuada es la distribución Gamma.
summary(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 99.0 329.0 575.5 1368.8 1194.8 8267.0
mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 1368.833
median(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 575.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 2.307976
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 6.955668
(Asimetría) Skewness = 2.31: La mayoría de los municipios tienen pocos casos, pero algunos presentan valores muy altos que alargan la cola derecha de la distribución.
Kurtosis = 6.96: Esto sugiere la presencia de valores extremos más frecuentes de lo esperado en una distribución normal. Esta combinación confirma que los datos están concentrados en valores bajos, pero con ocasionales picos muy altos, lo que justifica el uso de una distribución Gamma, adecuada para modelar datos positivos, asimétricos y con colas grandes. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,col="pink3",freq=T,main="Distribución de frecuencias de las Llamadas en 2024",xlab="Llamadas 2024",ylab="Frecuencias")
Se observa que el eje X (Llamadas 2024) tiene valores de 0 hasta cerca de 10,000 llamadas y que la mayoría de municipios reportan menos de 2000 llamadas, concentrándose fuertemente en ese rango, por lo que hay una cola larga hacia la derecha. La distribución de probabilidad más adecuada es la distribución Gamma, ya que se tienen datos positivos y continuos, con mucha dispersión, además de una alta concentración de valores bajos con valores extremos hacia la derecha y una varianza mayor que la media, lo que descarta distribuciones como Poisson.
summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 97.0 356.2 667.5 1512.5 1332.5 9275.0
mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 1512.5
median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 667.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 2.322403
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 7.086882
(Asimetría) Skewness = 2.32: La asimetría positiva indica que la distribución está sesgada hacia la derecha, es decir, que la mayoría de los municipios tienen pocas llamadas, pero hay algunos municipios con muchísimas llamadas, que empujan la media hacia arriba.
Kurtosis = 7.09: Este valor de curtosis es mucho mayor que 3 (valor de la distribución normal) por tal motivo se descarta dicha distribución. Además, se evidencia que tiene un pico más pronunciado alrededor de la media y presenta colas más pesadas, es decir, más valores extremos de lo que se esperaría en una distribución normal.
hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,col="pink4",freq=T,main="Distribución de frecuencias de las llamadas en 2023",xlab="Llamadas 2023",ylab="Frecuencias")
Se observa que el eje X (Llamadas 2023) tiene valores de 0 hasta cerca de 9,000 llamadas y que la mayoría de municipios reportan menos de 2000 llamadas, concentrándose fuertemente en ese rango, por lo que hay una cola larga hacia la derecha. La distribución de probabilidad más adecuada es la distribución Gamma, ya que se tienen datos positivos y continuos, con mucha dispersión, además de una alta concentración de valores bajos con valores extremos hacia la derecha y sobredispersión donde se percibe una varianza mucho mayor que la media, lo que descarta distribuciones como Poisson.
summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 88.0 314.2 593.0 1385.5 1227.5 8700.0
mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 1385.55
median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 593
skewness (TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 2.326704
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 7.137554
(Asimetría) Skewness = 2.33: Este valor indica una fuerte asimetría positiva, es decir, la distribución está sesgada a la derecha, ya que la mayoría de los municipios tienen valores bajos o moderados de llamadas, pero hay unos pocos con valores muy altos, lo cual “alarga la cola” hacia la derecha.
Kurtosis = 7.14: hay una alta concentración de valores cercanos a la media, pero también colas más pesadas de lo normal, es decir, una mayor presencia de valores extremos. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,col="palevioletred4",freq=T,main="Distribución de frecuencias de las denuncias en 2024",xlab="Denuncias 2024",ylab="Frecuencias")
La distribución de probabilidad más adecuada para esta variable es la distribución Gamma, ya que contiene datos positivos y continuos, el histograma tiene una forma altamente asimétrica con cola larga a la derecha, además se evidencia una alta dispersión (cuando la varianza es mayor que la media). Se descarta una distribución Poisson, ya que solo es para conteos discretos y no sirve bien con alta dispersión.
summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 33.00 86.75 145.50 1033.73 401.00 10211.00
mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 1033.733
median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 145.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 2.640293
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 8.945195
(Asimetría) Skewness = 2.64: Este valor indica que la distribución es asimétrica positiva, y sugiere un fuerte sesgo a la derecha, pues la mayoría de los municipios reportan pocos casos de denuncias, pero hay algunos con valores extremadamente altos, lo que “alarga” la cola derecha.
Kurtosis = 8.95: Este valor de kurtosis es muy alto, lo que implica colas extremadamente pesadas, es decir, muchos valores atípicos extremos. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,col="palevioletred3",freq=T,main="Distribución de frecuencias de las denuncias en 2023",xlab="Denuncias 2023",ylab="Frecuencias")
Se observa que el eje X (Denuncias 2023), tiene valores desde 0 hasta más de 10,000 denuncias, donde la mayoría de municipios reportan menos de 2000 denuncias, por lo que se observa una cola muy larga hacia la derecha, lo que indica alta asimetría positiva, sin embargo algunos municipios tienen valores muy altos (más de 8000), lo que muestra una alta dispersión. Esto permite determinar que la distribución de probabilidad más apropiada es la distribución Gamma.
summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 30.00 78.75 132.50 929.22 364.25 9283.00
mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 929.2167
median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 132.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 2.643887
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 9.033088
(Asimetría) Skewness = 2.64: Este valor indica una fuerte asimetría positiva, teniendo en cuenta que la mayoría de los municipios tiene un número bajo o moderado de denuncias y unos pocos municipios registran valores muy altos, lo que genera una cola larga a la derecha. Esto es consistente con que la media (929.22) es mucho mayor que la mediana (132.5).
Kurtosis = 9.03: este coeficiente implica una alta concentración de valores cerca del centro (la mediana), pero también colas muy pesadas, es decir, valores atípicos más frecuentes de lo normal. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$Habitantes,col="palevioletred2",freq=T,main="Distribución de frecuencias de los habitantes por municipio",xlab="Habitantes",ylab="Frecuencias")
Se observa en el eje X (Habitantes) un rango desde cerca de 0 hasta más de 160,000 habitantes, donde la mayoría de municipios tienen menos de 40,000 habitantes, lo que significa que hay una cola muy larga hacia la derecha, lo cual sugiere alta asimetría positiva, sin embargo en algunos municipios son considerablemente más grandes que el promedio, creando un efecto de valores extremos, es decir la concentración en valores bajos y la dispersión hacia valores altos indican una distribución no simétrica. Se puede decir entonces que la distribución de probabilidad más apropiada es la distribución Gamma.
summary(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 2047 6465 12052 28759 21991 175589
mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 28758.68
median(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 12051.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 2.25662
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 6.693941
(Asimetría) Skewness = 2.26: La asimetría positiva indica que la distribución está sesgada hacia la derecha, el valor muestra un sesgo considerable, pues la mayoría de los municipios tienen poblaciones menores o moderadas, pero unos pocos tienen poblaciones muy altas, que alargan la cola derecha.
Kurtosis = 6.69: tiene un pico alto en torno a la media, también posee colas más pesadas, lo que implica valores extremos más frecuentes que en una distribución normal. Se evidencia mucha concentración de municipios con población relativamente baja, pero también una alta probabilidad de valores atípicamente grandes. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,col="palevioletred1",freq=T,main="Distribución de frecuencias de las mujeres habitantes",xlab="Mujeres habitantes",ylab="Frecuencias")
Se observa en el eje X (Habitantes mujeres) un rango desde cerca de 0 hasta más de 80,000 habitantes, donde la mayoría de municipios tienen menos de 12,000 habitantes, lo que significa que hay una cola muy larga hacia la derecha, lo cual sugiere alta asimetría positiva, sin embargo en algunos municipios son considerablemente más grandes que el promedio, creando un efecto de valores extremos, es decir la concentración en valores bajos y la dispersión hacia valores altos indican una distribución no simétrica. Se puede decir entonces que la distribución de probabilidad más apropiada es la distribución Gamma.
summary(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1019 3230 6000 13834 10410 87492
mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 13833.5
median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 6000
skewness (TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 2.361178
kurtosis(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 7.101188
(Asimetría) Skewness = 2.36: Este valor refleja una asimetría positiva marcada, ya que la mayoría de los municipios tiene una población femenina baja o moderada, sin embargo hay una minoría con valores muy altos, lo que alarga la cola a la derecha de la distribución.
Kurtosis = 7.10: en este caso, es bastante alta, entonces la distribución tiene un pico alto y está más concentrada cerca de la mediana, también tiene colas pesadas, lo que implica frecuencia elevada de valores extremos. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.
hist(TABLA_DE_DATOS_violencia_de_genero$Desempleo,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,20),main="Distribución de frecuencias de Desempleo femenino",xlab="Desempleo femenino")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Desempleo),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 0.1272
sd_d <- 0.02961926
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
# calcular el rango del eje ±3 desviaciones estándar
Inferior <- mean_d - 3*sd_d
Superior <- mean_d + 3*sd_d
# curvas
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","pink2","palevioletred"),c("Densidad","Normal teórica","Gamma teórica"),lty=1,lwd=3)
# calcular alfa y beta para beta
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
alfa <- mean_x * ( (mean_x * (1 - mean_x)) / var_x - 1 )
betas <- (1 - mean_x) * ( (mean_x * (1 - mean_x)) / var_x - 1 )
min_x <- min(x_scaled)
max_x <- max(x_scaled)
# curvas
hist(x_scaled, freq=FALSE, col="whitesmoke", main="Distribución Beta ajustada para desempleo femenino", xlab="Desempleo femenino (escalado)")
lines(density(x_scaled), col="palevioletred1", lwd=3)
curve(dunif(x, min=min_x, max=max_x), from = min_x, to = max_x, col="pink2", add=T, lwd=3)
curve(dbeta(x, alfa, betas), 0, 1, col="pink3", add=T, lwd=3)
legend("topright",col=c("palevioletred1","pink3", "pink2"),c("Densidad","Beta teórica", "Uniforme teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 0.1272
sd_d <- 0.02961926
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Desempleo, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Desempleo, : ties
## should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Desempleo
## D = 0.099389, p-value = 0.5939
## alternative hypothesis: two-sided
# definir media y desviación estandar
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
alfa <- mean_x * ( (mean_x * (1 - mean_x)) / var_x - 1 )
betas <- (1 - mean_x) * ( (mean_x * (1 - mean_x)) / var_x - 1 )
ks.test(TABLA_DE_DATOS_violencia_de_genero$Desempleo, "pbeta",alfa,betas)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Desempleo, : ties
## should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Desempleo
## D = 0.7712, p-value < 2.2e-16
## alternative hypothesis: two-sided
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
min_x <- min(x_scaled)
max_x <- max(x_scaled)
ks.test(TABLA_DE_DATOS_violencia_de_genero$Desempleo, "punif",min=min_x, max=max_x)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Desempleo, : ties
## should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Desempleo
## D = 0.821, p-value < 2.2e-16
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 0.1272
sd_d <- 0.02961926
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,yygam,col="violetred3", xlab = "Datos observados (Desempleo femenino)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
# definir media y desviación estandar
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
alfa <- mean_x * ( (mean_x * (1 - mean_x)) / var_x - 1 )
betas <- (1 - mean_x) * ( (mean_x * (1 - mean_x)) / var_x - 1 )
yybeta=rbeta(60,alfa,betas)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,yybeta,col="violetred3", xlab = "Datos observados (Desempleo femenino)",ylab = "Datos simulados (Beta)", main = "Gráfico Q-Q para distribución Beta")
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
min_x <- min(x_scaled)
max_x <- max(x_scaled)
yyunif=runif(60,min=min_x,max=max_x)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,yyunif,col="violetred3", xlab = "Datos observados (Desempleo femenino)",ylab = "Datos simulados (Uniforme)", main = "Gráfico Q-Q para distribución Uniforme")
options(scipen=999)
hist(TABLA_DE_DATOS_violencia_de_genero$Casos2024,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0006), main="Distribución de frecuencias de Casos en 2024",xlab="Casos 2024")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Casos2024),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 2061.8
sd_d <- 3559.473
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 2061.8
sd_d <- 3559.473
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2024, "pgamma",shape=shape_d, scale=scale_d)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Casos2024
## D = 0.28828, p-value = 0.00006568
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 2061.8
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2024, "pexp",rate=lamda)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Casos2024
## D = 0.24072, p-value = 0.00152
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 2061.8
sd_d <- 3559.473
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,yygam,col="violetred3", xlab = "Datos observados (Casos 2024)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 2061.8
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,yyexp,col="violetred3", xlab = "Datos observados (Casos 2024)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$Casos2023,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0008),main="Distribución de frecuencias de Casos en 2023",xlab="Casos 2023")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Casos2023),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1368.8
sd_d <- 2066.591
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 1368.8
sd_d <- 2066.591
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2023, "pgamma",shape=shape_d, scale=scale_d)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Casos2023
## D = 0.24607, p-value = 0.0011
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1368.8
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2023, "pexp",rate=lamda)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Casos2023
## D = 0.20942, p-value = 0.008708
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 1368.8
sd_d <- 2066.591
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2023,yygam,col="violetred3", xlab = "Datos observados (Casos 2023)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 1368.8
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2023,yyexp,col="violetred3", xlab = "Datos observados (Casos 2023)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0008),main="Distribución de frecuencias de Llamadas en 2024",xlab="Llamadas 2024")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1512.5
sd_d <- 2268.5372
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 1512.5
sd_d <- 2268.5372
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Llamadas2024
## D = 0.2302, p-value = 0.003463
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1512.5
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Llamadas2024
## D = 0.19429, p-value = 0.02156
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 1512.5
sd_d <- 2268.5372
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,yygam,col="violetred3", xlab = "Datos observados (Llamadas 2024)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 1512.5
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,yyexp,col="violetred3", xlab = "Datos observados (Llamadas 2024)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0008),main="Distribución de frecuencias de Llamadas 2023",xlab="Llamadas 2023")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1385.55
sd_d <- 2099.386
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred","violetred" ),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 1385.55
sd_d <- 2099.386
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023, "pgamma",shape=shape_d, scale=scale_d)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Llamadas2023
## D = 0.2346, p-value = 0.002181
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1385.55
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023, "pexp",rate=lamda)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Llamadas2023
## D = 0.20914, p-value = 0.008833
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 1385.55
sd_d <- 2099.386
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,yygam,col="violetred3", xlab = "Datos observados (Llamadas 2023)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 1385.55
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,yyexp,col="violetred3", xlab = "Datos observados (Llamadas 2023)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.003),main="Distribución de frecuencias de Denuncias en 2024",xlab="Denuncias 2024")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1033.733
sd_d <- 2236.390
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 1033.733
sd_d <- 2236.390
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Denuncias2024
## D = 0.37618, p-value = 0.00000008434
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1033.733
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Denuncias2024
## D = 0.51065, p-value = 0.00000000000005143
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 1033.733
sd_d <- 2236.390
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,yygam,col="violetred3", xlab = "Datos observados (Denuncias 2024)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 1033.733
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,yyexp,col="violetred3", xlab = "Datos observados (Denuncias 2024)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.003),main="Distribución de frecuencias de Denuncias en 2023",xlab="Denuncias 2023")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 929.22
sd_d <- 2002.327
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 929.22
sd_d <- 2002.327
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Denuncias2023
## D = 0.37471, p-value = 0.00000009631
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 929.22
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Denuncias2023
## D = 0.50896, p-value = 0.00000000000006325
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 929.22
sd_d <- 2002.327
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,yygam,col="violetred3", xlab = "Datos observados (Denuncias 2023)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 929.22
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,yyexp,col="violetred3", xlab = "Datos observados (Denuncias 2023)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$Habitantes,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0001),main="Distribución de frecuencias de Habitantes por municipio",xlab="Habitantes")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Habitantes),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 28759
sd_d <- 4451.127
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred","violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 28759
sd_d <- 4451.127
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Habitantes, "pgamma",shape=shape_d, scale=scale_d)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Habitantes
## D = 0.71421, p-value = 0.0000000000000006661
## alternative hypothesis: two-sided
#calcular landa
mean_d <- 28759
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Habitantes, "pexp",rate=lamda)
##
## Exact one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$Habitantes
## D = 0.24015, p-value = 0.001572
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 28759
sd_d <- 4451.127
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Habitantes,yygam,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 28759
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Habitantes,yyexp,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
hist(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0002),main="Distribución de frecuencias de Mujeres habitantes",xlab="Mujeres habitantes")
lines(density(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),col="palevioletred4",lwd=3)
#definir media y desviación estandar
mean_d <- 13834
sd_d <- 2203.963
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)
# definir media y desviación estandar
mean_d <- 13834
sd_d <- 2203.963
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$MujeresHab
## D = 0.7215, p-value < 0.00000000000000022
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 13834
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
##
## Asymptotic one-sample Kolmogorov-Smirnov test
##
## data: TABLA_DE_DATOS_violencia_de_genero$MujeresHab
## D = 0.2426, p-value = 0.001713
## alternative hypothesis: two-sided
# definir media y desviación estandar
mean_d <- 13834
sd_d <- 2203.963
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,yygam,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")
#calcular lamda
mean_d <- 13834
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,yyexp,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")
Teniendo en cuenta que la función K-S test compara la distribución empírica de una muestra con una distribución teórica, la hipótesis nula que en este caso es que la variable sigue la distribución teórica especificada (gamma o beta, según nuestra observación), la hipótesis alternativa que consecuentemente sería que la variable no sigue dicha distribución y que un p-valor bajo < 0.05 implica que hay evidencia significativa para rechazar H₀, es decir, los datos no se ajustan a la distribución teórica, como paso en todas nuestras variables analizadas, podemos decir que:
Tasa de desempleo femenino
Según el histograma y sus características propusimos una distribución Beta para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, lo que puede deberse a que puede estar mejor ajustada a otra distribución continua como una normal truncada o una logit-normal (temas aún no vistos y dominados en este curso).
Casos de violencia 2024 y 2023
Según el histograma y sus características propusimos una distribución Gamma para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución a pesar de la asimetría y forma visual típica de una Gamma, esto puede deberse a que los valores atípicos extremos afectan el ajuste, por lo que es posible que una distribución como la log-normal o Weibull funcione mejor (temas aún no vistos y dominados en este curso).
Llamadas a la línea 155 - 2024 y 2023
Según el histograma y sus características propusimos una distribución Gamma para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, puede ser porque hay alto sesgo positivo pero también un núcleo de valores moderados y pocos valores muy extremos que pueden afectar el ajuste, alternativamente podría funcionar una log-normal o una exponencial generalizada (temas aún no vistos y dominados en este curso).
Denuncias formales 2024 y 2023
Según el histograma y sus características propusimos una distribución Gamma para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, aunque visualmente pueda parecerse a una Gamma, los datos reales tienen más dispersión o irregularidades que la gamma no modela bien, también puede deberse a que hay fuerte subregistro en la mayoría de municipios, y concentración de denuncias en pocos municipios, lo que rompe la suposición de homogeneidad de la gamma.
Habitantes y Mujeres Habitantes
Aunque claramente son variables asimétricas y visualmente asignamos una distribución Gamma, el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, lo que puede deberse a valores extremadamente altos en pocos municipios (como Soacha, Facatativá, Mosquera), lo que distorsiona la forma gamma. Alternativamente se podrían hacer transformaciones logarítmicas, modelos mixtos o incluso distribución Pareto (temas aún no vistos y dominados en este curso).
En conclusión, aunque visualmente algunas variables parecían ajustarse a distribuciones teóricas específicas, los resultados obtenidos mediante las pruebas de Kolmogorov-Smirnov indican que ninguna de estas variables se ajusta estadísticamente a las distribuciones planteadas. Esto se evidencia en los valores p significativamente bajos, que nos llevan a rechazar la hipótesis nula de que los datos siguen las distribuciones teóricas propuestas. Esto refleja que, aunque las formas visuales de los histogramas pueden orientar inicialmente la elección de una distribución, la validación estadística es indispensable, ya que muchos de los datos presentan alta asimetría, valores extremos y gran dispersión como es nuestro caso, lo cual rompe con los supuestos de las distribuciones ideales.
Teniendo en cuenta que el Q-Q plot compara los cuantiles teóricos de una distribución propuesta con los cuantiles observados en los datos, si los datos siguen dicha distribución, los puntos se alinean aproximadamente sobre la diagonal, por lo que sí hay puntos alineados significa una buena concordancia con la distribución, por el contrario si hay una curvatura o desviación significa una mala concordancia y por último si hay colas desviadas sugiere que hay outliers o distribución más pesada o asimétrica.
Desempleo femenino
Para esta variable el Q-Q plot muestra ligeras desviaciones en las colas, donde los puntos del extremo inferior y superior se alejan de la línea y un centro más ajustado. Por lo que si bien la beta parecía adecuada por estar acotada entre 0 y 1, el Q-Q plot evidencia que no se ajusta bien en los extremos, ya que probablemente hay municipios con tasas de desempleo muy altas o muy bajas que distorsionan el patrón esperado.
Casos de violencia 2024 y 2023
Para esta variable el Q-Q plot muestra una gran dispersión en la parte superior derecha y una curvatura en la cola superior (cola pesada). Este comportamiento en los extremos sugiere que hay valores atípicos o municipios con poblaciones desproporcionadamente altas, que rompen la forma teórica Gamma, que aunque parecía moldear bien no está captando correctamente la magnitud de estos casos extremos.
Llamadas a la línea 155 - 2024 y 2023
Para esta variable el Q-Q plot muestra un comportamiento similar a los casos de violencia, es decir una cola derecha muy dispersa, con un centro más ajustado pero aún con desviaciones, lo que permite establecer que el número de llamadas presenta una variabilidad muy alta y valores extremos que afectan el ajuste gamma y el Q-Q plot sugiere que sólo los valores intermedios siguen algo la distribución teórica (los extremos se escapan del modelo).
Denuncias formales 2024 y 2023
Para esta variable el Q-Q plot muestra muchos puntos por debajo de la diagonal en los extremos y colas muy pesadas, lo que refleja que la mayoría de municipios tienen muy pocas denuncias, y unos pocos tienen números muy altos que la distribución gamma no logra modelar adecuadamente.
Habitantes y Mujeres Habitantes
Para esta variable el Q-Q plot muestra una curvatura clara hacia arriba en los cuantiles superiores, lo que indica que los datos tienen una cola más pesada de lo que la gamma puede modelar. La concentración de población en pocos municipios como Soacha, Mosquera o Facatativá genera outliers demográficos y el Q-Q plot deja claro que la Gamma subestima la magnitud de estos extremos.
En conclusión, los Q-Q plots permiten visualizar que, aunque se intentó ajustar distribuciones como Beta o Gamma a las variables, existen desviaciones sistemáticas, especialmente en los extremos (colas), que impiden considerar un buen ajuste estadístico. Esto indica que modelos más flexibles o más especializados para casos particulares, serían más adecuados para representar la complejidad del fenómeno.
Este proyecto permitió evidenciar cómo la violencia de género en Cundinamarca se manifiesta de forma desigual entre municipios, con mayores registros en zonas urbanas debido a una mayor visibilidad y acceso a mecanismos de denuncia, y cifras más bajas en regiones donde persisten barreras institucionales, sociales y geográficas que dificultan el reporte.
El análisis estadístico y probabilístico reveló que, aunque algunas variables parecían ajustarse visualmente a distribuciones teóricas como la gamma o la beta, las pruebas estadísticas (K-S test y Q-Q plots) mostraron que ninguna se ajusta de manera adecuada. Esto se debe a la alta asimetría, presencia de valores extremos y dispersión en los datos, lo cual resalta la necesidad de emplear modelos más flexibles y específicos en estudios futuros. El enfoque metodológico utilizado, que combinó herramientas descriptivas y pruebas de ajuste, fue clave para contrastar intuiciones iniciales y descubrir patrones menos evidentes.
Este trabajo confirma que la violencia de género está profundamente ligada a desigualdades estructurales que se expresan de forma distinta según el contexto local, y que su análisis requiere tanto una mirada territorial como un enfoque estadístico riguroso. Aunque el estudio ofrece hallazgos relevantes, se reconocen limitaciones derivadas del nivel técnico alcanzado en el curso y de la calidad y cobertura de los datos disponibles.
Frente a esta evidencia, es necesario que las estrategias institucionales de atención y prevención se adapten a las realidades particulares de cada municipio, con especial énfasis en aquellos más invisibilizados, para garantizar respuestas más equitativas, accesibles y eficaces.