Índice

Primera entrega

Segunda Entrega

Planteamiento del problema

En Colombia, la violencia de género sigue siendo una problemática persistente que se da especialmente en contextos locales donde el acceso a la justicia y los mecanismos de protección son limitados o ineficientes. El departamento de Cundinamarca, a pesar de su cercanía a la capital del país, evidencia un número preocupante de casos de violencia física, sexual, psicológica y económica basadas en género en sus municipios.

Objetivos

Objetivo general

Analizar las condiciones socioeconómicas, institucionales y geográficas asociadas a la incidencia de la violencia de género en los municipios del departamento, con base en datos correspondientes a los años 2023 y 2024.

Objetivo específico

  • Analizar cómo se distribuyen los casos por región, zona y estrato.
  • Evaluar la relación entre la violencia de género y variables socioeconómicas, como el nivel educativo promedio y la tasa de desempleo femenino.
  • Comparar la evolución de los casos de violencia de género entre los años 2023 y 2024, identificando aumentos, disminuciones o estancamientos por municipio.
  • Analizar el acceso a mecanismos institucionales de atención, como la presencia de comisarías y rutas de atención integral y su posible vínvulo con la cantidad de denuncias formales y llamadas a la línea 155.
  • Establecer zonas de mayor concentración relativa de casos.
library(readxl)
TABLA_DE_DATOS_violencia_de_genero <- read_excel("TABLA DE DATOS. violencia de genero.xlsx", col_types = c("text", "text", "text", "text", "numeric", "text", "text", "text", "text", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric", "numeric"))
colnames(TABLA_DE_DATOS_violencia_de_genero)=c("Municipio","Región","Zona","Estratoprom","Desempleo","NEducativo", "AJusticia", "PUP", "PRAI", "Casos2024", "Casos2023", "Llamadas2024", "Llamadas2023", "Denuncias2024", "Denuncias2023", "Habitantes", "MujeresHab")
print(TABLA_DE_DATOS_violencia_de_genero, n=Inf, width = Inf)
## # A tibble: 60 × 17
##    Municipio           Región         Zona   Estratoprom Desempleo NEducativo
##    <chr>               <chr>          <chr>  <chr>           <dbl> <chr>     
##  1 Agua de Dios        Sabana         Rural  2.0             0.179 Media     
##  2 Albán               Ubaté          Urbana 3.0             0.12  Alta      
##  3 Anapoima            Tequendama     Rural  1.0             0.172 Baja      
##  4 Anolaima            Rionegro       Urbana 2.0             0.105 Alta      
##  5 Apulo               Oriente        Urbana 2.0             0.139 Media     
##  6 Arbeláez            Rionegro       Rural  3.0             0.164 Media     
##  7 Beltrán             Oriente        Rural  3.0             0.112 Baja      
##  8 Bituima             Tequendama     Rural  3.0             0.16  Alta      
##  9 Bojacá              Tequendama     Urbana 2.0             0.102 Baja      
## 10 Cabrera             Alto Magdalena Rural  1.0             0.139 Baja      
## 11 Cachipay            Tequendama     Rural  3.0             0.156 Alta      
## 12 Cajicá              Guavio         Rural  3.0             0.113 Alta      
## 13 Caparrapí           Sumapaz        Rural  2.0             0.164 Baja      
## 14 Caqueza             Oriente        Urbana 4.0             0.082 Media     
## 15 Carmen de Carupa    Oriente        Rural  1.0             0.175 Media     
## 16 Chaguaní            Tequendama     Urbana 4.0             0.137 Baja      
## 17 Chía                Sabana         Urbana 4.0             0.106 Alta      
## 18 Chipaque            Ubaté          Rural  1.0             0.147 Alta      
## 19 Choachí             Alto Magdalena Urbana 2.0             0.09  Baja      
## 20 Chocontá            Sumapaz        Rural  2.0             0.144 Alta      
## 21 Cogua               Oriente        Rural  4.0             0.171 Alta      
## 22 Cota                Guavio         Rural  4.0             0.118 Baja      
## 23 Cucunubá            Guavio         Rural  2.0             0.147 Baja      
## 24 El Colegio          Oriente        Rural  4.0             0.138 Alta      
## 25 El Peñón            Ubaté          Rural  4.0             0.147 Alta      
## 26 El Rosal            Oriente        Urbana 2.0             0.095 Baja      
## 27 Facatativá          Alto Magdalena Rural  4.0             0.128 Alta      
## 28 Fómeque             Guavio         Urbana 1.0             0.107 Baja      
## 29 Fosca               Guavio         Rural  2.0             0.178 Alta      
## 30 Funza               Alto Magdalena Urbana 1.0             0.107 Alta      
## 31 Fúquene             Tequendama     Rural  2.0             0.109 Media     
## 32 Fusagasugá          Ubaté          Urbana 3.0             0.095 Baja      
## 33 Gachalá             Guavio         Rural  1.0             0.14  Baja      
## 34 Gachancipá          Sabana         Rural  3.0             0.158 Media     
## 35 Gachetá             Guavio         Urbana 2.0             0.137 Baja      
## 36 Gama                Alto Magdalena Urbana 1.0             0.134 Alta      
## 37 Girardot            Sumapaz        Rural  1.0             0.111 Alta      
## 38 Granada             Guavio         Urbana 1.0             0.107 Alta      
## 39 Guachetá            Sumapaz        Rural  4.0             0.171 Media     
## 40 Guaduas             Guavio         Urbana 4.0             0.124 Media     
## 41 Guasca              Guavio         Urbana 1.0             0.081 Media     
## 42 Guataquí            Alto Magdalena Urbana 3.0             0.125 Baja      
## 43 Guatavita           Tequendama     Rural  4.0             0.104 Baja      
## 44 Guayabal de Síquima Rionegro       Rural  2.0             0.152 Media     
## 45 Guayabetal          Sabana         Urbana 4.0             0.101 Media     
## 46 Gutiérrez           Tequendama     Rural  4.0             0.105 Baja      
## 47 Jerusalén           Alto Magdalena Urbana 1.0             0.102 Alta      
## 48 Junín               Oriente        Urbana 4.0             0.113 Alta      
## 49 La Calera           Ubaté          Urbana 2.0             0.086 Baja      
## 50 La Mesa             Ubaté          Rural  1.0             0.16  Baja      
## 51 La Palma            Guavio         Rural  2.0             0.15  Baja      
## 52 La Peña             Rionegro       Urbana 3.0             0.086 Alta      
## 53 La Vega             Sabana         Rural  2.0             0.178 Media     
## 54 Lenguazaque         Oriente        Urbana 1.0             0.094 Media     
## 55 Machetá             Ubaté          Urbana 2.0             0.083 Media     
## 56 Madrid              Ubaté          Urbana 3.0             0.084 Alta      
## 57 Manta               Tequendama     Rural  3.0             0.114 Media     
## 58 Medina              Alto Magdalena Urbana 3.0             0.093 Media     
## 59 Mosquera            Ubaté          Rural  1.0             0.124 Media     
## 60 Nariño              Ubaté          Rural  3.0             0.171 Baja      
##    AJusticia PUP   PRAI  Casos2024 Casos2023 Llamadas2024 Llamadas2023
##    <chr>     <chr> <chr>     <dbl>     <dbl>        <dbl>        <dbl>
##  1 Baja      Sí    No         1308      1242         1400         1290
##  2 Media     Sí    Sí          624       593          614          482
##  3 Alta      No    Sí         1539      1462         1650         1530
##  4 Baja      No    No          546       519          705          596
##  5 Baja      No    Sí          637       605          730          613
##  6 Media     No    No          923       877         1005          882
##  7 Media     Sí    Sí          114       108           97           88
##  8 Media     No    No          236       224          215          187
##  9 Alta      Sí    Sí         1184       717          820          741
## 10 Media     Sí    No          414       398          445          395
## 11 Alta      No    No          949       578          665          586
## 12 Baja      Sí    No          421       400          315          275
## 13 Alta      Sí    Sí         1305      1236         1310         1200
## 14 Baja      Sí    Sí          567       538          635          572
## 15 Baja      No    No          789       407          500          430
## 16 Baja      No    No          314       205          230          197
## 17 Baja      Sí    Sí        12786      7172         7890         7072
## 18 Baja      Sí    Sí          603       541          640          555
## 19 Baja      No    Sí         1012       654          765          695
## 20 Media     Sí    No         1520       981         1170         1078
## 21 Alta      No    Sí         2061      1131         1330         1225
## 22 Media     No    No         2059      1657         1850         1730
## 23 Media     No    Sí          568       456          520          469
## 24 Alta      No    Sí         1897      1181         1320         1235
## 25 Baja      No    No          422       396          430          392
## 26 Media     Sí    Sí         1360      1010         1150         1065
## 27 Baja      Sí    No        15549      8267         9275         8700
## 28 Media     Sí    No          724       573          670          605
## 29 Alta      No    No          367       326          370          328
## 30 Alta      No    Sí        10299      5456         6130         5690
## 31 Alta      No    Sí          644       571          648          590
## 32 Baja      Sí    Sí         8892      7767         8640         7992
## 33 Baja      No    No          153       153          155          144
## 34 Alta      No    No         1143      1166         1340         1206
## 35 Alta      No    Sí          729       827          920          870
## 36 Media     No    Sí          209       149          148          133
## 37 Alta      Sí    No         6058      5227         5530         5116
## 38 Media     No    Sí         2146      1423         1520         1423
## 39 Baja      Sí    Sí          847       591          670          601
## 40 Baja      Sí    Sí         2310      2302         2450         2300
## 41 Baja      Sí    No         1479       818          890          814
## 42 Baja      No    No          248       182          210          181
## 43 Baja      No    Sí          488       489          540          495
## 44 Baja      No    Sí          109        99          101           92
## 45 Baja      Sí    Sí          203       152          160          139
## 46 Media     Sí    No          123       139          140          124
## 47 Media     No    Sí          126       123          120          108
## 48 Media     Sí    Sí          510       427          468          420
## 49 Baja      No    Sí         2770      1592         1750         1610
## 50 Media     No    Sí         2484      1493         1680         1525
## 51 Alta      Sí    Sí          363       366          410          365
## 52 Alta      No    Sí          437       298          330          294
## 53 Alta      Sí    No         1363       838          920          841
## 54 Baja      Sí    Sí          719       540          570          512
## 55 Baja      Sí    No          303       330          365          321
## 56 Media     No    No        12383      6505         7050         6440
## 57 Media     Sí    No          144       163          175          157
## 58 Baja      Sí    Sí          199       218          245          211
## 59 Media     Sí    No        12617      7056         7520         7000
## 60 Media     No    Sí          409       216          239          206
##    Denuncias2024 Denuncias2023 Habitantes MujeresHab
##            <dbl>         <dbl>      <dbl>      <dbl>
##  1           120           109      14082       7307
##  2            42            38       7349       5203
##  3           173           157      17713       8946
##  4           100            91      10389       5203
##  5            70            64       9159       4583
##  6           113           103      11257       5626
##  7            63            57       2047       1019
##  8           116           105       2957       1476
##  9           147           134      14829       7403
## 10            44            40       6036       3015
## 11           106            96      12166       6081
## 12           176           162      74787       3727
## 13           106            96      15929       7956
## 14           381           346      13833       6906
## 15            73            66       9016       4504
## 16            39            35       4551       2275
## 17          7249          6590     151393      75495
## 18            64            58      11398       5694
## 19           154           140      13789       6884
## 20           178           162      20719      10338
## 21           211           192      24141      12059
## 22          1291          1174      34934      17439
## 23            87            79       9635       4812
## 24           217           197      25838      12903
## 25           114           104       5748       2871
## 26          2136          1942      21274      10627
## 27         10211          9283     175589      87492
## 28           107            97      12076       6035
## 29           194           176       6861       3426
## 30          5476          4980     114885      57328
## 31           112           102      12027       6012
## 32          6135          5580     163789      81761
## 33            65            59       3213       1606
## 34            97            88      16395       8186
## 35           461           419      12103       6045
## 36            72            65       3132       1566
## 37          3742          3402     109348      55028
## 38          1078           980      27188      13578
## 39           110           100      12379       6180
## 40          1453          1321      34473      17218
## 41           215           195      17241       8611
## 42            86            78       4508       2251
## 43           169           154       7828       3910
## 44            33            30       2088       1043
## 45            75            68       3193       1596
## 46            64            58       2923       1460
## 47            52            47       2471       1234
## 48           260           236       9055       4524
## 49           952           865      34684      17314
## 50           968           880      33149      16558
## 51           144           131       8511       4252
## 52           171           155       6608       3301
## 53           472           429      18688       9335
## 54           329           299      11988       5988
## 55           171           155       7309       3650
## 56          6911          6283     144989      72399
## 57            58            53       3441       1720
## 58           136           124       4787       2391
## 59          7762          6421     148848      74270
## 60           113           103       4785       2390

Características de la Tabla de Datos

Tamaño

Filas: 17 Columnas: 61

Cobertura geográfica

Departamento de Cundinamarca, con énfasis en los siguientes municipios: Agua de Dios, Albán, Anapoima, Anolaima, Apulo, Arbeláez, Beltrán, Bituima, Bojacá, Cabrera, Cachipay, Cajicá, Caparrapí, Cáqueza, Carmen de Carupa, Chaguaní, Chía, Chipaque, Choachí, Chocontá, Cogua, Cota, Cucunubá, El Colegio, El Peñón, El Rosal, Facatativá, Fómeque, Fosca, Funza, Fúquene, Fusagasugá, Gachalá, Gachancipá, Gachetá, Gama, Girardot, Granada, Guachetá, Guaduas, Guasca, Guataquí, Guatavita, Guayabal de Síquima, Guayabetal, Gutiérrez, Jerusalén, Junín, La Calera, La Mesa, La Palma, La Peña, La Vega, Lenguazaque, Machetá, Madrid, Manta, Medina, Mosquera, Nariño.

Medidas de resumen univariadas, tendencia central y su variabilidad

Estadística descriptiva de la variable: Tasa de desempleo femenino.

Porcentaje de mujeres desempleadas en los municipios de cundinamarca.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo),var(TABLA_DE_DATOS_violencia_de_genero$Desempleo),sd(TABLA_DE_DATOS_violencia_de_genero$Desempleo),100*sd(TABLA_DE_DATOS_violencia_de_genero$Desempleo)/mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo),median(TABLA_DE_DATOS_violencia_de_genero$Desempleo),100*mad(TABLA_DE_DATOS_violencia_de_genero$Desempleo),mad(TABLA_DE_DATOS_violencia_de_genero$Desempleo)/median(TABLA_DE_DATOS_violencia_de_genero$Desempleo)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               1.272333e-01
## Varianza                               8.773006e-04
## Desv_estandar                          2.961926e-02
## cve_media                              2.327948e+01
## Mediana                                1.240000e-01
## MAD                                    3.409980e+00
## cve_mediana                            2.749984e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0810  0.1047  0.1240  0.1272  0.1505  0.1790

La tasa de desempleo femenino promedio en los municipios de Cundinamarca es de aproximadamente 12.7%, con una mediana cercana 12.4%, esto indica que se podría sugerir una distribución bastante simétrica, sin embargo, la alta desviación estándar 2.96% y un coeficiente de variación superior al 20% son reflejo de una fuerte y marcada desigualdad territorial en el acceso al empleo para las mujeres; esta disparidad, también puede ser consecuencia de una desviación absoluta mediana robusta (MAD 3.41%) lo que sugiere que en algunos municipios las mujeres enfrentan mayores barreras económicas y sociales esto puede limitar su autonomía y aumenta su vulnerabilidad frente a situaciones de violencia de género. El primer cuartil indica que el 25% de los municipios tienen tasas de desempleo iguales o inferiores al 10.47%, lo que representa territorios con menor presión laboral dentro del grupo analizado y socialmente se puede decir que estas zonas pueden ofrecer más oportunidades económicas. Por último el tecer cuartil indica que este 25% de los municipios presentan tasas mayores al 15.05%, lo cual es bastante elevado y significa que estas zonas enfrentan una crisis laboral más aguda para las mujeres.

Estadística descriptiva de la variable: Casos 2024

Casos de violencia de género reportados en Cundinamarca durante el año 2024.

media_c=mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
varianza_c=var(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
sd_c=sd(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
#calcular cve
cve_media_c=100*sd_c/media_c
medianaC=median(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
MAD_c=mad(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
cve_mediana_c=100*MAD_c/medianaC
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024),var(TABLA_DE_DATOS_violencia_de_genero$Casos2024),sd(TABLA_DE_DATOS_violencia_de_genero$Casos2024),100*sd(TABLA_DE_DATOS_violencia_de_genero$Casos2024)/mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024),median(TABLA_DE_DATOS_violencia_de_genero$Casos2024),100*mad(TABLA_DE_DATOS_violencia_de_genero$Casos2024),mad(TABLA_DE_DATOS_violencia_de_genero$Casos2024)/median(TABLA_DE_DATOS_violencia_de_genero$Casos2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               2.061750e+03
## Varianza                               1.266985e+07
## Desv_estandar                          3.559473e+03
## cve_media                              1.726433e+02
## Mediana                                7.215000e+02
## MAD                                    7.398174e+04
## cve_mediana                            1.025388e+00
summary(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   109.0   398.5   721.5  2061.8  1524.8 15549.0

Los datos sobre violencia de género en 2024 revelan una alarmante desigualdad en la distribución de los casos, pues por un lado la media es mucho mayor que la mediana, lo que indica que hay valores extremos elevando el promedio, así mismo la alta desviación estándar y el alto CVE de la media refuerzan esta idea de gran dispersión que puede deberse a que dentro de los municipios analizados hay unos pocos que tienen un numero de de población mucho mas alto comparado con municipios pequeños. Sin embargo, el CVE de la mediana es bajo, lo que sugiere que la mayoría de los valores están relativamente cerca entre sí, pero existen algunos valores extremadamente altos que distorsionan la media. El primer cuartil establece que el primer 25% de los municipios tuvieron menos de 398.5 casos, lo que puede reflejar baja ocurrencia real. Y el tercer cuartil significa que el 25% superior de los municipios tuvo más de 1524.8 casos, lo que indica una alta concentración de la violencia de género en una parte específica de los territorios.

Estadística descriptiva de la variable: Casos 2023

Casos de violencia de género reportados en Cundinamarca durante el año 2023.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023),var(TABLA_DE_DATOS_violencia_de_genero$Casos2023),sd(TABLA_DE_DATOS_violencia_de_genero$Casos2023),100*sd(TABLA_DE_DATOS_violencia_de_genero$Casos2023)/mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023),median(TABLA_DE_DATOS_violencia_de_genero$Casos2023),100*mad(TABLA_DE_DATOS_violencia_de_genero$Casos2023),mad(TABLA_DE_DATOS_violencia_de_genero$Casos2023)/median(TABLA_DE_DATOS_violencia_de_genero$Casos2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               1.368833e+03
## Varianza                               4.270798e+06
## Desv_estandar                          2.066591e+03
## cve_media                              1.509746e+02
## Mediana                                5.755000e+02
## MAD                                    5.411490e+04
## cve_mediana                            9.403110e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    99.0   329.0   575.5  1368.8  1194.8  8267.0

Estos resultados para el año 2023 permiten establecer una distribución desigual, por un lado tenemos una media de 1,368.83 casos y una mediana considerablemente menor 575.5, lo que denota una concentración de casos en ciertas regiones que elevan el promedio general. Adicionalmente la alta desviación estándar y el coeficiente de variación de la media 150.97% también reflejan una marcada dispersión en los datos, reiterando que aunque en muchas zonas los casos pueden ser relativamente bajos, existen contextos donde la violencia se presenta con una intensidad muy grande atendiendo también a que hay un mayor numero de habitantes, esta situación también evidenciada por una MAD elevada, lo que permite decir que hay una necesidad de una intervención social urgente y focalizada. Por último el primer cuartil indica que el primer 25% representa bajas ocurrencias y el tercer cuartil indica que el 25% superior de los municipios reportó más de 1194.8 casos, lo que significa una mayor concentración de la violencia en ciertos territorios.

Estadística descriptiva de la variable: Llamadas a la línea 155 en 2024

Llamadas presentadas a la línea 155 en el año 2024.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),100*sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)/mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),100*mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)/median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                                  1512.5000
## Varianza                               5146261.1695
## Desv_estandar                             2268.5372
## cve_media                                  149.9859
## Mediana                                    667.5000
## MAD                                      65975.7000
## cve_mediana                                  0.9884
summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    97.0   356.2   667.5  1512.5  1332.5  9275.0

Para el año 2024 las llamadas a la línea de emergencia 155 reflejan un patrón similar al de los casos reportados de violencia para el mismo año. Se presenta una media de 1,512.5 llamadas y una mediana de 667.5, lo que permite establecer que la mayoría de las zonas tienen una frecuencia moderada de reportes, pero hay municipios con un volumen significativamente mayor por su diferencia en cuanto a tamaño y cantidad de población, lo que causa que se eleve la media; consecuentemente la alta dispersión y variabilidad que se manifiesta en la desviación estándar y el coeficiente de variación, sugieren que el hecho de pedir ayuda a través de una línea telefónica es muy desigual. Esto podría responder a la falta de promoción para el conocimiento de estas líneas o la carencia de medios para el acceso a las mismas. Por último el primer cuartil indica que el 25% de los municipios reportaron menos de 356 llamadas, lo que determina que en muchas zonas la denuncia telefónica es poco frecuente, y el tercer cuartil especifíca que solo el 25% de los municipios supera las 1336 llamadas, mostrando que unos pocos concentran la mayoría de llamadas.

Estadística descriptiva de la variable: Llamadas a la línea 155 en 2023

Llamadas presentadas a la línea 155 en el año 2023.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),var(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),100*sd(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)/mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),100*mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),mad(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)/median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               1.385550e+03
## Varianza                               4.407421e+06
## Desv_estandar                          2.099386e+03
## cve_media                              1.515200e+02
## Mediana                                5.930000e+02
## MAD                                    5.945226e+04
## cve_mediana                            1.002568e+00
summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    88.0   314.2   593.0  1385.5  1227.5  8700.0

Las llamadas a la línea de emergencia 155 en el año 2023 presentan un promedio de aproximadamente 1.386 reportes y una mediana de 593, lo que indica que aunque la mayoría de las regiones mantienen un nivel moderado de denuncias, existen zonas con volúmenes de llamadas mucho mayores que elevan el promedio. La alta variabilidad y dispersión reflejadas en la desviación estándar y coeficientes de variación pueden dejar en evidencia la carencia de accesibilidad a estas líneas o desconocimiento de su funcionalidad. Estos datos evidencian la necesidad de reforzar las estrategias de difusión y atención en las zonas mas afectadas.El primer cuartil determina que en muchas zonas la denuncia telefónica es poco frecuente, y el tercer cuartil especifíca que este 25% concentra la mayoría de llamadas, puede explicarse por la cantidad de población o el conocimiento y acceso a este tipo de servicios.

Estadística descriptiva de la variable: Denuncias formales en 2024

Denuncias formales realizadas por las victimas en el 2024.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),100*sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)/mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),100*mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)/median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               1.033733e+03
## Varianza                               5.001442e+06
## Desv_estandar                          2.236390e+03
## cve_media                              2.163411e+02
## Mediana                                1.455000e+02
## MAD                                    1.082298e+04
## cve_mediana                            7.438474e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##    33.00    86.75   145.50  1033.73   401.00 10211.00

Durante 2024 se presentaron denuncias formales por violencia de género en estos municipios de cundinamarca, los cuales luego de la estadística descriptiva reflejan una marcada desigualdad en su distribución, teniendo un promedio de 1033 denuncias, pero una mediana considerablemente menor 145.5, lo que significa que en la mayoría de los contextos y zonas el número de denuncias es reducido, la varianza también resumen esta situación, pues al ser muy alta, implica que algunas regiones presentan cifras de denuncias extraordinariamente altas, mientras que muchas otras presentan números muy bajos, resultado del tamaño del municipio, lo cual eleva el promedio general. Adicional a esto la alta desviación estándar y un coeficiente de variación de la media que es superior al 200% deja en evidencia una fuerte dispersión, lo que sugiere la presencia de factores sociales o estructurales que influyen en decisión de denunciar. Esta situación revela profundas brechas sociales y territoriales.Por últimi el primer cuartil indica que en una cuarta parte de los territorios analizados el nivel de judicialización por violencia de género es muy relativamente bajo y el tercer cualtil nos menciona que el 75% de los municipios tuve menos de 401 denuncias,lo cual es muy bajo en comparación con la cantidad de casos de violencia de género y que solo el 25% tuvo un número de denuncias mayor a este, estos municipios concentran la mayor cantidad de las mismas.

Estadística descriptiva de la variable: Denuncias formales en 2023

Denuncias formales realizadas por las victimas en el 2023.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),var(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),100*sd(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)/mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),100*mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),mad(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)/median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               9.292167e+02
## Varianza                               4.009315e+06
## Desv_estandar                          2.002327e+03
## cve_media                              2.154855e+02
## Mediana                                1.325000e+02
## MAD                                    9.933420e+03
## cve_mediana                            7.496921e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   30.00   78.75  132.50  929.22  364.25 9283.00

Las denuncias formales realizadas en el año 2023 por violencia de género presentaron una media de 929 casos, pero una mediana mucho menor 132.5, lo que nos indica que la mayoría de los municipios reportaron cifras bajas en cuanto a denuncias, mientras que unas pocas concentraron niveles significativamente altos atendiendo a que la su población es mucho mas grande, sus casos de violencia son más y consecuentemente las denuncias se elevan. Por otro lado, la varianza 4009,315 es muy elevada y junto a la desviación estándar (2,002) reflejan una marcada dispersión en los datos, lo que sugiere desigualdades estructurales en cuanto al acceso a la justicia, esta tendencia se refuerza con el coeficiente de variación de la media de más del 215%. El hecho de que tanto en 2023 como en 2024 las denuncias formales tengan una mediana muy baja en relación con la media establece que en efecto las víctimas se pueden enfrentar a barreras sociales para denunciar. Los cuartiles revelan importantes desigualdades territoriales en los municipios analizados en cuanto a la judicialización de la violencia de género.

Estadística descriptiva de la variable: Habitantes 2024

Habitantes de los municipios de Cundinamarca.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes),var(TABLA_DE_DATOS_violencia_de_genero$Habitantes),sd(TABLA_DE_DATOS_violencia_de_genero$Habitantes),100*sd(TABLA_DE_DATOS_violencia_de_genero$Habitantes)/mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes),median(TABLA_DE_DATOS_violencia_de_genero$Habitantes),100*mad(TABLA_DE_DATOS_violencia_de_genero$Habitantes),mad(TABLA_DE_DATOS_violencia_de_genero$Habitantes)/median(TABLA_DE_DATOS_violencia_de_genero$Habitantes)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               2.875868e+04
## Varianza                               1.981254e+09
## Desv_estandar                          4.451127e+04
## cve_media                              1.547751e+02
## Mediana                                1.205150e+04
## MAD                                    1.030481e+06
## cve_mediana                            8.550646e-01
summary(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2047    6465   12052   28759   21991  175589

La población promedio por municipio en Cundinamarca fue aproximadamente de 28,758 habitantes y la mediana de 12,051 mucho menor, lo que indica que la mayoría de los municipios tienen poblaciones pequeñas y unos pocos son mucho más poblados, lo cuales elevan el promedio comportándose como datos atípicos; por su lado la alta varianza y la desviación estándar, reflejan una desigualdad significativa en la distribución demográfica del departamento, esto se traduce en un coeficiente de variación significativamente alto 154.77%. El primer cuartil representa zonas pequeñas con un número de habitantes no tan elevado y por el contrario el tercer cuartil indica que solo un 25% de los municipios contienen casi el triple del primer cuarto de la población estando todos por encima de los 21.000 habitantes, una cantidad considerable.

Estadística descriptiva de la variable: Mujeres habitantes

Mujeres habitantes de los municipios de Cundinamarca.

media_col=mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
varianza_col=var(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
sd_col=sd(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
MAD_col=mad(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),var(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),sd(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),100*sd(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)/mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),100*mad(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),mad(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)/median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               1.383350e+04
## Varianza                               4.857453e+08
## Desv_estandar                          2.203963e+04
## cve_media                              1.593207e+02
## Mediana                                6.000000e+03
## MAD                                    4.791763e+05
## cve_mediana                            7.986272e-01
summary(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1019    3230    6000   13834   10410   87492

La población femenina promedio por municipio en Cundinamarca fue de 13833 mujeres y la mediana de 6000, lo que revela que más de la mitad de los municipios tienen una población femenina inferior al promedio, esto podría suponer una fuerte concentración en unos pocos municipios de gran tamaño; esta desigualdad se afianza por una varianza alta de 485 millones y una desviación estándar de más de 22000, lo que significa la existencia de una gran dispersión en la distribución de mujeres entre municipios, así mismo el coeficiente de variación de la media también muestra una heterogeneidad significativa. En consideraciones sociales, esta estructura poblacional fomenta las desigualdades y las cifras refuerzan la necesidad de enfocar esfuerzos territorializados. Los cuartiles permiten determinar que los datos aquí analizados reflejan una alta concentración de la población femenina en un número reducido de municipios, mientras que la mayoría de los territorios tiene poblaciones femeninas más pequeñas. Esta desigualdad poblacional impacta directamente las condiciones sociales a las que se someten las mujeres y tambien nos da un panorama del porque la gran varianza de los datos estadísticos antes analizados.

Gráficos estadísticos

Diagramas de barras

table(TABLA_DE_DATOS_violencia_de_genero$Región)
## 
## Alto Magdalena         Guavio        Oriente       Rionegro         Sabana 
##              8             11              9              4              5 
##        Sumapaz     Tequendama          Ubaté 
##              4              9             10
barplot(table(TABLA_DE_DATOS_violencia_de_genero$Región),col="pink4", main="Frecuencias de la variable Región", las=2)

La gráfica representa el número de municipios que pertenecen a cada una de las regiones de Cundinamarca según el conjunto de datos que se están analizando en la tabla, por lo que es importante mencionar que la no uniformidad de esta distribución se puede deber se han registrado datos de municipios al azar, más no porque sean la totalidad de municipios para cada región. La región de Guavio es la que más municipios contiene en la muestra con más de 10 zonas mencionadas, le siguen Ubaté, Oriente e Almeidas y Tequendama, todas con una presencia mayor a ocho municipios en el conjunto de datos. Y las regiones de Rionegro y Sumapaz tienen la menor representación. Las regiones con más municipios representados pueden estar más visibilizadas en los datos, pero no necesariamente son las más afectadas.

table(TABLA_DE_DATOS_violencia_de_genero$Zona)
## 
##  Rural Urbana 
##     33     27
barplot(table(TABLA_DE_DATOS_violencia_de_genero$Zona),col="pink3", main="Frecuencias de la variable Zona")

Esta gráfica muestra la cantidad de municipios clasificados como zona rural o zona urbana dentro del conjunto de datos de nuestra tabla. Se observa que la mayoría corresponde a zonas rurales representado en más de 30 municipios, mientras que las zonas urbanas tienen una menor frecuencia, siendo alrededor de 27 para esta muestra. Aunque la diferencia no es enorme, es suficiente para notar que el análisis tiene un mayor peso en contextos rurales y sugerir que estas zonas pueden tener mayores barreras socioculturales para que las víctimas denuncien o busquen ayuda.

table(TABLA_DE_DATOS_violencia_de_genero$Estratoprom)
## 
## 1.0 2.0 3.0 4.0 
##  15  17  14  14
barplot(table(TABLA_DE_DATOS_violencia_de_genero$Estratoprom),col="pink2", main="Frecuencias de la variable Estrato socioeconómico")

Esta gráfica representa la cantidad de datos clasificados según el estrato socioeconómico (del 1 al 4) más común en cada municipio de cundinamarca considerados en esta muestra. El estrato 2 es el más frecuente, con alrededor 17 registros, le siguen los estratos 1, 3 y 4, con frecuencias bastante similares rondando entre 13 y 15 registros cada uno. Al no haber datos para los estratos 5 y 6 se puede determinar que la muestra se concentrada en niveles socioeconómicos bajos y medios-bajos, lo cual es coherente con la realidad de muchos municipios de Cundinamarca.

Diagramas circulares

tabla_frecuencias <- table(TABLA_DE_DATOS_violencia_de_genero$NEducativo)
leyenda <- c("Media","Alta","Baja") 
colores_personalizados <- c("pink", "pink2", "pink4") 
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main="Nivel educativo promedio", col = colores_personalizados) 
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)

Este diagrama representa la distribución del nivel educativo promedio en los municipios analizados, categorizado en tres niveles: Alta (35%), Media (33%) y Baja (35%). El gráfico muestra una distribución que sugiere un sistema polarizado, donde 2 de cada 3 municipios (sumando “Baja” y “Media”) no alcanzan estándares óptimos, revelando desigualdades estructurales. La cercanía entre los porcentajes indica que pequeñas intervenciones podrían inclinar la balanza y mejorar la calidad en los municipios categorizados en “Media” mediante capacitación docente o infraestructura.

tabla_frecuencias <- table(TABLA_DE_DATOS_violencia_de_genero$AJusticia)
leyenda <- c("Media", "Alta", "Baja") 
colores_personalizados <- c("pink", "pink2", "pink4")
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main = "Acceso a la justicia", col = colores_personalizados)
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)

Este diagrama circular muestra la distribución del acceso a la justicia en los municipios analizados, clasificado en tres niveles:

  • Baja (42%): Municipios con menor acceso a servicios judiciales.
  • Media (33%): Municipios con acceso intermedio.
  • Alta (25%): Municipios con mejor acceso a la justicia.

La predominancia del acceso a la justicia “Baja” en los municipios analizados agrava la situación de violencia de género en Cundinamarca, ya que limita la capacidad de las víctimas para denunciar, acceder a protección legal o recibir reparación. El 25% de municipios con acceso a la justicia (probablemente urbanos) refleja una desigualdad territorial que incrementa los casos y sugiere la implementación de políticas que prioricen la infraestructura judicial en zonas vulnerables, junto con campañas de sensibilización y capacitación a funcionarios, para romper el círculo entre acceso limitado a la justicia.

Diagrama de tallo y hojas

Casos 2024

casos_log <- log10(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
stem(casos_log)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##   20 | 469068
##   22 | 01279
##   24 | 8066
##   26 | 12234914558
##   28 | 0016660378
##   30 | 1672233789
##   32 | 81136
##   34 | 04
##   36 | 8
##   38 | 5
##   40 | 19019

Casos 2023

casos_log1 <- log10(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
stem(casos_log1)
## 
##   The decimal point is 1 digit(s) to the left of the |
## 
##   18 | 
##   20 | 0394788
##   22 | 161345
##   24 | 7126
##   26 | 00013692333666778
##   28 | 2612249
##   30 | 057799567
##   32 | 026
##   34 | 
##   36 | 24
##   38 | 15692

Diagrama de Caja

boxplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,TABLA_DE_DATOS_violencia_de_genero$Llamadas2023, names = c("2024", "2023"), main = "Distribución de llamadas a la línea 155",col = c("pink", "pink3"))
stripchart(list(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, TABLA_DE_DATOS_violencia_de_genero$Llamadas2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"),  vertical = TRUE)

El diagrama de cajas comparativo revela una distribución similar en la cantidad de llamadas a la línea 155 entre los años 2024 y 2023 en Cundinamarca. Para ambos años, la mediana del número de llamadas se sitúa alrededor de los 600-700, indicando una tendencia central comparable. Sin embargo, se observa una mayor dispersión en los datos de 2024, evidenciado por una caja ligeramente más alta y bigotes más extendidos, lo que sugiere una mayor variabilidad en el número de llamadas recibidas en ese año en comparación con 2023. Adicionalmente, ambos años presentan valores atípicos significativos, representados por los círculos por encima del bigote superior, lo que indica la existencia de días con un número inusualmente alto de llamadas, siendo más pronunciados y con valores extremos superiores en el año 2024, alcanzando incluso cifras superiores a las 9000 llamadas en algunos casos, en contraste con los valores atípicos de 2023 que se extienden hasta aproximadamente 8000 llamadas, sin embargo, esto se debe a que la población de habitantes varia mucho de acuerdo al municipio.

boxplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, names = c("2024", "2023"), main = "Distribución de denuncias formales presentadas en Cundinamarca",col = c("pink", "pink3"))
stripchart(list(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, TABLA_DE_DATOS_violencia_de_genero$Denuncias2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"),  vertical = TRUE)

Este diagrama de caja distribución de denuncias formales de violencia de género en Cundinamarca, comparando los años 2023 y 2024. La gráfica muestra que la mayoría de los municipios de Cundinamarca presentan un número reducido de denuncias formales de violencia de género tanto en 2023 como en 2024, con una distribución altamente asimétrica marcada por unos pocos municipios con cifras muy elevadas, posiblemente urbanos, con mayor acceso institucional, mayor extensión o mayor cantidad de población; esta situación sugiere la existencia de un subregistro generalizado, probablemente asociado a barreras sociales, culturales o institucionales que impiden la denuncia, mientras que los municipios con cifras altas podrían tener mejor infraestructura para recibirlas. Por último la similitud entre ambos años indica que no hubo cambios significativos en la dinámica de denuncia, lo que refleja una persistencia estructural del problema y la necesidad urgente de fortalecer el acceso a la justicia y las estrategias de prevención, especialmente en territorios con cifras muy bajas.

Histograma

hist(TABLA_DE_DATOS_violencia_de_genero$Habitantes,col="pink1",freq=T,main="Distribución de frecuencias de los habitantes de Cundinamarca",xlab="Habitantes",ylab="Frecuencias")

Este histograma describe la distribución de frecuencias del número de habitantes en los municipios de Cundinamarca. Se observa una clara asimetría hacia la derecha, donde la mayoría de los municipios (más de 40) tienen poblaciones inferiores a 50.000 habitantes, y solo unos pocos concentran una población considerablemente mayor, incluso por encima de los 150.000 habitantes. Esto indica que el departamento está compuesto mayoritariamente por municipios pequeños en términos poblacionales, con unos pocos centros urbanos que concentran gran parte de la población. Para consideraciones sociales, esto sugiere que muchas comunidades podrían enfrentar dificultades estructurales para acceder a servicios como justicia, salud o educación, lo que también puede influir en el bajo número de denuncias registradas en esos territorios, por lo que es indispensable que a nivel gubernamental y departamental se consideren estas diferencias demográficas al asignar recursos y diseñar estrategias de intervención.

hist(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,col="pink1",freq=T,main="Distribución de frecuencias de las mujeres habitantes de Cundinamarca",xlab="Mujeres Habitantes",ylab="Frecuencias")

Esta gráfica muestra un histograma de la distribución de frecuencias de mujeres habitantes en los municipios de Cundinamarca. Se percibe una forma altamente asimétrica hacia la derecha, pues la mayoría de los municipios cuentan con una población femenina inferior a 20.000, mientras que muy pocos municipios concentran entre 40.000 y más de 80.000 mujeres; este diagrama refleja un patrón demográfico similar al general del departamento, por lo que también predominan municipios pequeños con baja densidad poblacional femenina. Esta situación es muy relevante para el diseño de políticas públicas enfocadas al bienestar de las mujeres, pues esto permite intuir que muchas de ellas viven en municipios con menos cobertura institucional y mayor vulnerabilidad territorial.

Tablas cruzadas

Presencia de Unidad Policial según Zona

TablaCruzada <- table(TABLA_DE_DATOS_violencia_de_genero$Zona,TABLA_DE_DATOS_violencia_de_genero$PUP)
TablaCruzada
##         
##          No Sí
##   Rural  18 15
##   Urbana 13 14
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores2 <- c("pink2", "pink4")
barplot(TablaCruzada, col = colores2)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Urbano", "Rural"), fill = colores2)

Esta gráfica muestra la presencia de unidades policiales según la zona (urbana o rural) en los municipios analizados de Cundinamarca. Se observa que tanto en los municipios que sí tienen unidad policial como en los que no, hay una representación significativa de zonas rurales y urbanas, sin embargo, en ambos casos la zona rural tiene una participación ligeramente mayor, lo cual es relevante dado que las zonas rurales suelen enfrentar más dificultades de acceso institucional, por lo que es importante mencionar que esta muestra de municipios es aleatoria y no representa en su totalidad a todos lo que componen el departamento de cundinamarca, en consecuencia los resultados obtenidos de este análisis varian a la realidad absoluta; aun así, hay una cantidad considerable de municipios rurales sin unidad policial, lo que representa una barrera crítica en la garantía de acceso a la justicia y protección, especialmente en contextos de violencia de género.

Distribución de Rutas de Atención Integral por Estrato Socioeconómico.

TablaCruzada <- table(TABLA_DE_DATOS_violencia_de_genero$Estratoprom,TABLA_DE_DATOS_violencia_de_genero$PRAI)
TablaCruzada
##      
##       No Sí
##   1.0  7  8
##   2.0  6 11
##   3.0  8  6
##   4.0  5  9
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores4 <- c("pink", "pink4", "pink1", "pink3")
barplot(TablaCruzada, col = colores4)
par(mfrow = c(1, 2))
legend("topleft", legend = c("1", "2", "3", "4"), fill = colores4)

Esta gráfica de barras apiladas permite visualizar cómo se distribuye la existencia de rutas de atención integral según los estratos socioeconómicos (1 a 4) en diferentes municipios de Cundinamarca. Se evidencia que la mayor parte de los municipios encuestados se concentran en los estratos 1, 2 y 3, lo que es coherente con la composición social del departamento, donde predominan poblaciones de ingresos bajos y medios. En los municipios donde sí existen rutas de atención integral, se observa una mayor representación del estrato 2, seguido de los estratos 3 y 4, adicional a esto, en los municipios donde no existen dichas rutas, la presencia de los estratos 1 y 3 es más destacada, mientras que el estrato 2 tiene una participación relativamente menor. Esto indica que aunque las rutas de atención integral existen en diversos contextos socioeconómicos, no necesariamente están priorizando los municipios más desfavorecidos (proponderancia de estrato 1), lo que podría representar una falla en la focalización de políticas públicas orientadas a la atención de víctimas de violencia de género.

Acceso a la Justicia de acuerdo con la Región.

TablaCruzada <- table(TABLA_DE_DATOS_violencia_de_genero$Región,TABLA_DE_DATOS_violencia_de_genero$AJusticia)
TablaCruzada
##                 
##                  Alta Baja Media
##   Alto Magdalena    1    4     3
##   Guavio            3    4     4
##   Oriente           2    4     3
##   Rionegro          1    2     1
##   Sabana            2    3     0
##   Sumapaz           2    1     1
##   Tequendama        4    2     3
##   Ubaté             0    5     5
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores8 <- c("pink2", "palevioletred4", "pink1","palevioletred3","pink4","palevioletred","pink3", "pink")
barplot(TablaCruzada, col = colores8)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Alto Magdalena", "Guavio", "Oriente", "Rio Negro", "Sabana", "Sumapaz", "Tequendama", "Ubaté"), fill = colores8)

Esta gráfica representa la distribución del acceso a la justicia clasificado en alta, media y baja, según las regiones de Cundinamarca. Se observan desigualdades territoriales muy relevantes, tambien se percibe que la categoría de bajo acceso a la justicia es la más frecuente, especialmente en regiones como Guavio, Ubaté y Oriente, lo que indica una concentración de condiciones desfavorables para estas zonas; las regiones con acceso alto son menos frecuentes y se destaca en Alto Magdalena, Sumapaz y Sabana, sugiriendo una mejor infraestructura judicial o mayor presencia institucional en estos territorios. Se puede establecer que la distribución no es uniforme, lo que apunta a una desigualdad estructural en la disponibilidad y calidad de los servicios de justicia en el departamento, esto puede traducirse en una mayor vulnerabilidad de las víctimas, en regiones donde la oferta institucional es más limitada y donde se perpetúan ciclos de impunidad y desprotección, especialmente frente a fenómenos como la violencia de género.

Diagramas de dispersión

plot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,main="Casos 2024 Vs. Llamadas a la línea 155",xlab="Casos 2024",ylab="Llamadas a la línea 155", col = "pink2", pch = 19)

cor(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, method = "pearson")
## [1] 0.9754291

Esta gráfica de dispersión muestra la relación entre el número de casos reportados en 2024 y las llamadas realizadas a la línea 155. Se evidencia una correlación positiva, de 0.9754291, es decir a mayor número de casos reportados también mayor es el número de llamadas a la línea 155, lo cual sugiere que en los municipios donde se registra un mayor número de casos formales, también existe una mayor demanda de apoyo a través de esta línea telefónica. También es posible decir que esta relación indica que la línea 155 se está utilizando como un canal inicial o paralelo de ayuda en los contextos con mayor incidencia de violencia, socialmente, esta tendencia puede interpretarse como un indicador de mayor conciencia o confianza en los servicios de atención, pero también refleja la magnitud del problema, sin embargo, la dispersión en los valores más altos sugiere que hay municipios con muchas llamadas pero relativamente menos casos formales, lo que podría evidenciar barreras en el acceso a la justicia o en la formalización de las denuncias. Esto refuerza la importancia de fortalecer el contacto inicial orientado a un servicio integral, concreto y que facilite el acceso a mecanismos judiciales.

plot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,TABLA_DE_DATOS_violencia_de_genero$Casos2024,main="Tasa de desempleo femenino Vs. Casos 2024",xlab="Tasa de desempleo femenino",ylab="Casos 2024", col = "pink3",pch = 19)

cor(TABLA_DE_DATOS_violencia_de_genero$Desempleo,TABLA_DE_DATOS_violencia_de_genero$Casos2024, method = "pearson")
## [1] -0.1943176

Este gráfico de dispersión relaciona la tasa de desempleo femenino con los casos reportados de violencia contra la mujer en 2024. Para la población de datos escogida (no es la totalidad de minucipios del departamento) no se percibe una correlación lineal clara entre ambas variables, es del -0.1943176, lo que sugiere que el desempleo por sí solo no explica directamente la cantidad de casos de violencia de genero en estas zonas. La concentración de puntos en la parte baja del eje vertical indica que la mayoría de los municipios reportan pocos casos, independientemente del nivel de desempleo femenino, sin embargo, se observan varios municipios con altos niveles de casos (datos atípicos), lo cual podría corresponder a zonas urbanas más pobladas; Para consideraciones sociales esta particularidad resalta cómo la violencia contra la mujer es un fenómeno complejo y multifactorial, donde el desempleo si puede ser un factor de riesgo, pero no actúa como único propulsor, por el contrario factores como la densidad poblacional, el acceso a canales de denuncia, la cultura institucional y el nivel educativo también influyen en la incidencia de violencia para las mujeres y su capacidad para reconocer y reportar estas situaciones. La ausencia de una relación directa en el gráfico no niega la influencia del desempleo, sino que invita a un análisis más integral y contextualizado.

plot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,main="Casos 2024 Vs. Denuncias formales 2024",xlab="Casos 2024",ylab="Denuncias formales 2024", col = "pink1", pch = 19)

cor(TABLA_DE_DATOS_violencia_de_genero$Casos2024,TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, method = "pearson")
## [1] 0.9845069

Gráfico de dispersión que relaciona los casos reportados de violencia contra la mujer en 2024 con las denuncias formales del mismo año. Este gráfico revela una asociación positiva clara y creciente entre ambas variables, ya que se observa una correlación del 0.9845069, es decir a mayor número de casos, mayor cantidad de denuncias formales, lo que indica que aunque no todos los casos llegan al sistema judicial, existe una relación consistente entre el volumen de hechos reportados y los que se judicializan, lo que podría reflejar cierto nivel de confianza ciudadana en las rutas formales de denuncia. Sin embargo, la dispersión de puntos en el rango bajo sugiere que muchos municipios reportan pocos casos y denuncias, lo cual puede estar asociado a barreras de acceso, desconfianza institucional o normalización de la violencia, también entendiendo que esta dispersión es fomentada por datos atípicos, que pueden ser zonas urbanizadas mas grandes en relación con la mayoría de municipios analizados que son zonas pequeñas. Por último, este patrón manifiesta que si bien hay avances en la canalización formal de los casos, aún persisten desafíos importantes en la garantía de acceso equitativo a la justicia para todas las mujeres, especialmente en territorios con baja capacidad institucional o culturalmente restrictivos.

Medidas de resumen univariadas, tendencia central y su variabilidad para una muestra de 15

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
muestra_15 <- TABLA_DE_DATOS_violencia_de_genero %>% arrange(desc(Habitantes)) %>% slice(1:15)
print(muestra_15,  n=Inf, width = Inf)
## # A tibble: 15 × 17
##    Municipio  Región         Zona   Estratoprom Desempleo NEducativo AJusticia
##    <chr>      <chr>          <chr>  <chr>           <dbl> <chr>      <chr>    
##  1 Facatativá Alto Magdalena Rural  4.0             0.128 Alta       Baja     
##  2 Fusagasugá Ubaté          Urbana 3.0             0.095 Baja       Baja     
##  3 Chía       Sabana         Urbana 4.0             0.106 Alta       Baja     
##  4 Mosquera   Ubaté          Rural  1.0             0.124 Media      Media    
##  5 Madrid     Ubaté          Urbana 3.0             0.084 Alta       Media    
##  6 Funza      Alto Magdalena Urbana 1.0             0.107 Alta       Alta     
##  7 Girardot   Sumapaz        Rural  1.0             0.111 Alta       Alta     
##  8 Cajicá     Guavio         Rural  3.0             0.113 Alta       Baja     
##  9 Cota       Guavio         Rural  4.0             0.118 Baja       Media    
## 10 La Calera  Ubaté          Urbana 2.0             0.086 Baja       Baja     
## 11 Guaduas    Guavio         Urbana 4.0             0.124 Media      Baja     
## 12 La Mesa    Ubaté          Rural  1.0             0.16  Baja       Media    
## 13 Granada    Guavio         Urbana 1.0             0.107 Alta       Media    
## 14 El Colegio Oriente        Rural  4.0             0.138 Alta       Alta     
## 15 Cogua      Oriente        Rural  4.0             0.171 Alta       Alta     
##    PUP   PRAI  Casos2024 Casos2023 Llamadas2024 Llamadas2023 Denuncias2024
##    <chr> <chr>     <dbl>     <dbl>        <dbl>        <dbl>         <dbl>
##  1 Sí    No        15549      8267         9275         8700         10211
##  2 Sí    Sí         8892      7767         8640         7992          6135
##  3 Sí    Sí        12786      7172         7890         7072          7249
##  4 Sí    No        12617      7056         7520         7000          7762
##  5 No    No        12383      6505         7050         6440          6911
##  6 No    Sí        10299      5456         6130         5690          5476
##  7 Sí    No         6058      5227         5530         5116          3742
##  8 Sí    No          421       400          315          275           176
##  9 No    No         2059      1657         1850         1730          1291
## 10 No    Sí         2770      1592         1750         1610           952
## 11 Sí    Sí         2310      2302         2450         2300          1453
## 12 No    Sí         2484      1493         1680         1525           968
## 13 No    Sí         2146      1423         1520         1423          1078
## 14 No    Sí         1897      1181         1320         1235           217
## 15 No    Sí         2061      1131         1330         1225           211
##    Denuncias2023 Habitantes MujeresHab
##            <dbl>      <dbl>      <dbl>
##  1          9283     175589      87492
##  2          5580     163789      81761
##  3          6590     151393      75495
##  4          6421     148848      74270
##  5          6283     144989      72399
##  6          4980     114885      57328
##  7          3402     109348      55028
##  8           162      74787       3727
##  9          1174      34934      17439
## 10           865      34684      17314
## 11          1321      34473      17218
## 12           880      33149      16558
## 13           980      27188      13578
## 14           197      25838      12903
## 15           192      24141      12059

Estadística descriptiva para una muestra de 15 de la variable: Tasa de desempleo femenino.

Porcentaje de mujeres desempleadas en los municipios de cundinamarca.

media_col=mean(muestra_15$Desempleo)
varianza_col=var(muestra_15$Desempleo)
sd_col=sd(muestra_15$Desempleo)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Desempleo)
MAD_col=mad(muestra_15$Desempleo)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Desempleo),var(muestra_15$Desempleo),sd(muestra_15$Desempleo),100*sd(muestra_15$Desempleo)/mean(muestra_15$Desempleo),median(muestra_15$Desempleo),100*mad(muestra_15$Desempleo),mad(muestra_15$Desempleo)/median(muestra_15$Desempleo)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               1.181333e-01
## Varianza                               5.938381e-04
## Desv_estandar                          2.436879e-02
## cve_media                              2.062821e+01
## Mediana                                1.130000e-01
## MAD                                    1.630860e+00
## cve_mediana                            1.443239e-01
summary(muestra_15$Desempleo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0840  0.1065  0.1130  0.1181  0.1260  0.1710

Estadística descriptiva para una muestra de 15 de la variable: Casos 2024

Casos de violencia de género reportados en Cundinamarca durante el año 2024.

media_col=mean(muestra_15$Casos2024)
varianza_col=var(muestra_15$Casos2024)
sd_col=sd(muestra_15$Casos2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Casos2024)
MAD_col=mad(muestra_15$Casos2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Casos2024),var(muestra_15$Casos2024),sd(muestra_15$Casos2024),100*sd(muestra_15$Casos2024)/mean(muestra_15$Casos2024),median(muestra_15$Casos2024),100*mad(muestra_15$Casos2024),mad(muestra_15$Casos2024)/median(muestra_15$Casos2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               6.315467e+03
## Varianza                               2.695627e+07
## Desv_estandar                          5.191943e+03
## cve_media                              8.220997e+01
## Mediana                                2.770000e+03
## MAD                                    3.482627e+05
## cve_mediana                            1.257266e+00
summary(muestra_15$Casos2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     421    2104    2770    6315   11341   15549

Estadística descriptiva para una muestra de 15 de la variable: Casos 2023

Casos de violencia de género reportados en Cundinamarca durante el año 2023.

media_col=mean(muestra_15$Casos2023)
varianza_col=var(muestra_15$Casos2023)
sd_col=sd(muestra_15$Casos2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Casos2023)
MAD_col=mad(muestra_15$Casos2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Casos2023),var(muestra_15$Casos2023),sd(muestra_15$Casos2023),100*sd(muestra_15$Casos2023)/mean(muestra_15$Casos2023),median(muestra_15$Casos2023),100*mad(muestra_15$Casos2023),mad(muestra_15$Casos2023)/median(muestra_15$Casos2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               3.908600e+03
## Varianza                               8.414907e+06
## Desv_estandar                          2.900846e+03
## cve_media                              7.421701e+01
## Mediana                                2.302000e+03
## MAD                                    2.819905e+05
## cve_mediana                            1.224981e+00
summary(muestra_15$Casos2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     400    1458    2302    3909    6780    8267

Estadística descriptiva para una muestra de 15 de la variable: Llamadas a la línea 155 en 2024

Llamadas presentadas a la línea 155 en el año 2024.

media_col=mean(muestra_15$Llamadas2024)
varianza_col=var(muestra_15$Llamadas2024)
sd_col=sd(muestra_15$Llamadas2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Llamadas2024)
MAD_col=mad(muestra_15$Llamadas2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Llamadas2024),var(muestra_15$Llamadas2024),sd(muestra_15$Llamadas2024),100*sd(muestra_15$Llamadas2024)/mean(muestra_15$Llamadas2024),median(muestra_15$Llamadas2024),100*mad(muestra_15$Llamadas2024),mad(muestra_15$Llamadas2024)/median(muestra_15$Llamadas2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               4.283333e+03
## Varianza                               1.024033e+07
## Desv_estandar                          3.200052e+03
## cve_media                              7.470939e+01
## Mediana                                2.450000e+03
## MAD                                    3.165351e+05
## cve_mediana                            1.291980e+00
summary(muestra_15$Llamadas2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     315    1600    2450    4283    7285    9275

Estadística descriptiva para una muestra de 15 de la variable: Llamadas a la línea 155 en 2023

Llamadas presentadas a la línea 155 en el año 2023.

media_col=mean(muestra_15$Llamadas2023)
varianza_col=var(muestra_15$Llamadas2023)
sd_col=sd(muestra_15$Llamadas2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Llamadas2023)
MAD_col=mad(muestra_15$Llamadas2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Llamadas2023),var(muestra_15$Llamadas2023),sd(muestra_15$Llamadas2023),100*sd(muestra_15$Llamadas2023)/mean(muestra_15$Llamadas2023),median(muestra_15$Llamadas2023),100*mad(muestra_15$Llamadas2023),mad(muestra_15$Llamadas2023)/median(muestra_15$Llamadas2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               3.955533e+03
## Varianza                               8.730841e+06
## Desv_estandar                          2.954800e+03
## cve_media                              7.470041e+01
## Mediana                                2.300000e+03
## MAD                                    3.002265e+05
## cve_mediana                            1.305333e+00
summary(muestra_15$Llamadas2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     275    1474    2300    3956    6720    8700

Estadística descriptiva para una muestra de 15 de la variable: Denuncias formales en 2024

Denuncias formales realizadas por las victimas en el 2024.

media_col=mean(muestra_15$Denuncias2024)
varianza_col=var(muestra_15$Denuncias2024)
sd_col=sd(muestra_15$Denuncias2024)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Denuncias2024)
MAD_col=mad(muestra_15$Denuncias2024)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Denuncias2024),var(muestra_15$Denuncias2024),sd(muestra_15$Denuncias2024),100*sd(muestra_15$Denuncias2024)/mean(muestra_15$Denuncias2024),median(muestra_15$Denuncias2024),100*mad(muestra_15$Denuncias2024),mad(muestra_15$Denuncias2024)/median(muestra_15$Denuncias2024)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               3.588800e+03
## Varianza                               1.144029e+07
## Desv_estandar                          3.382350e+03
## cve_media                              9.424737e+01
## Mediana                                1.453000e+03
## MAD                                    1.893280e+05
## cve_mediana                            1.303015e+00
summary(muestra_15$Denuncias2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##     176     960    1453    3589    6523   10211

Estadística descriptiva para una muestra de 15 de la variable: Denuncias formales en 2023

Denuncias formales realizadas por las victimas en el 2023.

media_col=mean(muestra_15$Denuncias2023)
varianza_col=var(muestra_15$Denuncias2023)
sd_col=sd(muestra_15$Denuncias2023)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Denuncias2023)
MAD_col=mad(muestra_15$Denuncias2023)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Denuncias2023),var(muestra_15$Denuncias2023),sd(muestra_15$Denuncias2023),100*sd(muestra_15$Denuncias2023)/mean(muestra_15$Denuncias2023),median(muestra_15$Denuncias2023),100*mad(muestra_15$Denuncias2023),mad(muestra_15$Denuncias2023)/median(muestra_15$Denuncias2023)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               3.220667e+03
## Varianza                               9.138270e+06
## Desv_estandar                          3.022957e+03
## cve_media                              9.386122e+01
## Mediana                                1.321000e+03
## MAD                                    1.718333e+05
## cve_mediana                            1.300782e+00
summary(muestra_15$Denuncias2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   162.0   872.5  1321.0  3220.7  5931.5  9283.0

Estadística descriptiva para una muestra de 15 de la variable: Habitantes 2024

Habitantes de los municipios de Cundinamarca.

media_col=mean(muestra_15$Habitantes)
varianza_col=var(muestra_15$Habitantes)
sd_col=sd(muestra_15$Habitantes)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$Habitantes)
MAD_col=mad(muestra_15$Habitantes)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$Habitantes),var(muestra_15$Habitantes),sd(muestra_15$Habitantes),100*sd(muestra_15$Habitantes)/mean(muestra_15$Habitantes),median(muestra_15$Habitantes),100*mad(muestra_15$Habitantes),mad(muestra_15$Habitantes)/median(muestra_15$Habitantes)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               8.653567e+04
## Varianza                               3.491301e+09
## Desv_estandar                          5.908723e+04
## cve_media                              6.828079e+01
## Mediana                                7.478700e+04
## MAD                                    7.057028e+06
## cve_mediana                            9.436169e-01
summary(muestra_15$Habitantes)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   24141   33811   74787   86536  146918  175589

Estadística descriptiva de la variable: Mujeres habitantes

Mujeres habitantes de los municipios de Cundinamarca.

media_col=mean(muestra_15$MujeresHab)
varianza_col=var(muestra_15$MujeresHab)
sd_col=sd(muestra_15$MujeresHab)
#calcular cve
cve_media_col=100*sd_col/media_col
medianaCol=median(muestra_15$MujeresHab)
MAD_col=mad(muestra_15$MujeresHab)
cve_mediana_col=100*MAD_col/medianaCol
#min,max,cuartiles,media y median
resumen=data.frame(Estadísticos_Descriptivos_univariados=c(mean(muestra_15$MujeresHab),var(muestra_15$MujeresHab),sd(muestra_15$MujeresHab),100*sd(muestra_15$MujeresHab)/mean(muestra_15$MujeresHab),median(muestra_15$MujeresHab),100*mad(muestra_15$MujeresHab),mad(muestra_15$MujeresHab)/median(muestra_15$MujeresHab)))
rownames(resumen)=c("Promedio","Varianza","Desv_estandar","cve_media","Mediana","MAD","cve_mediana")
resumen
##               Estadísticos_Descriptivos_univariados
## Promedio                               4.097127e+04
## Varianza                               9.726031e+08
## Desv_estandar                          3.118659e+04
## cve_media                              7.611819e+01
## Mediana                                1.743900e+04
## MAD                                    2.032941e+06
## cve_mediana                            1.165744e+00
summary(muestra_15$MujeresHab)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    3727   15068   17439   40971   73334   87492

Gráficos estadísticos para una muestra de 15

Diagramas de barras

table(muestra_15$Región)
## 
## Alto Magdalena         Guavio        Oriente         Sabana        Sumapaz 
##              2              4              2              1              1 
##          Ubaté 
##              5
barplot(table(muestra_15$Región),col="pink4", main="Frecuencias de una muestra de la variable Región", las=2)

Diagramas circulares

tabla_frecuencias <- table(muestra_15$NEducativo)
leyenda <- c("Media","Alta","Baja") 
colores_personalizados <- c("pink", "pink2", "pink4") 
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main="Nivel educativo promedio de una muestra de 15", col = colores_personalizados) 
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)

tabla_frecuencias <- table(muestra_15$AJusticia)
leyenda <- c("Media", "Alta", "Baja") 
colores_personalizados <- c("pink", "pink2", "pink4")
tabla_frecuencias <- tabla_frecuencias[leyenda]
porcentajes <- round(prop.table(tabla_frecuencias) * 100)
etiquetas <- paste0(names(tabla_frecuencias), " (", porcentajes, "%)")
pie(tabla_frecuencias, labels = etiquetas, main = "Acceso a la justicia de una muestra de 15", col = colores_personalizados)
legend("topright", legend = names(tabla_frecuencias), cex = 0.8, fill = colores_personalizados)

Diagrama de tallo y hojas

Casos 2024

casos_log <- log10(muestra_15$Casos2024)
stem(casos_log)
## 
##   The decimal point is at the |
## 
##   2 | 6
##   3 | 3333444
##   3 | 89
##   4 | 01112

Casos 2023

casos_log1 <- log10(muestra_15$Casos2023)
stem(casos_log1)
## 
##   The decimal point is at the |
## 
##   2 | 6
##   3 | 1122224
##   3 | 7788999

Diagrama de Caja

boxplot(muestra_15$Llamadas2024,muestra_15$Llamadas2023, names = c("2024", "2023"), main = "Distribución de llamadas a la línea 155 para una muestra de 15",col = c("pink", "pink3"))
stripchart(list(muestra_15$Llamadas2024, muestra_15$Llamadas2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"),  vertical = TRUE)

boxplot(muestra_15$Denuncias2024,muestra_15$Denuncias2023, names = c("2024", "2023"), main = "Distribución de denuncias formales presentadas en Cundinamarca",col = c("pink", "pink3"))
stripchart(list(muestra_15$Denuncias2024, muestra_15$Denuncias2023), method = "jitter", pch = 19, add = TRUE, col = c("palevioletred3"),  vertical = TRUE)

Histograma

hist(muestra_15$Habitantes,col="pink1",freq=T,main="Distribución de frecuencias de los habitantes de Cundinamarca",xlab="Habitantes",ylab="Frecuencias")

hist(muestra_15$MujeresHab,col="pink1",freq=T,main="Distribución de frecuencias de las mujeres habitantes de Cundinamarca",xlab="Mujeres Habitantes",ylab="Frecuencias")

Tablas cruzadas

Presencia de Unidad Policial según Zona para una muestra de 15.

TablaCruzada <- table(muestra_15$Zona,muestra_15$PUP)
TablaCruzada
##         
##          No Sí
##   Rural   4  4
##   Urbana  4  3
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores2 <- c("pink2", "pink4")
barplot(TablaCruzada, col = colores2)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Urbano", "Rural"), fill = colores2)

Distribución de Rutas de Atención Integral por Estrato Socioeconómico para una muestra de 15.

TablaCruzada <- table(muestra_15$Estratoprom,muestra_15$PRAI)
TablaCruzada
##      
##       No Sí
##   1.0  2  3
##   2.0  0  1
##   3.0  2  1
##   4.0  2  4
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores4 <- c("pink", "pink4", "pink1", "pink3")
barplot(TablaCruzada, col = colores4)
par(mfrow = c(1, 2))
legend("topleft", legend = c("1", "2", "3", "4"), fill = colores4)

Acceso a la Justicia de acuerdo con la Región para ua muestra de 15.

TablaCruzada <- table(muestra_15$Región,muestra_15$AJusticia)
TablaCruzada
##                 
##                  Alta Baja Media
##   Alto Magdalena    1    1     0
##   Guavio            0    2     2
##   Oriente           2    0     0
##   Sabana            0    1     0
##   Sumapaz           1    0     0
##   Ubaté             0    2     3
TablaCruzada_propFilas=prop.table(TablaCruzada, margin = 1)
TablaCruzada_propColumnas=prop.table(TablaCruzada, margin = 2)
TablaCruzada100 <- addmargins(TablaCruzada * 100)
par(mfrow = c(1, 2))
colores8 <- c("pink2", "palevioletred4", "pink1","palevioletred3","pink4","palevioletred","pink3", "pink")
barplot(TablaCruzada, col = colores8)
par(mfrow = c(1, 2))
legend("topleft", legend = c("Alto Magdalena", "Guavio", "Oriente", "Rio Negro", "Sabana", "Sumapaz", "Tequendama", "Ubaté"), fill = colores8)

Diagramas de dispersión

plot(muestra_15$Casos2024,muestra_15$Llamadas2024,main="Casos 2024 Vs. Llamadas a la línea 155",xlab="Casos 2024",ylab="Llamadas a la línea 155", col = "pink2", pch = 19)

cor(muestra_15$Casos2024,muestra_15$Llamadas2024, method = "pearson")
## [1] 0.9548431
plot(muestra_15$Desempleo,muestra_15$Casos2024,main="Tasa de desempleo femenino Vs. Casos 2024",xlab="Tasa de desempleo femenino",ylab="Casos 2024", col = "pink3", pch = 19)

cor (muestra_15$Desempleo,muestra_15$Casos2024, method = "pearson")
## [1] -0.3190279
plot(muestra_15$Casos2024,muestra_15$Denuncias2024,main="Casos 2024 Vs. Denuncias formales 2024",xlab="Casos 2024",ylab="Denuncias formales 2024", col = "pink1", pch = 19)

cor(muestra_15$Casos2024,muestra_15$Denuncias2024, method = "pearson")
## [1] 0.9880002

Discusión de resultados primera parte

Para efectos comparativos de nuestro análisis acerca de la violencia de género en los años 2023 y 2024 en el departamento de Cundinamarca, tomamos una muestra de los 15 municipios más poblados del departamento, con el fin de hacer una interpretación de resultados focalizada a las zonas mas relevantes del departamento y a las que por lo general van destinadas las políticas públicas, sin embargo es importante mencionar que sesgar el análisis a estas zonas puede omitir realidades territoriales clave.

Centrandose en las medidas univariadas de estadistica descriptiva, encontramos significativas diferencias entre ambas muestras, por un lado, esta muestra reducida resalta para el desempleo una media y una madiana mas bajas, lo que indica que los municipios más poblados del departamento tienen menores tasas de desempleo, lo que sugiere que la urbanización está asociada a una mayor diversificación laboral para mujeres, lo que trae consigo condiciones laborales más homogeneas y más oportunidades de trabajo, en contraste con la muestra completa de los municipios que si refleja valores extremos de zonas rurales con problemas como Fosca que tiene una tasa de desempleo de 17.9%. Esto da respuesta a que el coeficiente de variación y la desviación estandar de esta muestra reducida sean menores.

Por otro lado, en los casos de violencia reportandos en la muestra reducida, se percibe una media drásticamnete alta en comparación a la media de la totalidad de los datos evidenciando la concentración de casos en grandes núcleos urbanos, idea soportada por el análisis de los percentiles, pues mientras el 50% de municipios en la muestra completa reportan menos de 721.5 casos, en la muestra de 15 municipios el 50% supera los 2,770 casos. La desviación estándar absoluta es mayor en la muestra redicida, pero el coeficiente de variación es significativamente menor, lo que revela que los municipios más grandes tienen cifras absolutas más altas pero relativamente más consistentes entre sí.

La disparidad en las llamadas a la línea 155 entre ambas muestras revela un problema estructural e institucional, pues la media en la muestra de 15 es 2.8 veces mayor, lo que demuestra una mayor utilización del servio en los municipios más grandes, lo que se evidencia en los resultados de los cuartiles, pues en la muestra completa 25% de municipios realiza cerca de 356 llamadas y el 75% realiza 1,336, mientras que la muestra reducida el 25% realiza 1,600 llamadas y el 75% realiza 7,285 llamadas. Por otro lado la desviación estándar es mayor en la muestra de 15 y el coeficiente de variación es significativamente menor, lo que revela que los grandes municipios tienen patrones de uso más estable entre sí.

En cuanto a la variable de denuncias formales para ambas muestras la diferencia es grande, pues aunque la media y la mediana presentan una menor asimetría que la de la muestra total, aún se percibe una concentración en algunas zonas urbanas. La muestra de 15 tiene una mediana 10 veces mayor, probando que la mayoría de municipios pequeños están sub-representados en el sistema judicial. Así, se sigue observando un brecha social y zonal, pues la mediana de la muestra de 15 (1,453) supera el tercer cuartíl de la muestra completa, probando que el 75% de municipios está por debajo del estándar urbano.

Para la variable de habitantes por municipio se percibe una gran brecha demográfica, pues la muestra de 15 municipios más poblados presenta una media 3 veces mayor y una mediana 6.2 veces superior, lo que revela gracias a los cuartiles que el 25% de los municipios en la muestra completa no supera los 6,465 habitantes, mientras en la muestra de 15, el 25% inferior ya supera los 33,811.

Los resultados de la variable habitantes mujeres revelan una desigualdad demográfica, pues mientras que la muestra completa presenta una media de 13,834 mujeres y una mediana de 6,000, la muestra de 15 municipios más poblados triplica estos valores. La desviación estándar es mayor en la muestra de 15, pero el coeficiente de variación es menor, demostrando así que los municipios grandes tienen una distribución relativamente más homogénea en proporción a su tamaño y confirmando que pocos municipios concentran la mayoría de la población femenina, lo que a su vez puede explicar la incidencia en más casos de violencia de género. La muestra de 15 excluye el 75% de municipios con alrededor de 10,410 mujeres (tercer cuartíl de la muestra completa), lo que distorsiona la percepción de la distribución real.

La ilustración e interpretación de las gráficas realizadas para cada muestra nos permite evidenciar cierto comportaminto. Empezando por la gráfica de barras que representa la frecuencia de la variable Región, pues tanto la muestra reducida como la muestra completa están dominadas por las regiones de Ubaté y Guavio, sin embargo para la totalidad de la muestra Guavio es la región más representada, mientras que en la muestra reducida Ubaté lleva la delantera, lo que determina que los municipios de Ubaté tienen poblaciones más grandes o con mayores tasas de violencia. Por otro lado para el análisis de la frecuencia de la variable zona, es preciso mencionar que el gráfico de la muestra completa refleja mejor la realidad del departamento, donde la mayoría de los municipios son rurales y son los que enfrentan mayores desafíos institucionales y estructurales, mientras que el de la muestra reducida al centrarse en los territorios más grandes con las tendencias a la urbanización puede oscurecer desigualdades críticas. Para terminar de comparar los gráficos de barras es importante mencionar los de la frecuencia de la variable estrato socioeconómico, donde los municipios de estratos bajos (1 y 2) representan más del 53% de la muestra total, mientras que en la muestra reducida hay un cambio drástico en la distribución, pues el estrato 4 pasa de ser minoritario (23.3%) a ser el más frecuente (33.3%), lo que podría subestimar la relación entre pobreza y violencia de género, pues esta muestra priorizó los municipios más poblados y con más oportunidades.

Siguiendo con el análisis comparativo para la gráfica que reprensenta el nivel educativo promedio en los municipios se puede decir que, para la muestra de 60 municipios existe un equilibrio cercano entre los tres niveles, con un ligero predominio de niveles altos y bajos, mientras que en la muestra reducida se percibe un aumento en educación “Alta” (del 35% al 60%) y una caída de “Media” (del 30% al 13%), lo que sugiere que la mayoría de los municipios tienen educación “Alta”, ocultando la desigualdad educativa como un factor crítico para entender barreras culturales y de denuncia. Así mismo la gráfica que representa el acceso a la justicia indica que, aunque las proporciones son similares, para la muestra reducida hay un ligero aumento en acceso “Alta” (del 25% al 27%) y menos municipios con acceso “Baja” (del 42% al 40%), ,lo que sugiere que los municipios con acceso “Alta” son urbanos y poblados, lo que distorsiona la realidad de las zonas más aisladas.

Los diagramas de caja tambien proporcionan una visión comparativa entre muestras pues, la distribución de llamadas a la línea 155 en los años 2023 y 2024 revela que, la mediana de la muestra reducida para 2024 es 3.7 veces mayor que en la completa, lo que confirma que la muestra reducida solo incluye municipios grandes con alta demanda del servicio y que esta muestra tiene menos valores atípicos porque ya está sesgada hacia municipios con altos volúmenes de llamadas, sin emabargo esto distorsiona la realidad al sugerir que el uso de la línea 155 es alto en general y que es un fenómeno urbano. En el gráfico que representa la distribución de denuncias formales presentadas en el departamento para ambos años se observa que, la mediana de la muestra reducida es 10 veces mayor que en la completa, confirmando que los unicipios grandes tienen mayor capacidad de denuncia o también que como ya se observo los casos de violencia también se presentan en mayor medida, lo que invisibiliza la falta de acceso a la justicia en municipios pequeños. La muestra total expone la crisis de subregistro en municipios pequeños y la reducida distorsiona la escala del problema.

Por su parte los histogramas de ambas muestras revelan una brecha crítica en la representación demográfica de Cundinamarca, ya que la muestra completa expone una estructura desigual, teniendo el 80% son municipios pequeños, con mayoría de poblaciones rurales y acceso limitado a servicios, lo que agrava el subregistro de violencia de género y por el contrario la muestra reducida sesga la realidad al incluir solo zonas urbanas y medianas, todas con mas de 20.000 habitantes, ocultando la vulnerabilidad de áreas rurales donde las mujeres enfrentan mayores barreras y sobredimensionando la capacidad requerida en ciudades, ignorando que el problema es estructural en municipios pequeños.

El estudio de la distribución de recursos institucionales en los 15 municipios más poblados de Cundinamarca muestra patrones que no siguen las expectativas comunes. Contrario a lo que se esperaría de una mayor cobertura en áreas densamente pobladas, la presencia de unidades policiales en esta muestra no favorece claramente ni a las zonas rurales ni a las urbanas, en el campo hay una distribución pareja (4 con y 4 sin), mientras que en las ciudades hay incluso más lugares sin presencia policial (4 sin y 3 con). Esto contrasta con la muestra total, donde sí se ve una ligera mayor cobertura urbana, lo que sugiere que ni el tamaño del municipio ni su desarrollo urbano aseguran una asignación prioritaria de policías, indicando posibles desequilibrios en el reparto de la seguridad.

En cuanto a la disponibilidad de rutas de atención integral, se nota que están más presentes en los estratos 1 y 4, con poca o igual cobertura en los estratos 2 y 3. Este patrón significa que el acceso a estas rutas en los municipios más grandes no sigue una lógica sencilla por nivel económico, y no siempre prioriza a los estratos más vulnerables. Esto podría deberse a decisiones institucionales que no se ajustan bien a las necesidades reales de cada grupo social. Esta distribución desigual también se observa parcialmente en los datos completos, lo que sugiere una falta general de un plan claro para repartir estos servicios importantes de manera equitativa.

A su vez, la relación entre el acceso a la justicia y la región en estos 15 municipios poblados muestra diferencias importantes. Algunas regiones como Oriente y Sumapaz tienen solo niveles altos de acceso, lo que podría indicar más presencia institucional o mejores condiciones para ayudar a las víctimas. Por el contrario, regiones como Guavio y Ubaté concentran sus casos en niveles medio y bajo, lo que sugiere posibles limitaciones en los servicios disponibles. Aunque este patrón regional también se ve en la muestra total, el análisis en los municipios más grandes ayuda a identificar con mayor claridad dónde existen las falencias en la cobertura y efectividad de los servicios de justicia, destacando la necesidad de reforzar la atención en las regiones donde las barreras aún son significativas.

Los diagramas de dispersión revelan patrones diferenciados en la relación entre variables clave de violencia de género al comparar la muestra total de municipios con los 15 más poblados de Cundinamarca. En la relación entre llamadas a la línea 155 y casos reportados, la muestra general muestra una conexión positiva pero dispersa, indicando variaciones entre municipios. En contraste, los 15 municipios más grandes exhiben una tendencia más agrupada, con un volumen consistentemente más alto en ambas variables. Esto sugiere que las áreas más pobladas no solo registran más incidentes, sino que también presentan una correlación más clara entre las llamadas de auxilio y el registro formal de casos, posiblemente por una mayor capacidad institucional para documentarlos.

Por otro lado, el análisis de la relación entre el desempleo femenino y los casos reportados no muestra una tendencia lineal clara en ninguna de las muestras. Los puntos se dispersan aleatoriamente, sin indicar que un aumento en el desempleo femenino se traduzca en un incremento proporcional de casos de violencia. Incluso en los municipios grandes, donde se observan tasas de desempleo ligeramente mayores, los casos de violencia no aumentan en la misma medida. Esto sugiere que el desempleo femenino no es un factor determinante directo en la variación de los casos reportados, y que otros elementos, como el acceso a servicios o políticas locales, podrían tener una influencia más significativa en los registros de violencia.

Finalmente, al examinar la relación entre los casos reportados y las denuncias formales, se observa una fuerte asociación positiva en ambos conjuntos de datos. Su alineación indica que a medida que aumentan los casos reportados, las denuncias formales crecen proporcionalmente. En la muestra total, esta relación es moderadamente dispersa, con algunos municipios que se desvían de la tendencia general. Sin embargo, en los 15 municipios más poblados, esta relación es más compacta y cercana a una línea, con valores consistentemente altos en ambas variables (denuncias superiores a 4000 y casos por encima de 5000). Esta coherencia más robusta en las áreas urbanas sugiere mecanismos de denuncia más eficientes o una mayor incidencia real de casos que son documentados formalmente.

Conclusiones parte 1

El análisis estadístico de la violencia de género en Cundinamarca durante 2023 y 2024, comparando una muestra general de municipios con otra centrada en los 15 más poblados, muestra diferencias importantes que deben tenerse en cuenta al diseñar políticas públicas. En los municipios más grandes se concentra la mayor parte de la población femenina, así como un número significativamente mayor de denuncias y llamadas a la línea 155. Esto podría interpretarse como una mayor visibilidad de la problemática en zonas urbanas, pero también refleja una mayor facilidad para acceder a los canales de atención y denuncia.

En contraste, los municipios con menor población tienden a mostrar menos casos reportados, lo que no necesariamente significa que haya menos violencia, sino que puede deberse a barreras en el acceso a la justicia y a la falta de mecanismos de atención. Las diferencias en las medianas, promedios y medidas de dispersión entre las dos muestras, así como la presencia de valores extremos en los municipios grandes, refuerzan esta idea.

Estos resultados evidencian una desigualdad territorial en la forma en que la violencia de género se registra y atiende. Si bien los datos de las zonas urbanas son útiles para tomar decisiones, es clave no dejar de lado las realidades de los municipios más pequeños, donde la violencia puede ser igual o incluso más grave, pero menos visible. Por eso, es necesario que las estrategias de prevención, atención y justicia lleguen a todo el departamento, adaptándose a las condiciones específicas de cada municipio, para garantizar una respuesta más justa, equitativa y efectiva para todas las mujeres.

Probabilidad

Determinación de la distribución a partir de los histogramas

library(moments)
library(ecostats)
## Loading required package: mvabund
library(vcd)
## Loading required package: grid
library(Rgof)
hist(TABLA_DE_DATOS_violencia_de_genero$Desempleo,col="pink",freq=T,main="Distribución de frecuencias del desempleo femenino",xlab="Desempleo femenino",ylab="Frecuencias")

Teniendo en cuenta que el rango de datos está entre aproximadamente 0.08 y 0.18, que tiene varias modas o agrupaciones de valores sugiriendo asimetría, que no tiene forma de campana y que no tiene cola alargada a la derecha ni a la izquierda. Se puede determinar entonces que la distribución de probabilidad más apropiada es Beta, dado que está definida en el intervalo [0, 1], lo que es coherente con proporciones o tasas como el desempleo, además presenta una forma irregular, por lo que esta distribución resulta útil comúnmente en estudios sociales y económicos para modelar tasas o porcentajes.

summary(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##  0.0810  0.1047  0.1240  0.1272  0.1505  0.1790
mean(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 0.1272333
median(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 0.124
skewness (TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 0.1974911
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Desempleo)
## [1] 1.817957

(Asimetría) Skewness = 0.197: Este valor de asimetría es positivo pero bajo, lo que indica que la distribución es ligeramente sesgada a la derecha. En una distribución Beta, esto podría corresponder a un caso donde los parámetros α y β son ligeramente diferentes, con α ligeramente menor que β.

Kurtosis = 1.82: La curtosis está por debajo de 3, lo que indica que la distribución tiene colas más ligeras y es más plana que una normal, por tanto se rechaza dicha distribución. Esto sugiere que hay menos valores extremos de los esperados bajo una distribución normal, lo cual es coherente con una Beta de forma más concentrada en torno a la media.

hist(TABLA_DE_DATOS_violencia_de_genero$Casos2024,col="pink1",freq=T,main="Distribución de frecuencias de los casos en 2024",xlab="Casos 2024",ylab="Frecuencias")

Teniendo en cuenta que el eje X (Casos 2024) va desde 0 hasta más de 15,000 casos y el eje Y (Frecuencias) tiene la mayoría de datos concentrados en los primeros valores cercanos a 0, es decir una gran concentración de municipios con pocos casos (más de 40 municipios tienen menos de 2,000 casos). Se puede decir que además de ser altamente simétrica, tiene una cola larga hacia la derecha (sesgo positivo). Por lo que la distribución de probabilidad más adecuada es la distribución Gamma donde la media y la varianza son diferentes.

summary(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   109.0   398.5   721.5  2061.8  1524.8 15549.0
mean(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 2061.75
median(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 721.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 2.55395
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
## [1] 8.31008

(Asimetría) Skewness = 2.55: La distribución tiene fuerte sesgo positivo, lo que significa que la mayoría de los municipios tiene relativamente pocos casos, pero algunos tienen valores extremadamente altos, lo cual empuja la media muy por encima de la mediana. Este comportamiento es típico de la distribución Gamma, que puede capturar esa cola larga a la derecha.

Kurtosis = 8.31: Este valor indica con colas pesadas y concentración alrededor de la media. La Gamma también es apta para este tipo de comportamiento si se ajustan adecuadamente sus parámetros. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

hist(TABLA_DE_DATOS_violencia_de_genero$Casos2023,col="pink2",freq=T,main="Distribución de frecuencias de los casos en 2023",xlab="Casos 2023",ylab="Frecuencias")

Teniendo en cuenta que el eje X (Casos 2023) tiene valores desde 0 hasta aproximadamente 9000 y que la mayoría están entre 0 y 2000 casos, podemos decir que hay una cola larga a la derecha, con algunos municipios que tienen cantidades muy superiores al resto (mayor dispersión), lo que la hace una distribución muy asimétrica con sesgo positivo y además presenta una varianza significativamente mayor que la media. La distribución de probabilidad más adecuada es la distribución Gamma.

summary(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    99.0   329.0   575.5  1368.8  1194.8  8267.0
mean(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 1368.833
median(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 575.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 2.307976
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
## [1] 6.955668

(Asimetría) Skewness = 2.31: La mayoría de los municipios tienen pocos casos, pero algunos presentan valores muy altos que alargan la cola derecha de la distribución.

Kurtosis = 6.96: Esto sugiere la presencia de valores extremos más frecuentes de lo esperado en una distribución normal. Esta combinación confirma que los datos están concentrados en valores bajos, pero con ocasionales picos muy altos, lo que justifica el uso de una distribución Gamma, adecuada para modelar datos positivos, asimétricos y con colas grandes. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,col="pink3",freq=T,main="Distribución de frecuencias de las Llamadas en 2024",xlab="Llamadas 2024",ylab="Frecuencias")

Se observa que el eje X (Llamadas 2024) tiene valores de 0 hasta cerca de 10,000 llamadas y que la mayoría de municipios reportan menos de 2000 llamadas, concentrándose fuertemente en ese rango, por lo que hay una cola larga hacia la derecha. La distribución de probabilidad más adecuada es la distribución Gamma, ya que se tienen datos positivos y continuos, con mucha dispersión, además de una alta concentración de valores bajos con valores extremos hacia la derecha y una varianza mayor que la media, lo que descarta distribuciones como Poisson.

summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    97.0   356.2   667.5  1512.5  1332.5  9275.0
mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 1512.5
median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 667.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 2.322403
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
## [1] 7.086882

(Asimetría) Skewness = 2.32: La asimetría positiva indica que la distribución está sesgada hacia la derecha, es decir, que la mayoría de los municipios tienen pocas llamadas, pero hay algunos municipios con muchísimas llamadas, que empujan la media hacia arriba.

Kurtosis = 7.09: Este valor de curtosis es mucho mayor que 3 (valor de la distribución normal) por tal motivo se descarta dicha distribución. Además, se evidencia que tiene un pico más pronunciado alrededor de la media y presenta colas más pesadas, es decir, más valores extremos de lo que se esperaría en una distribución normal.

hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,col="pink4",freq=T,main="Distribución de frecuencias de las llamadas en 2023",xlab="Llamadas 2023",ylab="Frecuencias")

Se observa que el eje X (Llamadas 2023) tiene valores de 0 hasta cerca de 9,000 llamadas y que la mayoría de municipios reportan menos de 2000 llamadas, concentrándose fuertemente en ese rango, por lo que hay una cola larga hacia la derecha. La distribución de probabilidad más adecuada es la distribución Gamma, ya que se tienen datos positivos y continuos, con mucha dispersión, además de una alta concentración de valores bajos con valores extremos hacia la derecha y sobredispersión donde se percibe una varianza mucho mayor que la media, lo que descarta distribuciones como Poisson.

summary(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    88.0   314.2   593.0  1385.5  1227.5  8700.0
mean(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 1385.55
median(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 593
skewness (TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 2.326704
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
## [1] 7.137554

(Asimetría) Skewness = 2.33: Este valor indica una fuerte asimetría positiva, es decir, la distribución está sesgada a la derecha, ya que la mayoría de los municipios tienen valores bajos o moderados de llamadas, pero hay unos pocos con valores muy altos, lo cual “alarga la cola” hacia la derecha.

Kurtosis = 7.14: hay una alta concentración de valores cercanos a la media, pero también colas más pesadas de lo normal, es decir, una mayor presencia de valores extremos. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,col="palevioletred4",freq=T,main="Distribución de frecuencias de las denuncias en 2024",xlab="Denuncias 2024",ylab="Frecuencias")

La distribución de probabilidad más adecuada para esta variable es la distribución Gamma, ya que contiene datos positivos y continuos, el histograma tiene una forma altamente asimétrica con cola larga a la derecha, además se evidencia una alta dispersión (cuando la varianza es mayor que la media). Se descarta una distribución Poisson, ya que solo es para conteos discretos y no sirve bien con alta dispersión.

summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
##     Min.  1st Qu.   Median     Mean  3rd Qu.     Max. 
##    33.00    86.75   145.50  1033.73   401.00 10211.00
mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 1033.733
median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 145.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 2.640293
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
## [1] 8.945195

(Asimetría) Skewness = 2.64: Este valor indica que la distribución es asimétrica positiva, y sugiere un fuerte sesgo a la derecha, pues la mayoría de los municipios reportan pocos casos de denuncias, pero hay algunos con valores extremadamente altos, lo que “alarga” la cola derecha.

Kurtosis = 8.95: Este valor de kurtosis es muy alto, lo que implica colas extremadamente pesadas, es decir, muchos valores atípicos extremos. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,col="palevioletred3",freq=T,main="Distribución de frecuencias de las denuncias en 2023",xlab="Denuncias 2023",ylab="Frecuencias")

Se observa que el eje X (Denuncias 2023), tiene valores desde 0 hasta más de 10,000 denuncias, donde la mayoría de municipios reportan menos de 2000 denuncias, por lo que se observa una cola muy larga hacia la derecha, lo que indica alta asimetría positiva, sin embargo algunos municipios tienen valores muy altos (más de 8000), lo que muestra una alta dispersión. Esto permite determinar que la distribución de probabilidad más apropiada es la distribución Gamma.

summary(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   30.00   78.75  132.50  929.22  364.25 9283.00
mean(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 929.2167
median(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 132.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 2.643887
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
## [1] 9.033088

(Asimetría) Skewness = 2.64: Este valor indica una fuerte asimetría positiva, teniendo en cuenta que la mayoría de los municipios tiene un número bajo o moderado de denuncias y unos pocos municipios registran valores muy altos, lo que genera una cola larga a la derecha. Esto es consistente con que la media (929.22) es mucho mayor que la mediana (132.5).

Kurtosis = 9.03: este coeficiente implica una alta concentración de valores cerca del centro (la mediana), pero también colas muy pesadas, es decir, valores atípicos más frecuentes de lo normal. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

hist(TABLA_DE_DATOS_violencia_de_genero$Habitantes,col="palevioletred2",freq=T,main="Distribución de frecuencias de los habitantes por municipio",xlab="Habitantes",ylab="Frecuencias")

Se observa en el eje X (Habitantes) un rango desde cerca de 0 hasta más de 160,000 habitantes, donde la mayoría de municipios tienen menos de 40,000 habitantes, lo que significa que hay una cola muy larga hacia la derecha, lo cual sugiere alta asimetría positiva, sin embargo en algunos municipios son considerablemente más grandes que el promedio, creando un efecto de valores extremos, es decir la concentración en valores bajos y la dispersión hacia valores altos indican una distribución no simétrica. Se puede decir entonces que la distribución de probabilidad más apropiada es la distribución Gamma.

summary(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    2047    6465   12052   28759   21991  175589
mean(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 28758.68
median(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 12051.5
skewness (TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 2.25662
kurtosis(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
## [1] 6.693941

(Asimetría) Skewness = 2.26: La asimetría positiva indica que la distribución está sesgada hacia la derecha, el valor muestra un sesgo considerable, pues la mayoría de los municipios tienen poblaciones menores o moderadas, pero unos pocos tienen poblaciones muy altas, que alargan la cola derecha.

Kurtosis = 6.69: tiene un pico alto en torno a la media, también posee colas más pesadas, lo que implica valores extremos más frecuentes que en una distribución normal. Se evidencia mucha concentración de municipios con población relativamente baja, pero también una alta probabilidad de valores atípicamente grandes. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

hist(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,col="palevioletred1",freq=T,main="Distribución de frecuencias de las mujeres habitantes",xlab="Mujeres habitantes",ylab="Frecuencias")

Se observa en el eje X (Habitantes mujeres) un rango desde cerca de 0 hasta más de 80,000 habitantes, donde la mayoría de municipios tienen menos de 12,000 habitantes, lo que significa que hay una cola muy larga hacia la derecha, lo cual sugiere alta asimetría positiva, sin embargo en algunos municipios son considerablemente más grandes que el promedio, creando un efecto de valores extremos, es decir la concentración en valores bajos y la dispersión hacia valores altos indican una distribución no simétrica. Se puede decir entonces que la distribución de probabilidad más apropiada es la distribución Gamma.

summary(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1019    3230    6000   13834   10410   87492
mean(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 13833.5
median(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 6000
skewness (TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 2.361178
kurtosis(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
## [1] 7.101188

(Asimetría) Skewness = 2.36: Este valor refleja una asimetría positiva marcada, ya que la mayoría de los municipios tiene una población femenina baja o moderada, sin embargo hay una minoría con valores muy altos, lo que alarga la cola a la derecha de la distribución.

Kurtosis = 7.10: en este caso, es bastante alta, entonces la distribución tiene un pico alto y está más concentrada cerca de la mediana, también tiene colas pesadas, lo que implica frecuencia elevada de valores extremos. Cómo el valor no es cercano a 3 (tipico de una distribución normal) se descarta dicha distribución.

Distribuciones de probabilidad

Histogramas de Frecuencia Relativa y Densidad para la variable Desemplo femenino

hist(TABLA_DE_DATOS_violencia_de_genero$Desempleo,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,20),main="Distribución de frecuencias de Desempleo femenino",xlab="Desempleo femenino")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Desempleo),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 0.1272
sd_d <- 0.02961926
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
# calcular el rango del eje ±3 desviaciones estándar
Inferior <- mean_d - 3*sd_d
Superior <- mean_d + 3*sd_d
# curvas
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","pink2","palevioletred"),c("Densidad","Normal teórica","Gamma teórica"),lty=1,lwd=3)

# calcular alfa y beta para beta
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
alfa <- mean_x * ( (mean_x * (1 - mean_x)) / var_x - 1 )
betas <- (1 - mean_x) * ( (mean_x * (1 - mean_x)) / var_x - 1 )
min_x <- min(x_scaled)
max_x <- max(x_scaled)
# curvas
hist(x_scaled, freq=FALSE, col="whitesmoke", main="Distribución Beta ajustada para desempleo femenino", xlab="Desempleo femenino (escalado)")
lines(density(x_scaled), col="palevioletred1", lwd=3)
curve(dunif(x, min=min_x, max=max_x), from = min_x, to = max_x, col="pink2", add=T, lwd=3)
curve(dbeta(x, alfa, betas), 0, 1, col="pink3", add=T, lwd=3)
legend("topright",col=c("palevioletred1","pink3", "pink2"),c("Densidad","Beta teórica", "Uniforme teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Desempleo femenino

# definir media y desviación estandar
mean_d <- 0.1272
sd_d <- 0.02961926
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Desempleo, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Desempleo, : ties
## should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Desempleo
## D = 0.099389, p-value = 0.5939
## alternative hypothesis: two-sided
# definir media y desviación estandar
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
alfa <- mean_x * ( (mean_x * (1 - mean_x)) / var_x - 1 )
betas <- (1 - mean_x) * ( (mean_x * (1 - mean_x)) / var_x - 1 )
ks.test(TABLA_DE_DATOS_violencia_de_genero$Desempleo, "pbeta",alfa,betas)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Desempleo, : ties
## should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Desempleo
## D = 0.7712, p-value < 2.2e-16
## alternative hypothesis: two-sided
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
min_x <- min(x_scaled)
max_x <- max(x_scaled)
ks.test(TABLA_DE_DATOS_violencia_de_genero$Desempleo, "punif",min=min_x, max=max_x)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Desempleo, : ties
## should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Desempleo
## D = 0.821, p-value < 2.2e-16
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Desempleo femenino

# definir media y desviación estandar
mean_d <- 0.1272
sd_d <- 0.02961926
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,yygam,col="violetred3", xlab = "Datos observados (Desempleo femenino)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

# definir media y desviación estandar
x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
alfa <- mean_x * ( (mean_x * (1 - mean_x)) / var_x - 1 )
betas <- (1 - mean_x) * ( (mean_x * (1 - mean_x)) / var_x - 1 )
yybeta=rbeta(60,alfa,betas)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,yybeta,col="violetred3", xlab = "Datos observados (Desempleo femenino)",ylab = "Datos simulados (Beta)", main = "Gráfico Q-Q para distribución Beta")

x <- TABLA_DE_DATOS_violencia_de_genero$Desempleo
x_scaled <- (x - min(x)) / (max(x) - min(x))
mean_x <- mean(x_scaled)
var_x <- var(x_scaled)
min_x <- min(x_scaled)
max_x <- max(x_scaled)
yyunif=runif(60,min=min_x,max=max_x)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Desempleo,yyunif,col="violetred3", xlab = "Datos observados (Desempleo femenino)",ylab = "Datos simulados (Uniforme)", main = "Gráfico Q-Q para distribución Uniforme")

Histogramas de Frecuencia Relativa y Densidad para la variable Casos en 2024

options(scipen=999)
hist(TABLA_DE_DATOS_violencia_de_genero$Casos2024,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0006), main="Distribución de frecuencias de Casos en 2024",xlab="Casos 2024")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Casos2024),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 2061.8
sd_d <- 3559.473
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Casos2024)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Casos 2024

# definir media y desviación estandar
mean_d <- 2061.8
sd_d <- 3559.473
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2024, "pgamma",shape=shape_d, scale=scale_d)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Casos2024
## D = 0.28828, p-value = 0.00006568
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 2061.8
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2024, "pexp",rate=lamda)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Casos2024
## D = 0.24072, p-value = 0.00152
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Casos 2024

# definir media y desviación estandar
mean_d <- 2061.8
sd_d <- 3559.473
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,yygam,col="violetred3", xlab = "Datos observados (Casos 2024)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 2061.8
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2024,yyexp,col="violetred3", xlab = "Datos observados (Casos 2024)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Casos en 2023

hist(TABLA_DE_DATOS_violencia_de_genero$Casos2023,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0008),main="Distribución de frecuencias de Casos en 2023",xlab="Casos 2023")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Casos2023),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1368.8
sd_d <- 2066.591
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Casos2023)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Casos 2023

# definir media y desviación estandar
mean_d <- 1368.8
sd_d <- 2066.591
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2023, "pgamma",shape=shape_d, scale=scale_d)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Casos2023
## D = 0.24607, p-value = 0.0011
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1368.8
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Casos2023, "pexp",rate=lamda)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Casos2023
## D = 0.20942, p-value = 0.008708
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Casos 2023

# definir media y desviación estandar
mean_d <- 1368.8
sd_d <- 2066.591
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2023,yygam,col="violetred3", xlab = "Datos observados (Casos 2023)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 1368.8
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Casos2023,yyexp,col="violetred3", xlab = "Datos observados (Casos 2023)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Llamadas 2024

hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0008),main="Distribución de frecuencias de Llamadas en 2024",xlab="Llamadas 2024")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1512.5
sd_d <- 2268.5372
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Llamadas 2024

# definir media y desviación estandar
mean_d <- 1512.5
sd_d <- 2268.5372
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Llamadas2024
## D = 0.2302, p-value = 0.003463
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1512.5
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Llamadas2024
## D = 0.19429, p-value = 0.02156
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Llamadas 2024

# definir media y desviación estandar
mean_d <- 1512.5
sd_d <- 2268.5372
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,yygam,col="violetred3", xlab = "Datos observados (Llamadas 2024)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 1512.5
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2024,yyexp,col="violetred3", xlab = "Datos observados (Llamadas 2024)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Llamadas 2023

hist(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0008),main="Distribución de frecuencias de Llamadas 2023",xlab="Llamadas 2023")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1385.55
sd_d <- 2099.386
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred","violetred" ),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Llamadas 2023

# definir media y desviación estandar
mean_d <- 1385.55
sd_d <- 2099.386
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023, "pgamma",shape=shape_d, scale=scale_d)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Llamadas2023
## D = 0.2346, p-value = 0.002181
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1385.55
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023, "pexp",rate=lamda)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Llamadas2023
## D = 0.20914, p-value = 0.008833
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Llamadas 2023

# definir media y desviación estandar
mean_d <- 1385.55
sd_d <- 2099.386
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,yygam,col="violetred3", xlab = "Datos observados (Llamadas 2023)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 1385.55
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Llamadas2023,yyexp,col="violetred3", xlab = "Datos observados (Llamadas 2023)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Denuncias 2024

hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.003),main="Distribución de frecuencias de Denuncias en 2024",xlab="Denuncias 2024")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 1033.733
sd_d <- 2236.390
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Demandas 2024

# definir media y desviación estandar
mean_d <- 1033.733
sd_d <- 2236.390
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Denuncias2024
## D = 0.37618, p-value = 0.00000008434
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 1033.733
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Denuncias2024
## D = 0.51065, p-value = 0.00000000000005143
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Denuncias 2024

# definir media y desviación estandar
mean_d <- 1033.733
sd_d <- 2236.390
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,yygam,col="violetred3", xlab = "Datos observados (Denuncias 2024)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 1033.733
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2024,yyexp,col="violetred3", xlab = "Datos observados (Denuncias 2024)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Denuncias 2023

hist(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.003),main="Distribución de frecuencias de Denuncias en 2023",xlab="Denuncias 2023")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 929.22
sd_d <- 2002.327
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Demandas 2023

# definir media y desviación estandar
mean_d <- 929.22
sd_d <- 2002.327
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Denuncias2023
## D = 0.37471, p-value = 0.00000009631
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 929.22
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Denuncias2023
## D = 0.50896, p-value = 0.00000000000006325
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Denuncias 2023

# definir media y desviación estandar
mean_d <- 929.22
sd_d <- 2002.327
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,yygam,col="violetred3", xlab = "Datos observados (Denuncias 2023)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 929.22
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Denuncias2023,yyexp,col="violetred3", xlab = "Datos observados (Denuncias 2023)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Habitantes

hist(TABLA_DE_DATOS_violencia_de_genero$Habitantes,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0001),main="Distribución de frecuencias de Habitantes por municipio",xlab="Habitantes")
lines(density(TABLA_DE_DATOS_violencia_de_genero$Habitantes),col="palevioletred4",lwd=3)
# definir media y desviación estandar
mean_d <- 28759
sd_d <- 4451.127
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$Habitantes)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred","violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Habitantes

# definir media y desviación estandar
mean_d <- 28759
sd_d <- 4451.127
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Habitantes, "pgamma",shape=shape_d, scale=scale_d)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Habitantes
## D = 0.71421, p-value = 0.0000000000000006661
## alternative hypothesis: two-sided
#calcular landa
mean_d <- 28759
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$Habitantes, "pexp",rate=lamda)
## 
##  Exact one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$Habitantes
## D = 0.24015, p-value = 0.001572
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Habitantes

# definir media y desviación estandar
mean_d <- 28759
sd_d <- 4451.127
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Habitantes,yygam,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 28759
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$Habitantes,yyexp,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Histogramas de Frecuencia Relativa y Densidad para la variable Mujeres Habitantes

hist(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,freq=F,ylab="Densidad",col="whitesmoke",ylim=c(0,0.0002),main="Distribución de frecuencias de Mujeres habitantes",xlab="Mujeres habitantes")
lines(density(TABLA_DE_DATOS_violencia_de_genero$MujeresHab),col="palevioletred4",lwd=3)
#definir media y desviación estandar
mean_d <- 13834
sd_d <- 2203.963
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
#calcular lamda
lamda <- 1/mean_d
# calcular el rango del eje 
Inferior <- min(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
Superior <- max(TABLA_DE_DATOS_violencia_de_genero$MujeresHab)
# curvas
curve(dexp(x,rate=lamda),Inferior, Superior,col="violetred",add=T,lwd=3)
curve(dgamma(x, shape = shape_d, scale = scale_d),Inferior,Superior,col="palevioletred",add=T,lwd=3)
legend("topright",col=c("palevioletred4","palevioletred", "violetred"),c("Densidad","Gamma teórica", "Exponencial teórica"),lty=1,lwd=3)

Prueba de hipótesis de Kolmogorov Smirnov para la variable Mujeres Habitantes

# definir media y desviación estandar
mean_d <- 13834
sd_d <- 2203.963
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, "pgamma",shape=shape_d, scale=scale_d)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$MujeresHab
## D = 0.7215, p-value < 0.00000000000000022
## alternative hypothesis: two-sided
#calcular lamda
mean_d <- 13834
lamda <- 1/mean_d
ks.test(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, "pexp",rate=lamda)
## Warning in ks.test.default(TABLA_DE_DATOS_violencia_de_genero$MujeresHab, :
## ties should not be present for the one-sample Kolmogorov-Smirnov test
## 
##  Asymptotic one-sample Kolmogorov-Smirnov test
## 
## data:  TABLA_DE_DATOS_violencia_de_genero$MujeresHab
## D = 0.2426, p-value = 0.001713
## alternative hypothesis: two-sided

Gráfico de cuantiles teóricos vs cuantiles muestrales para la variable Mujeres Habitantes

# definir media y desviación estandar
mean_d <- 13834
sd_d <- 2203.963
# calcular la forma y escala para gamma
shape_d <- (mean_d / sd_d)^2
scale_d <- (sd_d^2) / mean_d
yygam=rgamma(60,shape=shape_d,scale=scale_d)
qqplot(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,yygam,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Gamma)", main = "Gráfico Q-Q para distribución Gamma")

#calcular lamda
mean_d <- 13834
lamda <- 1/mean_d
yyexp=rexp(60,lamda)
qqplot(TABLA_DE_DATOS_violencia_de_genero$MujeresHab,yyexp,col="violetred3", xlab = "Datos observados (Habitantes)",ylab = "Datos simulados (Exponencial)", main = "Gráfico Q-Q para distribución Exponencial")

Análisis

Análisis de las distribuciones de cada variable

Teniendo en cuenta que la función K-S test compara la distribución empírica de una muestra con una distribución teórica, la hipótesis nula que en este caso es que la variable sigue la distribución teórica especificada (gamma o beta, según nuestra observación), la hipótesis alternativa que consecuentemente sería que la variable no sigue dicha distribución y que un p-valor bajo < 0.05 implica que hay evidencia significativa para rechazar H₀, es decir, los datos no se ajustan a la distribución teórica, como paso en todas nuestras variables analizadas, podemos decir que:

Tasa de desempleo femenino

Según el histograma y sus características propusimos una distribución Beta para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, lo que puede deberse a que puede estar mejor ajustada a otra distribución continua como una normal truncada o una logit-normal (temas aún no vistos y dominados en este curso).

Casos de violencia 2024 y 2023

Según el histograma y sus características propusimos una distribución Gamma para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución a pesar de la asimetría y forma visual típica de una Gamma, esto puede deberse a que los valores atípicos extremos afectan el ajuste, por lo que es posible que una distribución como la log-normal o Weibull funcione mejor (temas aún no vistos y dominados en este curso).

Llamadas a la línea 155 - 2024 y 2023

Según el histograma y sus características propusimos una distribución Gamma para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, puede ser porque hay alto sesgo positivo pero también un núcleo de valores moderados y pocos valores muy extremos que pueden afectar el ajuste, alternativamente podría funcionar una log-normal o una exponencial generalizada (temas aún no vistos y dominados en este curso).

Denuncias formales 2024 y 2023

Según el histograma y sus características propusimos una distribución Gamma para esta variable, sin embargo el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, aunque visualmente pueda parecerse a una Gamma, los datos reales tienen más dispersión o irregularidades que la gamma no modela bien, también puede deberse a que hay fuerte subregistro en la mayoría de municipios, y concentración de denuncias en pocos municipios, lo que rompe la suposición de homogeneidad de la gamma.

Habitantes y Mujeres Habitantes

Aunque claramente son variables asimétricas y visualmente asignamos una distribución Gamma, el resultado del K-S test (p-valor bajo) rechaza que siga esta distribución, lo que puede deberse a valores extremadamente altos en pocos municipios (como Soacha, Facatativá, Mosquera), lo que distorsiona la forma gamma. Alternativamente se podrían hacer transformaciones logarítmicas, modelos mixtos o incluso distribución Pareto (temas aún no vistos y dominados en este curso).

En conclusión, aunque visualmente algunas variables parecían ajustarse a distribuciones teóricas específicas, los resultados obtenidos mediante las pruebas de Kolmogorov-Smirnov indican que ninguna de estas variables se ajusta estadísticamente a las distribuciones planteadas. Esto se evidencia en los valores p significativamente bajos, que nos llevan a rechazar la hipótesis nula de que los datos siguen las distribuciones teóricas propuestas. Esto refleja que, aunque las formas visuales de los histogramas pueden orientar inicialmente la elección de una distribución, la validación estadística es indispensable, ya que muchos de los datos presentan alta asimetría, valores extremos y gran dispersión como es nuestro caso, lo cual rompe con los supuestos de las distribuciones ideales.

Análisis de cuantiles de cada variable

Teniendo en cuenta que el Q-Q plot compara los cuantiles teóricos de una distribución propuesta con los cuantiles observados en los datos, si los datos siguen dicha distribución, los puntos se alinean aproximadamente sobre la diagonal, por lo que sí hay puntos alineados significa una buena concordancia con la distribución, por el contrario si hay una curvatura o desviación significa una mala concordancia y por último si hay colas desviadas sugiere que hay outliers o distribución más pesada o asimétrica.

Desempleo femenino

Para esta variable el Q-Q plot muestra ligeras desviaciones en las colas, donde los puntos del extremo inferior y superior se alejan de la línea y un centro más ajustado. Por lo que si bien la beta parecía adecuada por estar acotada entre 0 y 1, el Q-Q plot evidencia que no se ajusta bien en los extremos, ya que probablemente hay municipios con tasas de desempleo muy altas o muy bajas que distorsionan el patrón esperado.

Casos de violencia 2024 y 2023

Para esta variable el Q-Q plot muestra una gran dispersión en la parte superior derecha y una curvatura en la cola superior (cola pesada). Este comportamiento en los extremos sugiere que hay valores atípicos o municipios con poblaciones desproporcionadamente altas, que rompen la forma teórica Gamma, que aunque parecía moldear bien no está captando correctamente la magnitud de estos casos extremos.

Llamadas a la línea 155 - 2024 y 2023

Para esta variable el Q-Q plot muestra un comportamiento similar a los casos de violencia, es decir una cola derecha muy dispersa, con un centro más ajustado pero aún con desviaciones, lo que permite establecer que el número de llamadas presenta una variabilidad muy alta y valores extremos que afectan el ajuste gamma y el Q-Q plot sugiere que sólo los valores intermedios siguen algo la distribución teórica (los extremos se escapan del modelo).

Denuncias formales 2024 y 2023

Para esta variable el Q-Q plot muestra muchos puntos por debajo de la diagonal en los extremos y colas muy pesadas, lo que refleja que la mayoría de municipios tienen muy pocas denuncias, y unos pocos tienen números muy altos que la distribución gamma no logra modelar adecuadamente.

Habitantes y Mujeres Habitantes

Para esta variable el Q-Q plot muestra una curvatura clara hacia arriba en los cuantiles superiores, lo que indica que los datos tienen una cola más pesada de lo que la gamma puede modelar. La concentración de población en pocos municipios como Soacha, Mosquera o Facatativá genera outliers demográficos y el Q-Q plot deja claro que la Gamma subestima la magnitud de estos extremos.

En conclusión, los Q-Q plots permiten visualizar que, aunque se intentó ajustar distribuciones como Beta o Gamma a las variables, existen desviaciones sistemáticas, especialmente en los extremos (colas), que impiden considerar un buen ajuste estadístico. Esto indica que modelos más flexibles o más especializados para casos particulares, serían más adecuados para representar la complejidad del fenómeno.

Conclusiones finales

Este proyecto permitió evidenciar cómo la violencia de género en Cundinamarca se manifiesta de forma desigual entre municipios, con mayores registros en zonas urbanas debido a una mayor visibilidad y acceso a mecanismos de denuncia, y cifras más bajas en regiones donde persisten barreras institucionales, sociales y geográficas que dificultan el reporte.

El análisis estadístico y probabilístico reveló que, aunque algunas variables parecían ajustarse visualmente a distribuciones teóricas como la gamma o la beta, las pruebas estadísticas (K-S test y Q-Q plots) mostraron que ninguna se ajusta de manera adecuada. Esto se debe a la alta asimetría, presencia de valores extremos y dispersión en los datos, lo cual resalta la necesidad de emplear modelos más flexibles y específicos en estudios futuros. El enfoque metodológico utilizado, que combinó herramientas descriptivas y pruebas de ajuste, fue clave para contrastar intuiciones iniciales y descubrir patrones menos evidentes.

Este trabajo confirma que la violencia de género está profundamente ligada a desigualdades estructurales que se expresan de forma distinta según el contexto local, y que su análisis requiere tanto una mirada territorial como un enfoque estadístico riguroso. Aunque el estudio ofrece hallazgos relevantes, se reconocen limitaciones derivadas del nivel técnico alcanzado en el curso y de la calidad y cobertura de los datos disponibles.

Frente a esta evidencia, es necesario que las estrategias institucionales de atención y prevención se adapten a las realidades particulares de cada municipio, con especial énfasis en aquellos más invisibilizados, para garantizar respuestas más equitativas, accesibles y eficaces.