Introducción

Los conocimientos adquiridos en la asignatura “Fundamentos estadísticos” impartida en en el posgrado de Maestría en Ciencias del Procesamiento de la Información son un conjunto de herramientas para el desarrollo de trabajos académicos, pero también lo son para coadyuvar en el desarrollo social. Como estudiantes de posgrado se tiene la responsabilidad de dar aportaciones que contribuyan en el entendimiento, mejora o fortalecimiento del desarrollo social.

El gobierno federal en su portal datos.gob.mx provee de datos en diferentes rubros, se ha elegido para trabajar el dataset “Incidencia delictiva por Delegación del año 2015 al 2017”[1] ya que la insidencia delictiva en las leyes abordadas en este dataset tienen impacto directo en la realidad mexicana. Para este análisis se han seleccionado solo los datos referentes al código penal federal (CPF) en delitos contra la salud.

La idea es dar un argumento respaldado en estudios estadísticos que puedan servir de referencia para que el ciudano común pueda conocer su realidad fuera de suposiciones subjetivas. Además tener una referencia de evaluación y rendimiento para comparar con el nuevo gobierno y sus políticas propuestas para mitigar el indice delictivo en estas leyes, que en los últimos años ha ido mermando en diversos aspectos la vida cotidiana del país.

Objetivos

Hipótesis: Se pretende analizar si el insidir en el delito de posesión del código penal federal (CPF) en delitos contra la salud provoca una posterior incidencia en otros delitos.

Objetivo secundario: Hacer un anáslsis respecto a la información del estado de Zacatecas y describir el indice delictivo del estado.

Presentación de la información

El dataset original[1] se ha preprocesado para solo trabajar (como ya se mencionó) con los datos referentes al código penal federal (CPF) en delitos contra la salud. A continuación se muestra el datase con dicho preprocesado ya realizado.

Se muestra algunas medidas de tendencia central sobre la información los resultados de las delegaciones estatales mensualmente durante los años 2015, 2016 y 2017

library(PerformanceAnalytics)
## Loading required package: xts
## Loading required package: zoo
## 
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
## 
##     as.Date, as.Date.numeric
## 
## Attaching package: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
## 
##     legend
incidencia_delictiva <- read.csv("~/Documents/MCPI/Estadistica/Tarea Final/INCIDENCIA_DELICTIVA_FEDERAL_2015 - 2017.csv")
summary(incidencia_delictiva)
##      Fecha                   Delegación    Producción       Transporte   
##  2015-01: 33   AGUASCALIENTES     : 36   Min.   : 0.000   Min.   : 0.00  
##  2015-02: 33   BAJA CALIFORNIA    : 36   1st Qu.: 0.000   1st Qu.: 0.00  
##  2015-03: 33   BAJA CALIFORNIA SUR: 36   Median : 0.000   Median : 1.00  
##  2015-04: 33   CAMPECHE           : 36   Mean   : 1.562   Mean   : 2.29  
##  2015-05: 33   CHIAPAS            : 36   3rd Qu.: 2.000   3rd Qu.: 3.00  
##  2015-06: 33   CHIHUAHUA          : 36   Max.   :50.000   Max.   :26.00  
##  (Other):990   (Other)            :972                                   
##     Tráfico           Comercio        Suministro         Posesión     
##  Min.   : 0.0000   Min.   : 0.000   Min.   :0.00000   Min.   : 0.000  
##  1st Qu.: 0.0000   1st Qu.: 0.000   1st Qu.:0.00000   1st Qu.: 1.000  
##  Median : 0.0000   Median : 0.000   Median :0.00000   Median : 3.000  
##  Mean   : 0.1852   Mean   : 1.857   Mean   :0.08165   Mean   : 8.242  
##  3rd Qu.: 0.0000   3rd Qu.: 2.000   3rd Qu.:0.00000   3rd Qu.: 9.250  
##  Max.   :38.0000   Max.   :48.000   Max.   :4.00000   Max.   :90.000  
##                                                                       
##      Otros        Contra.la.integridad.corporal
##  Min.   : 0.000   Min.   : 0.000               
##  1st Qu.: 0.000   1st Qu.: 0.000               
##  Median : 1.000   Median : 0.000               
##  Mean   : 3.657   Mean   : 1.321               
##  3rd Qu.: 4.000   3rd Qu.: 2.000               
##  Max.   :55.000   Max.   :73.000               
##                                                
##  Ley.Federal.de.Armas.de.Fuego.y.Explosivos  Narcomenudeo   
##  Min.   :  0.00                             Min.   : 0.000  
##  1st Qu.: 11.00                             1st Qu.: 0.000  
##  Median : 23.00                             Median : 1.000  
##  Mean   : 35.22                             Mean   : 3.881  
##  3rd Qu.: 56.00                             3rd Qu.: 4.000  
##  Max.   :244.00                             Max.   :99.000  
##                                                             
##  Ley.General.de.Salud_LGS Delincuencia.Organizada
##  Min.   : 0.0000          Min.   :0.00000        
##  1st Qu.: 0.0000          1st Qu.:0.00000        
##  Median : 0.0000          Median :0.00000        
##  Mean   : 0.8426          Mean   :0.07323        
##  3rd Qu.: 1.0000          3rd Qu.:0.00000        
##  Max.   :19.0000          Max.   :3.00000        
## 
#erase NAs
incidencia_delictiva<- incidencia_delictiva[complete.cases(incidencia_delictiva),]

Correlación de datos

Extrayendo la correlación entre variables, se puede ver como la insidencia en un delito se esta proclive en cometer los otros debido a que tan relacionados están bansadose en el coeficiente de Pearson. El estadístico paramétrico Coeficiente de Correlación de Pearson es adecuada cuando las observaciones de unidades maestreadas aleatoriamente, están medidas en escalas de intervalos [2].

library(corrplot)
## corrplot 0.84 loaded
res<-cor(incidencia_delictiva[,3:14], method = c("pearson"))
corrplot(res,type = "upper", order = "hclust", 
         tl.col = "black", tl.srt = 55)

En ese gráfico se puede observar que para el delito de posesión esta correlacionado con la insidencia en la ley de armas de fuego y explosivos, también con comercio, narcomenudeo y otros, delitos pertenecientes a la ley general de salud.

En el siguiente gráfico se muestra la correlación entre los delitos de posesión y la insidencia de la ley de armas de fuego y explosivos:

dat1 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Ley.Federal.de.Armas.de.Fuego.y.Explosivos)
chart.Correlation(dat1)

En el siguiente gráfico se muestra la correlación entre los delitos de posesión y comercio:

dat2 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Comercio)
chart.Correlation(dat2)

En el siguiente gráfico se muestra la correlación entre los delitos de posesión y narcomenudeo:

dat3 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Narcomenudeo)
chart.Correlation(dat3)

En el siguiente gráfico se muestra la correlación entre los delitos de posesión y comercio:

dat4 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Otros)
chart.Correlation(dat4)

Cómo puede observarse en los graficos el delito de posesión en realidad está poco relacionado con otros delitos. Siendo la correlación más alta entre posesión y la ley de armas de fuego y explosivos, con un valor de 0.69 será el valor de correlación más alto pero poco signficativo.

Para saber por que el coeficiente de correlación de Pearson se analiza la distribución de los datos, estas distribuciones se muestran a continuación:

Distribución del delito de Posesión:

Distribución del delito de la ley de armas de fuego y explosivos:

Distribución del delito de la comercio:

Distribución del delito de la narcomenudeo:

Distribución del delito de otros:

Como puede observarse estas variables no tienen distribución gaussiana (tienen una distribución más aporximada a Ji cuadrado), es por ello que el indice de correlación de Person son poco significativos. Estos indices de correlación no justifican un modelado de predicción lineal y tampoco usar T-test ya que las variables estan poco correlacionadas y no tienen distribución normal.

Estos datos de baja incidencia y poca correlación como se mostró anteriormente son candidatos pobres para un clustering, pero se implementará k-means buscando alguna agrupacion entre los datos

En el gráfico anterior se muestran 4 clusters pero si hizo pruebas de 3 a 32 clusters y no se llego a una clusterización concluyente corroborando que los datos no son canditatos a este algoritmo de agrupación no supervisada. ## Zacatecas En esta sección se pretende hacer un análisis de indice delictivo estatal para dar una prespectiva delos datos mensuales durante los tres años mencionados.

##      Fecha                  Delegación   Producción       Transporte   
##  2015-01: 1   ZACATECAS          :36   Min.   :0.0000   Min.   :0.000  
##  2015-02: 1   AGUASCALIENTES     : 0   1st Qu.:0.0000   1st Qu.:0.000  
##  2015-03: 1   BAJA CALIFORNIA    : 0   Median :0.0000   Median :1.000  
##  2015-04: 1   BAJA CALIFORNIA SUR: 0   Mean   :0.6667   Mean   :1.556  
##  2015-05: 1   CAMPECHE           : 0   3rd Qu.:1.0000   3rd Qu.:3.000  
##  2015-06: 1   CHIAPAS            : 0   Max.   :3.0000   Max.   :5.000  
##  (Other):30   (Other)            : 0                                   
##     Tráfico          Comercio        Suministro         Posesión    
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.00000   Min.   :0.000  
##  1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:0.00000   1st Qu.:0.000  
##  Median :0.0000   Median :0.0000   Median :0.00000   Median :1.000  
##  Mean   :0.1667   Mean   :0.2222   Mean   :0.02778   Mean   :1.306  
##  3rd Qu.:0.0000   3rd Qu.:0.0000   3rd Qu.:0.00000   3rd Qu.:2.000  
##  Max.   :3.0000   Max.   :2.0000   Max.   :1.00000   Max.   :4.000  
##                                                                     
##      Otros        Contra.la.integridad.corporal
##  Min.   :0.0000   Min.   :0.0000               
##  1st Qu.:0.0000   1st Qu.:0.0000               
##  Median :0.0000   Median :0.0000               
##  Mean   :0.4167   Mean   :0.1667               
##  3rd Qu.:1.0000   3rd Qu.:0.0000               
##  Max.   :3.0000   Max.   :1.0000               
##                                                
##  Ley.Federal.de.Armas.de.Fuego.y.Explosivos  Narcomenudeo   
##  Min.   : 7.00                              Min.   :0.0000  
##  1st Qu.:11.75                              1st Qu.:0.0000  
##  Median :13.50                              Median :0.0000  
##  Mean   :14.92                              Mean   :0.6389  
##  3rd Qu.:17.50                              3rd Qu.:1.0000  
##  Max.   :29.00                              Max.   :3.0000  
##                                                             
##  Ley.General.de.Salud_LGS Delincuencia.Organizada
##  Min.   :0.0000           Min.   :0.00000        
##  1st Qu.:0.0000           1st Qu.:0.00000        
##  Median :0.0000           Median :0.00000        
##  Mean   :0.1111           Mean   :0.02778        
##  3rd Qu.:0.0000           3rd Qu.:0.00000        
##  Max.   :2.0000           Max.   :1.00000        
## 

Se muestra la desviación estándar de insidencia delictiva mensual de cada delito:

##                                 Producción 
##                                  0.9561829 
##                                 Transporte 
##                                  1.5013222 
##                                    Tráfico 
##                                  0.5606119 
##                                   Comercio 
##                                  0.4846861 
##                                 Suministro 
##                                  0.1666667 
##                                   Posesión 
##                                  1.1166134 
##                                      Otros 
##                                  0.7699722 
##              Contra.la.integridad.corporal 
##                                  0.3779645 
## Ley.Federal.de.Armas.de.Fuego.y.Explosivos 
##                                  5.3096946 
##                               Narcomenudeo 
##                                  0.8992943 
##                   Ley.General.de.Salud_LGS 
##                                  0.3984095 
##                    Delincuencia.Organizada 
##                                  0.1666667

Como puede observarse Transporte, Posesión, ley de federal de armas de fuego y explosivos son los que tienen media más alta. En los siguientes gráficos se muestra el histograma de cada una de estas para observar de manera gráfica el comportamiento que ha tenido durante 2015, 2016 y 2017.

## Loading required package: ggplot2
## Loading required package: magrittr

Estos datos muestran una incidencia baja en el periodo 2015 a 2017 según los datos registrados por el dataset que provee el gobierno federal [1].

CONCLUSIONES

Para la hipótesis planteada inicialmente se conclye que la hipótesis es rechazada ya que los datos no presentan correlacion y tampoco son favorables para clustring a partir del delito de posesión.

Es importante este resultado ya que mediante análisis estadístico se ha llegado a la conclusión que si una persona inside en el delito de posesión del código penal federal (CPF) en delitos contra la salud no necesariamente provoca una posterior incidencia en otros delitos, lo cual muchas veces es un prejucio social que mediante las herramientas utilizadas en este análisis se ha demostrado que es falso.

En cuanto a la información para el estado de Zacatecas es inferior a la deseable pero al igual que el análisis a todo al dataset completo no presentan correlacion y tampoco son favorables para clustring,

FUENTES

[1] Incidencia delictiva por Delegación del año 2015 al 2017. Consultado en enero del 2019: https://datos.gob.mx/busca/dataset/incidencia-delictiva-pgr/resource/58ad9b50-3aaf-4bf0-b905-ca26e9e07bd3

[2] Correlación y Regresión Lineal. Consultado en enero del 2019: https://rpubs.com/osoramirez/316691

[3] Statistics in a Nutshell, Second Edition. Autor: Sarah Boslaugh. ublished by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472.