Los conocimientos adquiridos en la asignatura “Fundamentos estadísticos” impartida en en el posgrado de Maestría en Ciencias del Procesamiento de la Información son un conjunto de herramientas para el desarrollo de trabajos académicos, pero también lo son para coadyuvar en el desarrollo social. Como estudiantes de posgrado se tiene la responsabilidad de dar aportaciones que contribuyan en el entendimiento, mejora o fortalecimiento del desarrollo social.
El gobierno federal en su portal datos.gob.mx provee de datos en diferentes rubros, se ha elegido para trabajar el dataset “Incidencia delictiva por Delegación del año 2015 al 2017”[1] ya que la insidencia delictiva en las leyes abordadas en este dataset tienen impacto directo en la realidad mexicana. Para este análisis se han seleccionado solo los datos referentes al código penal federal (CPF) en delitos contra la salud.
La idea es dar un argumento respaldado en estudios estadísticos que puedan servir de referencia para que el ciudano común pueda conocer su realidad fuera de suposiciones subjetivas. Además tener una referencia de evaluación y rendimiento para comparar con el nuevo gobierno y sus políticas propuestas para mitigar el indice delictivo en estas leyes, que en los últimos años ha ido mermando en diversos aspectos la vida cotidiana del país.
Hipótesis: Se pretende analizar si el insidir en el delito de posesión del código penal federal (CPF) en delitos contra la salud provoca una posterior incidencia en otros delitos.
Objetivo secundario: Hacer un anáslsis respecto a la información del estado de Zacatecas y describir el indice delictivo del estado.
El dataset original[1] se ha preprocesado para solo trabajar (como ya se mencionó) con los datos referentes al código penal federal (CPF) en delitos contra la salud. A continuación se muestra el datase con dicho preprocesado ya realizado.
Se muestra algunas medidas de tendencia central sobre la información los resultados de las delegaciones estatales mensualmente durante los años 2015, 2016 y 2017
library(PerformanceAnalytics)
## Loading required package: xts
## Loading required package: zoo
##
## Attaching package: 'zoo'
## The following objects are masked from 'package:base':
##
## as.Date, as.Date.numeric
##
## Attaching package: 'PerformanceAnalytics'
## The following object is masked from 'package:graphics':
##
## legend
incidencia_delictiva <- read.csv("~/Documents/MCPI/Estadistica/Tarea Final/INCIDENCIA_DELICTIVA_FEDERAL_2015 - 2017.csv")
summary(incidencia_delictiva)
## Fecha Delegación Producción Transporte
## 2015-01: 33 AGUASCALIENTES : 36 Min. : 0.000 Min. : 0.00
## 2015-02: 33 BAJA CALIFORNIA : 36 1st Qu.: 0.000 1st Qu.: 0.00
## 2015-03: 33 BAJA CALIFORNIA SUR: 36 Median : 0.000 Median : 1.00
## 2015-04: 33 CAMPECHE : 36 Mean : 1.562 Mean : 2.29
## 2015-05: 33 CHIAPAS : 36 3rd Qu.: 2.000 3rd Qu.: 3.00
## 2015-06: 33 CHIHUAHUA : 36 Max. :50.000 Max. :26.00
## (Other):990 (Other) :972
## Tráfico Comercio Suministro Posesión
## Min. : 0.0000 Min. : 0.000 Min. :0.00000 Min. : 0.000
## 1st Qu.: 0.0000 1st Qu.: 0.000 1st Qu.:0.00000 1st Qu.: 1.000
## Median : 0.0000 Median : 0.000 Median :0.00000 Median : 3.000
## Mean : 0.1852 Mean : 1.857 Mean :0.08165 Mean : 8.242
## 3rd Qu.: 0.0000 3rd Qu.: 2.000 3rd Qu.:0.00000 3rd Qu.: 9.250
## Max. :38.0000 Max. :48.000 Max. :4.00000 Max. :90.000
##
## Otros Contra.la.integridad.corporal
## Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.000 1st Qu.: 0.000
## Median : 1.000 Median : 0.000
## Mean : 3.657 Mean : 1.321
## 3rd Qu.: 4.000 3rd Qu.: 2.000
## Max. :55.000 Max. :73.000
##
## Ley.Federal.de.Armas.de.Fuego.y.Explosivos Narcomenudeo
## Min. : 0.00 Min. : 0.000
## 1st Qu.: 11.00 1st Qu.: 0.000
## Median : 23.00 Median : 1.000
## Mean : 35.22 Mean : 3.881
## 3rd Qu.: 56.00 3rd Qu.: 4.000
## Max. :244.00 Max. :99.000
##
## Ley.General.de.Salud_LGS Delincuencia.Organizada
## Min. : 0.0000 Min. :0.00000
## 1st Qu.: 0.0000 1st Qu.:0.00000
## Median : 0.0000 Median :0.00000
## Mean : 0.8426 Mean :0.07323
## 3rd Qu.: 1.0000 3rd Qu.:0.00000
## Max. :19.0000 Max. :3.00000
##
#erase NAs
incidencia_delictiva<- incidencia_delictiva[complete.cases(incidencia_delictiva),]
Extrayendo la correlación entre variables, se puede ver como la insidencia en un delito se esta proclive en cometer los otros debido a que tan relacionados están bansadose en el coeficiente de Pearson. El estadístico paramétrico Coeficiente de Correlación de Pearson es adecuada cuando las observaciones de unidades maestreadas aleatoriamente, están medidas en escalas de intervalos [2].
library(corrplot)
## corrplot 0.84 loaded
res<-cor(incidencia_delictiva[,3:14], method = c("pearson"))
corrplot(res,type = "upper", order = "hclust",
tl.col = "black", tl.srt = 55)
En ese gráfico se puede observar que para el delito de posesión esta correlacionado con la insidencia en la ley de armas de fuego y explosivos, también con comercio, narcomenudeo y otros, delitos pertenecientes a la ley general de salud.
En el siguiente gráfico se muestra la correlación entre los delitos de posesión y la insidencia de la ley de armas de fuego y explosivos:
dat1 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Ley.Federal.de.Armas.de.Fuego.y.Explosivos)
chart.Correlation(dat1)
En el siguiente gráfico se muestra la correlación entre los delitos de posesión y comercio:
dat2 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Comercio)
chart.Correlation(dat2)
En el siguiente gráfico se muestra la correlación entre los delitos de posesión y narcomenudeo:
dat3 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Narcomenudeo)
chart.Correlation(dat3)
En el siguiente gráfico se muestra la correlación entre los delitos de posesión y comercio:
dat4 <- data.frame(incidencia_delictiva$Posesión,incidencia_delictiva$Otros)
chart.Correlation(dat4)
Cómo puede observarse en los graficos el delito de posesión en realidad está poco relacionado con otros delitos. Siendo la correlación más alta entre posesión y la ley de armas de fuego y explosivos, con un valor de 0.69 será el valor de correlación más alto pero poco signficativo.
Para saber por que el coeficiente de correlación de Pearson se analiza la distribución de los datos, estas distribuciones se muestran a continuación:
Distribución del delito de Posesión:
Distribución del delito de la ley de armas de fuego y explosivos:
Distribución del delito de la comercio:
Distribución del delito de la narcomenudeo:
Distribución del delito de otros:
Como puede observarse estas variables no tienen distribución gaussiana (tienen una distribución más aporximada a Ji cuadrado), es por ello que el indice de correlación de Person son poco significativos. Estos indices de correlación no justifican un modelado de predicción lineal y tampoco usar T-test ya que las variables estan poco correlacionadas y no tienen distribución normal.
Estos datos de baja incidencia y poca correlación como se mostró anteriormente son candidatos pobres para un clustering, pero se implementará k-means buscando alguna agrupacion entre los datos
En el gráfico anterior se muestran 4 clusters pero si hizo pruebas de 3 a 32 clusters y no se llego a una clusterización concluyente corroborando que los datos no son canditatos a este algoritmo de agrupación no supervisada. ## Zacatecas En esta sección se pretende hacer un análisis de indice delictivo estatal para dar una prespectiva delos datos mensuales durante los tres años mencionados.
## Fecha Delegación Producción Transporte
## 2015-01: 1 ZACATECAS :36 Min. :0.0000 Min. :0.000
## 2015-02: 1 AGUASCALIENTES : 0 1st Qu.:0.0000 1st Qu.:0.000
## 2015-03: 1 BAJA CALIFORNIA : 0 Median :0.0000 Median :1.000
## 2015-04: 1 BAJA CALIFORNIA SUR: 0 Mean :0.6667 Mean :1.556
## 2015-05: 1 CAMPECHE : 0 3rd Qu.:1.0000 3rd Qu.:3.000
## 2015-06: 1 CHIAPAS : 0 Max. :3.0000 Max. :5.000
## (Other):30 (Other) : 0
## Tráfico Comercio Suministro Posesión
## Min. :0.0000 Min. :0.0000 Min. :0.00000 Min. :0.000
## 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:0.00000 1st Qu.:0.000
## Median :0.0000 Median :0.0000 Median :0.00000 Median :1.000
## Mean :0.1667 Mean :0.2222 Mean :0.02778 Mean :1.306
## 3rd Qu.:0.0000 3rd Qu.:0.0000 3rd Qu.:0.00000 3rd Qu.:2.000
## Max. :3.0000 Max. :2.0000 Max. :1.00000 Max. :4.000
##
## Otros Contra.la.integridad.corporal
## Min. :0.0000 Min. :0.0000
## 1st Qu.:0.0000 1st Qu.:0.0000
## Median :0.0000 Median :0.0000
## Mean :0.4167 Mean :0.1667
## 3rd Qu.:1.0000 3rd Qu.:0.0000
## Max. :3.0000 Max. :1.0000
##
## Ley.Federal.de.Armas.de.Fuego.y.Explosivos Narcomenudeo
## Min. : 7.00 Min. :0.0000
## 1st Qu.:11.75 1st Qu.:0.0000
## Median :13.50 Median :0.0000
## Mean :14.92 Mean :0.6389
## 3rd Qu.:17.50 3rd Qu.:1.0000
## Max. :29.00 Max. :3.0000
##
## Ley.General.de.Salud_LGS Delincuencia.Organizada
## Min. :0.0000 Min. :0.00000
## 1st Qu.:0.0000 1st Qu.:0.00000
## Median :0.0000 Median :0.00000
## Mean :0.1111 Mean :0.02778
## 3rd Qu.:0.0000 3rd Qu.:0.00000
## Max. :2.0000 Max. :1.00000
##
Se muestra la desviación estándar de insidencia delictiva mensual de cada delito:
## Producción
## 0.9561829
## Transporte
## 1.5013222
## Tráfico
## 0.5606119
## Comercio
## 0.4846861
## Suministro
## 0.1666667
## Posesión
## 1.1166134
## Otros
## 0.7699722
## Contra.la.integridad.corporal
## 0.3779645
## Ley.Federal.de.Armas.de.Fuego.y.Explosivos
## 5.3096946
## Narcomenudeo
## 0.8992943
## Ley.General.de.Salud_LGS
## 0.3984095
## Delincuencia.Organizada
## 0.1666667
Como puede observarse Transporte, Posesión, ley de federal de armas de fuego y explosivos son los que tienen media más alta. En los siguientes gráficos se muestra el histograma de cada una de estas para observar de manera gráfica el comportamiento que ha tenido durante 2015, 2016 y 2017.
## Loading required package: ggplot2
## Loading required package: magrittr
Estos datos muestran una incidencia baja en el periodo 2015 a 2017 según los datos registrados por el dataset que provee el gobierno federal [1].
Para la hipótesis planteada inicialmente se conclye que la hipótesis es rechazada ya que los datos no presentan correlacion y tampoco son favorables para clustring a partir del delito de posesión.
Es importante este resultado ya que mediante análisis estadístico se ha llegado a la conclusión que si una persona inside en el delito de posesión del código penal federal (CPF) en delitos contra la salud no necesariamente provoca una posterior incidencia en otros delitos, lo cual muchas veces es un prejucio social que mediante las herramientas utilizadas en este análisis se ha demostrado que es falso.
En cuanto a la información para el estado de Zacatecas es inferior a la deseable pero al igual que el análisis a todo al dataset completo no presentan correlacion y tampoco son favorables para clustring,
[1] Incidencia delictiva por Delegación del año 2015 al 2017. Consultado en enero del 2019: https://datos.gob.mx/busca/dataset/incidencia-delictiva-pgr/resource/58ad9b50-3aaf-4bf0-b905-ca26e9e07bd3
[2] Correlación y Regresión Lineal. Consultado en enero del 2019: https://rpubs.com/osoramirez/316691
[3] Statistics in a Nutshell, Second Edition. Autor: Sarah Boslaugh. ublished by O’Reilly Media, Inc., 1005 Gravenstein Highway North, Sebastopol, CA 95472.