BANCO DE DATOS

Se han tomado los datos del paquete “Openintro” del banco de datos “USArrests” en el cual se clasifican los arrestos realizados en los 50 estados de Estados Unidos en 1973, estos se han clasificado en crimenes por asesinato, agresion y violacion. Dichos datos son representados cada 10.000 habitantes, es decir, se muestra los arrestos cada 10.000 habitantes clasificados por causa.

a) Aquí vemos la matriz de diagrama de dispersion.

pairs(USArrests)


 Con este comando en R vemos una serie de graficas con varios puntos y reflejan que los crimenes por asesinato y agresión poseen una relacion lineal.

b) Al usar el siguiente comando vemos la matriz de correlacion entre los distintos crimenes cometidos

  > cor(USArrests)
             Murder   Assault   UrbanPop      Rape
Murder   1.00000000 0.8018733 0.06957262 0.5635788
Assault  0.80187331 1.0000000 0.25887170 0.6652412
UrbanPop 0.06957262 0.2588717 1.00000000 0.4113412
Rape     0.56357883 0.6652412 0.41134124 1.0000000

Aclaración: vemos que tambien hay un campo llamado “UrbanPop” que muestra el porcentaje de la poblacion que vive en zonas urbanas. Para este estudio vamos a omitir esos datos, pues no nos interesa analizarlos.

Al ver esta matriz de correlacion vemos que se confirma lo que vimos con la matriz de diagrama de dispersion pues los crimenes de asesinato y agresion son los que tienen el valor de correlacion mas alto(sin contar los que son consigo mismo, ej. murder-murder)

c) En este estudio vamos a centrarnos en cómo se desarrollan los crímenes de asesinato y agresion, por lo que vamos a ver ciertos datos específicos de cada uno de estos.

> mean(USArrests$Murder)
[1] 7.788
> sd(USArrests$Murder)
[1] 4.35551

Con este primer comando llegamos a la conclusion de que la media de las 50 muestras tomadas, es de 7.788 personas arrestadas por asesinato cada 10.000 habitantes. Vemos que es un numero muy alto, pues tasa de homicidios en España alcanzó en el año 2021 un valor de 0,61.

> mean(USArrests$Assault)
[1] 170.76
> sd(USArrests$Assault)
[1] 83.33766

En este caso vemos que la media supera con amplitud la dada en España durante el año 2021, que fue de 2.05 por cada 10.000 habitantes.

d) Ahora vamos a ver si se cumple la hipótesis de que ambos delitos tiene la misma media por cada 10.000 habitantes. \(H_o: \mu_m - \mu_a=0\)
\(H_1: \mu_m - \mu_a \neq 0\)

Al tener ya puesto el contraste vamos a ver si usamos test paramétricos o no
1. En enunciado no nos dice si sigue una distribucion normal
2. Pero la cantidad de datos es alta, pues es 50, así que usaremos test paramétricos

> length(USArrests$Murder)
[1] 50
> length(USArrests$Assault)
[1] 50

Procedemos a hacer los calculos

> X1_BARRA=mean(USArrests$Murder)
> sigma1=sd(USArrests$Murder)
> n1=length(USArrests$Murder)
> 
> X2_BARRA=mean(USArrests$Assault)
> sigma2=sd(USArrests$Assault)
> n2=length(USArrests$Assault)
> 
> Z_S=(X1_BARRA-X2_BARRA)/(sqrt(((sigma1)^2)/(n1))+sqrt(((sigma2)^2)/(n2)))
> 
> 
> Z_S
[1] -13.14112

Dado que estamos en la region critica al 95%, entonces \(Z_{\alpha/2}=1.96\) Ahora veremos si \(Z_S < -Z_{\alpha/2}\) o \(Z_s > Z_{\alpha/2}\) En esta caso se cumple la primera, pues -13.14112 < -1.96. Por lo tanto llegamos a la conclusión de que existe evidencia estadística que rechaza la hipótesis nula.

e) Con esto llegamos a la conclusion de que las medias de un crimen como otro no tienen nada que ver. Como adicion podemos decir que durante el 1973, en Estados unidos se produjeron una cantidad bastante alta de crimenes si los comparamos con los datos de España a dia de hoy. Hasta aquí llega el estudio que hemos realizado, acabamos con la siguiente cita:

“La delincuencia es simplemente un fracaso de la sociedad.” - H.G. Wells

 BIBLIOGRAFÍA
Fuente1: https://www.ine.es/ss/Satellite?L=es_ES&c=INESeccion_C&cid=1259945060213&p=1254735110672&pagename=ProductosYServicios%2FPYSLayout&param1=PYSDetalleFichaIndicador&param3=1259947308577#:~:text=En%20Espa%C3%B1a%2C%20la%20tasa%20de,un%20valor%20de%200%2C61.

 Fuente2: https://www.ine.es/consul/serie.do?d=true&s=CON3861
 Nota: en la fuente nos da numero total de personas arrestadas por agresion. Para calcular el ratio por 10.000 habitantes hacemos el siguiente calculo: Ratio = (9700 / 47.433.000) x 10.000 = 2,05 Siendo 9700, en numero de arrestos por ese delito y 47.433.000 el numero de habitantes.