Se han tomado los datos del paquete “Openintro” del banco de
datos “USArrests” en el cual se clasifican los arrestos
realizados en los 50 estados de Estados Unidos en 1973,
estos se han clasificado en crimenes por asesinato, agresion y
violacion. Dichos datos son representados cada 10.000
habitantes, es decir, se muestra los arrestos cada
10.000 habitantes clasificados por causa.
a) Aquí vemos la matriz de diagrama de
dispersion.
pairs(USArrests)
Con este comando en R vemos una serie de graficas con varios puntos
y reflejan que los crimenes por asesinato y agresión poseen una relacion
lineal.
b) Al usar el siguiente comando vemos la matriz de
correlacion entre los distintos crimenes
cometidos
> cor(USArrests)
Murder Assault UrbanPop Rape
Murder 1.00000000 0.8018733 0.06957262 0.5635788
Assault 0.80187331 1.0000000 0.25887170 0.6652412
UrbanPop 0.06957262 0.2588717 1.00000000 0.4113412
Rape 0.56357883 0.6652412 0.41134124 1.0000000
Aclaración: vemos que tambien hay un campo llamado “UrbanPop” que muestra el porcentaje de la poblacion que vive en zonas urbanas. Para este estudio vamos a omitir esos datos, pues no nos interesa analizarlos.
Al ver esta matriz de correlacion vemos que se confirma lo que vimos con la matriz de diagrama de dispersion pues los crimenes de asesinato y agresion son los que tienen el valor de correlacion mas alto(sin contar los que son consigo mismo, ej. murder-murder)
c) En este estudio vamos a centrarnos en cómo se desarrollan los crímenes de asesinato y agresion, por lo que vamos a ver ciertos datos específicos de cada uno de estos.
> mean(USArrests$Murder)
[1] 7.788
> sd(USArrests$Murder)
[1] 4.35551
Con este primer comando llegamos a la conclusion de que la media de
las 50 muestras tomadas, es de 7.788 personas arrestadas por asesinato
cada 10.000 habitantes. Vemos que es un numero muy alto, pues tasa de
homicidios en España alcanzó en el año 2021 un valor de 0,61.
> mean(USArrests$Assault)
[1] 170.76
> sd(USArrests$Assault)
[1] 83.33766
En este caso vemos que la media supera con amplitud la dada en España
durante el año 2021, que fue de 2.05 por cada 10.000 habitantes.
d) Ahora vamos a ver si se cumple la hipótesis de que ambos
delitos tiene la misma media por cada 10.000
habitantes. \(H_o: \mu_m -
\mu_a=0\)
\(H_1: \mu_m - \mu_a \neq 0\)
Al tener ya puesto el contraste vamos a ver si usamos test
paramétricos o no
1. En enunciado no nos dice si sigue una distribucion normal
2. Pero la cantidad de datos es alta, pues es 50, así que usaremos test
paramétricos
> length(USArrests$Murder)
[1] 50
> length(USArrests$Assault)
[1] 50
Procedemos a hacer los calculos
> X1_BARRA=mean(USArrests$Murder)
> sigma1=sd(USArrests$Murder)
> n1=length(USArrests$Murder)
>
> X2_BARRA=mean(USArrests$Assault)
> sigma2=sd(USArrests$Assault)
> n2=length(USArrests$Assault)
>
> Z_S=(X1_BARRA-X2_BARRA)/(sqrt(((sigma1)^2)/(n1))+sqrt(((sigma2)^2)/(n2)))
>
>
> Z_S
[1] -13.14112
Dado que estamos en la region critica al 95%, entonces \(Z_{\alpha/2}=1.96\) Ahora veremos si \(Z_S < -Z_{\alpha/2}\) o \(Z_s > Z_{\alpha/2}\) En esta caso se cumple la primera, pues -13.14112 < -1.96. Por lo tanto llegamos a la conclusión de que existe evidencia estadística que rechaza la hipótesis nula.
e) Con esto llegamos a la conclusion de que las medias de un
crimen como otro no tienen nada que ver.
Como adicion podemos decir que durante el 1973, en Estados
unidos se produjeron una cantidad bastante alta de
crimenes si los comparamos con los datos de España a
dia de hoy. Hasta aquí llega el estudio que hemos
realizado, acabamos con la siguiente cita:
“La delincuencia es simplemente un fracaso de la sociedad.” - H.G. Wells
BIBLIOGRAFÍA
Fuente1: https://www.ine.es/ss/Satellite?L=es_ES&c=INESeccion_C&cid=1259945060213&p=1254735110672&pagename=ProductosYServicios%2FPYSLayout¶m1=PYSDetalleFichaIndicador¶m3=1259947308577#:~:text=En%20Espa%C3%B1a%2C%20la%20tasa%20de,un%20valor%20de%200%2C61.
Fuente2: https://www.ine.es/consul/serie.do?d=true&s=CON3861
Nota: en la fuente nos da numero total de personas arrestadas por
agresion. Para calcular el ratio por 10.000 habitantes hacemos
el siguiente calculo: Ratio = (9700 / 47.433.000) x 10.000 =
2,05 Siendo 9700, en numero de arrestos por ese delito y
47.433.000 el numero de habitantes.