Analisis
1.Reconocer los departamentos y municipios mas vulnerables por los Delitos dentro de Guatemala
dataset%>%
group_by(Departmento) %>%
summarise(cantidad=n())%>%
arrange(-cantidad)
Grafica de Cantidad de Delitos por Departamento
dataset%>%
group_by(Departmento) %>%
summarise(cantidad=n())%>%
arrange(-cantidad)%>%
ggplot(aes(x=reorder(Departmento,cantidad), y=cantidad))+
geom_bar(stat="identity",color = 'darkslategray', fill = 'steelblue') +
ggtitle ("Cantidad de Delitos por Departamento") + # Título del gráfico
theme (plot.title = element_text(size=rel(2), #Tamaño relativo de la letra del título
vjust=2, #Justificación vertical, para separarlo del gráfico
face="bold",
color="blue", #Color del texto
lineheight=1.5))+
geom_text(aes(label=cantidad), position=position_dodge(width=0.5), vjust=0.5)+
coord_flip()

Analisis Descriptivo
dataset %>%
group_by(Departmento) %>%
summarise(cantidad=n())%>%
summary()
Departmento cantidad
Length:22 Min. : 223.0
Class :character 1st Qu.: 682.5
Mode :character Median : 768.0
Mean : 1565.9
3rd Qu.: 991.8
Max. :15744.0
Municipios mas peligrosos de Guatemala
dataset%>%
group_by(Municipio) %>%
summarise(cantidad=n())%>%
arrange(-cantidad)
Grafica de Cantidad de Delitos por Municipio
dataset%>%
group_by(Municipio) %>%
summarise(cantidad=n())%>%
arrange(-cantidad)%>%
head(10) %>%
ggplot(aes(x=reorder(Municipio,cantidad), y=cantidad))+
geom_bar(stat="identity",color = 'darkslategray', fill = 'steelblue') +
ggtitle ("Cantidad de Delitos por Municipio") + # Título del gráfico
theme (plot.title = element_text(size=rel(2), #Tamaño relativo de la letra del título
vjust=2, #Justificación vertical, para separarlo del gráfico
face="bold",
color="blue", #Color del texto
lineheight=1.5))+
geom_text(aes(label=cantidad), position=position_dodge(width=0.5), vjust=0.5)+
coord_flip()

NA
NA
NA
NA
NA
Analisis Descriptivo
dataset %>%
group_by(Municipio) %>%
summarise(cantidad=n())%>%
summary()
Municipio cantidad
Length:333 Min. : 1.0
Class :character 1st Qu.: 13.0
Mode :character Median : 29.0
Mean : 103.5
3rd Qu.: 59.0
Max. :7535.0
*Conclusion 1: El departamento y Municipio de Guatemala son los lugares mas peligrosos, estando en el ranking como el 1er lugar en ambas evaluaciones. En la poblacion a nivel Departamental tenemos una mediana de 768 delitos por departamento y de 29 por municipio, tomamos la mediana dado que los datos son muy dispersos por la diferencia que tenemos respecto al departamento/Municipio de Guatemala y el resto de areas.
2.Reconocer cual es el departamento/municipio con menor cantidad de Delitos
dataset%>%
group_by(Departmento) %>%
summarise(cantidad=n())%>%
arrange(cantidad)
Grafica de Cantidad de Delitos por Departamento
dataset%>%
group_by(Departmento) %>%
summarise(cantidad=n())%>%
arrange(cantidad)%>%
head(10) %>%
ggplot(aes(x=reorder(Departmento,-cantidad), y=cantidad))+
geom_bar(stat="identity",color = 'darkslategray', fill = 'steelblue') +
ggtitle ("Cantidad de Delitos por Departamento") + # Título del gráfico
theme (plot.title = element_text(size=rel(2), #Tamaño relativo de la letra del título
vjust=2, #Justificación vertical, para separarlo del gráfico
face="bold",
color="blue", #Color del texto
lineheight=1.5))+
geom_text(aes(label=cantidad), position=position_dodge(width=0.2), vjust=0.5)+
coord_flip()

dataset%>%
group_by(Municipio) %>%
summarise(cantidad=n())%>%
arrange(cantidad)
Grafica de Cantidad de Delitos por Municipio
dataset%>%
group_by(Municipio) %>%
summarise(cantidad=n())%>%
arrange(cantidad)%>%
head(10) %>%
ggplot(aes(x=reorder(Municipio,-cantidad), y=cantidad))+
geom_bar(stat="identity",color = 'darkslategray', fill = 'steelblue') +
ggtitle ("Cantidad de Delitos por Municipio") + # Título del gráfico
theme (plot.title = element_text(size=rel(2), #Tamaño relativo de la letra del título
vjust=2, #Justificación vertical, para separarlo del gráfico
face="bold",
color="blue", #Color del texto
lineheight=1.5))+
geom_text(aes(label=cantidad), position=position_dodge(width=0.2), vjust=0.5)+
coord_flip()

Conclusion 2: El departamento mas seguro es Totonicapan y el Municipio mas seguro es Tectitan, municipio de Huehuetenango
3. Estadistica por edad
mean (dataset$edad_per,trim = 0.1)
[1] 44.47179
median(dataset$edad_per)
[1] 34
Moda= table(dataset$G_Edad_Quincenal)[which.max(table(dataset$G_Edad_Quincenal))]
Moda
25-29
4908
Conclusion 3: La edad promedio de las personas victimas de hechos delectivos durante el 2019 es de 44 años, y el rango de edades de las personal mas afectadas oscila entre los 25 y 29 años de edad.
4. Reconocer si los delitos suceden con mayores de edad o menores de edad
Mayor=dataset %>%
filter (MayorOMenordeEdad=="Mayor de edad") %>%
summarise(Mayor_de_edad=n()) %>%
arrange (-Mayor_de_edad)
Mayor
PorcentajeMenor=(Menor)/(Mayor+Menor)
PorcentajeMenor
Conclusion 4: Al agrupar los menores de 18 años y los mayores de 18 años, se concluye que los mas afectados son los mayores de edad, es importante mencionar que el 8% de los afectados son Menores de edad
5. Reconocer los delitos por sexo
VictimaH=
dataset %>%
filter(Sexo =="Hombre")
Error in dataset %>% filter(Sexo == "Hombre") :
no se pudo encontrar la función "%>%"
*Conclusion 5: La probabilidad de las deVictimas de Hechos Delictivos por sexo, en general se muestra con la siguiente proporcion: 68.8% Hombres, 30% mujeres y en 1.2% de los casos el genero es omitido. Segun la grafica, en los tipo de delito: Contra y Libertad y otras causas, no se cumple la proporcion general.
6. La probabilidad de ocurrencia según sexo, edad se comete los delitos
VicHombreMy=
dataset %>%
filter (MayorOMenordeEdad == "Mayor de edad", Sexo == "Hombre")
nrow(VicHombreMy)/nrow(VictimaH)
[1] 0.8677264
VicMujerMy=
dataset %>%
filter (MayorOMenordeEdad == "Mayor de edad" , Sexo == "Mujer")
nrow(VicMujerMy)/nrow(VictimaM)
[1] 0.7524781
VicHombreME=
dataset %>%
filter (Sexo == "Hombre" , MayorOMenordeEdad == "Menor de edad")
nrow(VicHombreME)/nrow(VictimaH)
[1] 0.04667735
VicMujerME=
dataset %>%
filter (Sexo == "Mujer" , MayorOMenordeEdad == "Menor de edad")
nrow(VicMujerME)/nrow(VictimaM)
[1] 0.1562891
DiaVictima =
dataset %>%
group_by(NombredelDia, Sexo) %>%
summarise(Cantidad = n()) %>%
arrange(-Cantidad)
ggplot(DiaVictima, aes(x=NombredelDia, y=Cantidad, group = Sexo, colour =Sexo )) +
geom_line() +
geom_point( size=1, shape=10, fill="blue") +
theme_gray()

*Conclusion 6: La probabilidad de ocurrencia de hechos delictivos para para victimas mayores de edad es: Hombre 86.77% y Mujeres 75.24%. Para victimas Menores de Edad: Hombre 4.66% y Mujeres 15.63%. Los dias de la semana en que ocurren los hechos delictivos gruardan relacion segun el sexo, como se observa en la grafica.
7. Obtener si existe un patron en la hora en que suceden los delitos
Hora=dataset[(dataset$HoraOcurrencia<99), 7]
Warning messages:
1: In readChar(file, size, TRUE) : truncating string with embedded nuls
2: In readChar(file, size, TRUE) : truncating string with embedded nuls
3: In readChar(file, size, TRUE) : truncating string with embedded nuls
4: In readChar(file, size, TRUE) : truncating string with embedded nuls
hist(Hora,
col=blues9,
xlab= "Hora",
ylab= "Cantidad",
main= "Grafica de delitos cometidos por X hora",
las=2)

Conclusion 7: Segun muestra la grafica, la mayor parte de los hechos delictivos son cometidos entre las 9 y las 21 horas de dia
8. Que dia es el que mas delitos hay
dataset%>%
group_by(NombredelDia) %>%
summarise(cantidad=n())%>%
arrange(-cantidad)%>%
ggplot(aes(y=reorder(NombredelDia,cantidad), x=cantidad))+
geom_point(color = 'red', fill = 'red', size = 4, shape = 18, alpha = 0.5) +
xlab('Delito') +
ylab('Dias de la semana') +
ggtitle ("Cantidad total por Dia") + # Título del gráfico
theme (plot.title = element_text(size=rel(2), #Tamaño relativo de la letra del título
vjust=2, #Justificación vertical, para separarlo del gráfico
face="bold",
color="blue", #Color del texto
lineheight=1.5))+
geom_text(aes(label=cantidad), position=position_dodge(width=0.5), vjust=-.5)+
coord_flip()

Conclusion 8: El dia con mas delitos son los dias Lunes y Martes, y el dia con menos delitos son los dias Domingo
9. Evaluar si existe un incremento de delitos en los meses de bono 14 y Aguinaldo
Hechosxmes= as.data.frame(prop.table(table(dataset$Mes, dataset$GrupoDelito), 2)*100)
colnames(Hechosxmes)<-c("MES", "Delito","PCT")
gr4 <- ggplot(Hechosxmes, aes(x=MES, y=PCT)) + geom_bar(stat="identity", fill = 'steelblue')
gr4

gr4 + coord_flip() + facet_wrap(~ Delito)

*Conclusion 9: ### La siguiente grafica muestra la ocurrencia de hechos delictivos por mes, evidenciando que apartir del Mes de julio (bono 14) se incrementan: Las extorsiones y los Homicidios. Mientras que durante el mes de diciembre solo se denota un incremento en los los Hechos delictivos en contra el patrimonio.
% de Delitos que son Extorsiones a buses urbanos
(buses/TotalDelitos)
[1] 0.0129757
pdf=sapply(x, FUN=PMF1)
pdf
[1] 0.8287462 0.1712538
datos=data.frame(x=x,px=pdf)
datos
Conclusion PDF: La densidad de probabilidad que una mujer sea victima de homicidio en el municipio de Guatemala es el 17.12%
Obtener el CDF
cdf=cumsum(pdf)
cdf
datos=data.frame(datos,Fx=cdf)
datos
valor_esperado=function(df){
x=df[ ,1]
px=df [ ,2]
VE=sum(x*px)
return(VE)}
valor_esperado(datos) #media ponderada
Obtener la Varianza
varianza=function(df){
media=valor_esperado(df)
x=df [ ,1]
px=df [ ,2]
varX=sum(((x-media)^2)*(px))
return(varX)
}
varianza(datos)
Conclusion CDF Podemos observar la variabilidad de los datos a un 0.14, la cual indica la distancia que hay hacia la media
Best Fit, tomando en cuenta la Edad
dataset$edad_per
EdadCorrecta=dataset[(dataset$edad_per<999), 20]
TablaEdad=data_frame(table(EdadCorrecta))
TablaEdad
descdist(EdadCorrecta, discrete = FALSE)
hist(EdadCorrecta,
col=blues9,
xlab= "Edad",
ylab= "Cantidad de Delitos",
main= "Grafica de delitos por edad",
las=2)
Conclusion BEST FIT: Al analizar la cantidad de Delitos por edad podemos concluir que se apega a una distribucion normal, misma se valido realizando un histograma de frecuencia por edad el cual se puede ver un leve sesgo hacia la derecha, siendo las edades mas vulnerables entre los 20 y 40 años.
