1. Uso de librerias
# Cargar librerías necesarias
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ readr     2.1.5
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(summarytools)
## 
## Adjuntando el paquete: 'summarytools'
## 
## The following object is masked from 'package:tibble':
## 
##     view
library(DataExplorer)
library(ggplot2)
library(corrplot)
## corrplot 0.94 loaded
library(ggpubr)
## Warning: package 'ggpubr' was built under R version 4.4.3
library(readxl)
  1. Conjunto de datos con el que realizaremos el análsis exploratorio
datos<-read_excel("SAT-HD-BU_2017-2023.xlsx")
print(dfSummary(datos), method = "render")

Data Frame Summary

datos

Dimensions: 34032 x 47
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 id_hecho [numeric]
Mean (sd) : 22653.3 (6212.7)
min ≤ med ≤ max:
11535 ≤ 22559.5 ≤ 33828
IQR (CV) : 10345.2 (0.3)
14999 distinct values 34032 (100.0%) 0 (0.0%)
2 tipo_hecho_segun_victima [character]
1. HD Mujer Cis Trans Traves
2. HD Mujer Cis Trans Traves
3. HD Mujer Cis Trans Traves
4. HD Mujer Cis Trans Traves
5. HD Mujer Cis Trans Traves
6. HD Sin determinar
7. HD Varón
8. HD Varón-Femicidio vincul
9. HD Varón Trans
3316(9.7%)
75(0.2%)
2071(6.1%)
293(0.9%)
21(0.1%)
12(0.0%)
28222(82.9%)
16(0.0%)
6(0.0%)
34032 (100.0%) 0 (0.0%)
3 tipo_persona_id [character]
1. Imputado idRegistro 12929
2. Imputado idRegistro 12930
3. Imputado idRegistro 12931
4. Imputado idRegistro 12932
5. Imputado idRegistro 12933
6. Imputado idRegistro 12934
7. Imputado idRegistro 12935
8. Imputado idRegistro 12936
9. Imputado idRegistro 12937
10. Imputado idRegistro 12938
[ 34022 others ]
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
1(0.0%)
34022(100.0%)
34032 (100.0%) 0 (0.0%)
4 tipo_persona [character]
1. Imputado
2. Víctima
18510(54.4%)
15522(45.6%)
34032 (100.0%) 0 (0.0%)
5 cant_inc [numeric]
Mean (sd) : 1.5 (1.1)
min ≤ med ≤ max:
1 ≤ 1 ≤ 16
IQR (CV) : 0 (0.7)
12 distinct values 34032 (100.0%) 0 (0.0%)
6 cant_vic [numeric]
Mean (sd) : 1.1 (0.3)
min ≤ med ≤ max:
1 ≤ 1 ≤ 6
IQR (CV) : 0 (0.3)
1:32310(94.9%)
2:1411(4.1%)
3:234(0.7%)
4:32(0.1%)
5:22(0.1%)
6:23(0.1%)
34032 (100.0%) 0 (0.0%)
7 federal [character]
1. No
2. Si
34019(100.0%)
13(0.0%)
34032 (100.0%) 0 (0.0%)
8 provincia_id [numeric]
Mean (sd) : 34.3 (32.8)
min ≤ med ≤ max:
2 ≤ 14 ≤ 94
IQR (CV) : 60 (1)
24 distinct values 34032 (100.0%) 0 (0.0%)
9 provincia_nombre [character]
1. Buenos Aires
2. Santa Fe
3. Tucumán
4. Ciudad Autónoma de Buenos
5. Córdoba
6. Mendoza
7. Chaco
8. Salta
9. Misiones
10. Entre Ríos
[ 14 others ]
13680(40.2%)
5179(15.2%)
1809(5.3%)
1724(5.1%)
1584(4.7%)
1406(4.1%)
1222(3.6%)
1178(3.5%)
871(2.6%)
768(2.3%)
4611(13.5%)
34032 (100.0%) 0 (0.0%)
10 departamento_id [numeric]
Mean (sd) : 34642.7 (38508.9)
min ≤ med ≤ max:
2001 ≤ 14147 ≤ 2699926
IQR (CV) : 59699 (1.1)
465 distinct values 34032 (100.0%) 0 (0.0%)
11 departamento_nombre [character]
1. Capital
2. Rosario
3. La Matanza
4. La Capital
5. Moreno
6. Lomas de Zamora
7. Quilmes
8. San Fernando
9. General San Martín
10. General Pueyrredón
[ 380 others ]
3110(9.1%)
3086(9.1%)
2157(6.3%)
1343(3.9%)
817(2.4%)
682(2.0%)
666(2.0%)
639(1.9%)
631(1.9%)
612(1.8%)
20289(59.6%)
34032 (100.0%) 0 (0.0%)
12 localidad_id [character]
1. 10
2. 270
3. 30
4. 20
5. 50
6. 60
7. 40
8. 170
9. 70
10. 110
[ 49 others ]
16188(47.6%)
2572(7.6%)
2243(6.6%)
2004(5.9%)
1603(4.7%)
1475(4.3%)
1263(3.7%)
1107(3.3%)
842(2.5%)
831(2.4%)
3904(11.5%)
34032 (100.0%) 0 (0.0%)
13 localidad_nombre [character]
1. Rosario
2. La Matanza
3. Ciudad de Buenos Aires
4. San Miguel de Tucumán (Es
5. Santa Fe
6. Córdoba
7. Moreno
8. Lomas de Zamora
9. Quilmes
10. Almirante Brown
[ 1035 others ]
2561(7.5%)
2157(6.3%)
1720(5.1%)
1073(3.2%)
1017(3.0%)
846(2.5%)
792(2.3%)
682(2.0%)
666(2.0%)
583(1.7%)
21935(64.5%)
34032 (100.0%) 0 (0.0%)
14 radio_censal [numeric]
Mean (sd) : 344217886 (320451363)
min ≤ med ≤ max:
20010101 ≤ 180210701 ≤ 940140810
IQR (CV) : 596980589 (0.9)
8819 distinct values 29118 (85.6%) 4914 (14.4%)
15 latitud_radio [numeric]
Mean (sd) : -32.9 (4.2)
min ≤ med ≤ max:
-54.8 ≤ -33.9 ≤ -21.9
IQR (CV) : 3.2 (-0.1)
9159 distinct values 29118 (85.6%) 4914 (14.4%)
16 longitud_radio [numeric]
Mean (sd) : -61 (3.5)
min ≤ med ≤ max:
-72.3 ≤ -59.6 ≤ -53.6
IQR (CV) : 5.2 (-0.1)
9148 distinct values 29118 (85.6%) 4914 (14.4%)
17 anio [numeric]
Mean (sd) : 2019.9 (2)
min ≤ med ≤ max:
2017 ≤ 2020 ≤ 2023
IQR (CV) : 4 (0)
2017:4869(14.3%)
2018:5011(14.7%)
2019:5100(15.0%)
2020:5498(16.2%)
2021:4694(13.8%)
2022:4386(12.9%)
2023:4474(13.1%)
34032 (100.0%) 0 (0.0%)
18 mes [numeric]
Mean (sd) : 6.5 (3.6)
min ≤ med ≤ max:
1 ≤ 6 ≤ 12
IQR (CV) : 7 (0.6)
12 distinct values 34032 (100.0%) 0 (0.0%)
19 fecha_hecho [character]
1. 1/1/2019
2. 1/1/2018
3. 1/1/2022
4. 1/1/2020
5. 25/12/2017
6. 21/6/2020
7. 4/3/2018
8. 1/1/2021
9. 1/6/2019
10. 25/12/2020
[ 2526 others ]
58(0.2%)
48(0.1%)
46(0.1%)
45(0.1%)
42(0.1%)
41(0.1%)
41(0.1%)
40(0.1%)
40(0.1%)
40(0.1%)
33591(98.7%)
34032 (100.0%) 0 (0.0%)
20 hora_hecho [character]
1. 11:11:11
2. 11:11:00
3. 00:00:00
4. 22:00:00
5. 21:00:00
6. 23:00:00
7. 20:00:00
8. 18:00:00
9. 21:30:00
10. 19:00:00
[ 1036 others ]
13418(39.4%)
843(2.5%)
574(1.7%)
417(1.2%)
386(1.1%)
368(1.1%)
337(1.0%)
284(0.8%)
275(0.8%)
268(0.8%)
16862(49.5%)
34032 (100.0%) 0 (0.0%)
21 tipo_lugar [character]
1. Cárcel o comisaría
2. Comercio
3. Domicilio particular
4. Interior de rodados
5. Otro lugar
6. Sin determinar
7. Vía pública
310(0.9%)
776(2.3%)
9833(28.9%)
497(1.5%)
1298(3.8%)
3147(9.2%)
18171(53.4%)
34032 (100.0%) 0 (0.0%)
22 tipo_lugar_otro [logical]
All NA's
0 (0.0%) 34032 (100.0%)
23 tipo_lugar_ampliado [character]
1. Vía pública
2. Domicilio particular
3. Sin determinar
4. Comercio
5. Interior de rodados
6. Campo/descampado/zona rur
7. Cárcel o comisaría
8. Establecimiento zona rura
9. Otro lugar
10. Río/canal/arroyo/mar/diqu
[ 16 others ]
18171(53.4%)
9833(28.9%)
3147(9.2%)
776(2.3%)
497(1.5%)
364(1.1%)
310(0.9%)
128(0.4%)
113(0.3%)
96(0.3%)
597(1.8%)
34032 (100.0%) 0 (0.0%)
24 clase_arma [character]
1. Ahorcamiento / asfixia
2. Arma blanca
3. Arma de fuego
4. Arrollamiento por rodado
5. Envenenamiento
6. Golpes
7. Objeto contundente
8. Otra arma o mecanismo
9. Precipitación al vacío
10. Quemaduras
11. Sin determinación
894(2.6%)
9378(27.6%)
17571(51.6%)
160(0.5%)
31(0.1%)
1407(4.1%)
2016(5.9%)
153(0.4%)
58(0.2%)
565(1.7%)
1799(5.3%)
34032 (100.0%) 0 (0.0%)
25 clase_arma_otro [character]
1. Colisión vehículo
2. Golpes
3. Tumbera
4. Sumersión
5. Por deshidratación
6. Martillo
7. Caída de un motovehículo
8. Descuartizado
9. Ahogamiento
10. Arma de fuego y arma blan
[ 102 others ]
19(5.1%)
13(3.5%)
12(3.2%)
10(2.7%)
9(2.4%)
8(2.1%)
7(1.9%)
7(1.9%)
6(1.6%)
6(1.6%)
277(74.1%)
374 (1.1%) 33658 (98.9%)
26 en_ocasion_otro_delito [character]
1. No fue en ocasión de otro
2. Sí abuso sexual con acce
3. Si otro delito
4. Sí robo
5. Sin determinación
25695(75.5%)
131(0.4%)
797(2.3%)
5680(16.7%)
1729(5.1%)
34032 (100.0%) 0 (0.0%)
27 en_ocasion_otro_delito_otro [character]
1. Femicidio
2. Lesiones dolosas
3. Riña
4. Lesiones
5. Violencia de género
6. Violencia familiar
7. Abuso de arma de fuego
8. Lesiones en riña
9. Abuso de arma
10. Lesiones pelea
[ 74 others ]
438(28.9%)
195(12.9%)
191(12.6%)
171(11.3%)
116(7.7%)
45(3.0%)
35(2.3%)
25(1.7%)
18(1.2%)
18(1.2%)
262(17.3%)
1514 (4.4%) 32518 (95.6%)
28 motivo_origen_registro [character]
1. Denuncia particular
2. Intervención policial
3. Orden judicial
4. Otros
9075(26.7%)
24343(71.5%)
483(1.4%)
131(0.4%)
34032 (100.0%) 0 (0.0%)
29 motivo_origen_registro_otro [character]
1. Confesión inculpada
2. Cooperacion
3. Intervención de salud
4. Intervención policial
5. Intervención Servicio Pen
6. Llamado telefonico
7. Sin determinar
2(1.5%)
4(2.9%)
7(5.1%)
4(2.9%)
10(7.3%)
2(1.5%)
108(78.8%)
137 (0.4%) 33895 (99.6%)
30 victima_sexo [character]
1. Femenino
2. Masculino
3. No corresponde
4. Sin determinar
2596(7.6%)
12920(38.0%)
18510(54.4%)
6(0.0%)
34032 (100.0%) 0 (0.0%)
31 victima_identidad_genero [character]
1. Mujer
2. Mujer trans/travesti
3. No corresponde
4. Sin determinar
5. Varón
6. Varón trans
2581(7.6%)
39(0.1%)
18510(54.4%)
6(0.0%)
12893(37.9%)
3(0.0%)
34032 (100.0%) 0 (0.0%)
32 victima_identidad_genero_otro [character]
1. -----------
2. No corresponde
16079(86.9%)
2431(13.1%)
18510 (54.4%) 15522 (45.6%)
33 victima_tr_edad [character]
1. No corresponde
2. 20-24
3. 25-29
4. 30-34
5. 15-19
6. 35-39
7. 40-44
8. 45-49
9. 50-54
10. 55-59
[ 11 others ]
18510(54.4%)
2459(7.2%)
2283(6.7%)
2080(6.1%)
1648(4.8%)
1425(4.2%)
1183(3.5%)
835(2.5%)
647(1.9%)
534(1.6%)
2428(7.1%)
34032 (100.0%) 0 (0.0%)
34 victima_18_años_o_mas [character]
1. No
2. No corresponde
3. Sí
4. Sin determinar
1256(3.7%)
18510(54.4%)
13939(41.0%)
327(1.0%)
34032 (100.0%) 0 (0.0%)
35 victima_clase [character]
1. Civil
2. Civil detenido
3. No corresponde
4. Otra fuerza de seguridad
5. Policía detenido
6. Policía en franco
7. Policía en servicio
8. Policía retirado
9. Seguridad privada
10. Sin determinación
14759(43.4%)
105(0.3%)
18510(54.4%)
55(0.2%)
2(0.0%)
77(0.2%)
115(0.3%)
30(0.1%)
9(0.0%)
370(1.1%)
34032 (100.0%) 0 (0.0%)
36 victima_clase_otro [character]
1. -------
2. GNA
3. Policía de la Ciudad
4. PFA
5. Ejercito Argentino
6. PNA
7. Servicio Penitenciario
8. PSA
9. Servicio Penitenciario Fe
10. Servicio Penitenciario Pr
[ 7 others ]
18510(99.7%)
11(0.1%)
10(0.1%)
8(0.0%)
4(0.0%)
4(0.0%)
3(0.0%)
2(0.0%)
2(0.0%)
2(0.0%)
7(0.0%)
18563 (54.5%) 15469 (45.5%)
37 victima_situacion_ocupacional [character]
1. No corresponde
2. Sin Determinar
3. Desocupado
4. Empleado de otros sectore
5. Trabajador cuenta propia
6. Jubilado/pensionado
7. Changarín
8. Estudiante
9. Ama de casa
10. No corresponde - Menor
[ 8 others ]
19823(58.2%)
8257(24.3%)
1610(4.7%)
1380(4.1%)
734(2.2%)
609(1.8%)
504(1.5%)
381(1.1%)
323(0.9%)
305(0.9%)
106(0.3%)
34032 (100.0%) 0 (0.0%)
38 victi_situacion_ocupacional_otro [character]
1. ---------
2. No corresponde
3. Personal policial
4. Jornalero
5. Comerciante
6. Empleado
7. Personal Policial
8.  
9. Policía
10. Docente
[ 92 others ]
16079(85.1%)
2431(12.9%)
71(0.4%)
60(0.3%)
46(0.2%)
29(0.2%)
19(0.1%)
18(0.1%)
14(0.1%)
7(0.0%)
127(0.7%)
18901 (55.5%) 15131 (44.5%)
39 victima_relacion_inculpado [character]
1. No corresponde
2. Sin determinación
3. Sin relación
4. Otras relaciones no famil
5. Conyuge/ pareja
6. Otros vínculos familiares
7. Ex conyuge / ex pareja
8. Hijo/a
9. Hermano/a
10. Padre/Madre
[ 4 others ]
18510(54.4%)
6253(18.4%)
3846(11.3%)
2660(7.8%)
1015(3.0%)
584(1.7%)
394(1.2%)
278(0.8%)
220(0.6%)
206(0.6%)
66(0.2%)
34032 (100.0%) 0 (0.0%)
40 inculpado_sexo [character]
1. Femenino
2. Masculino
3. No corresponde
4. Sin determinar
1182(3.5%)
13486(39.6%)
15522(45.6%)
3842(11.3%)
34032 (100.0%) 0 (0.0%)
41 inculpado_identidad_genero [character]
1. Mujer
2. Mujer trans/travesti
3. No corresponde
4. Sin determinar
5. Varón
6. Varón trans
1180(3.5%)
4(0.0%)
15522(45.6%)
3821(11.2%)
13504(39.7%)
1(0.0%)
34032 (100.0%) 0 (0.0%)
42 inculpado_identidad_genero_otro [character]
1. -------
2. Sin determinar
13473(100.0%)
2(0.0%)
13475 (39.6%) 20557 (60.4%)
43 inculpado_tr_edad [character]
1. No corresponde
2. Sin determinar
3. 20-24
4. 25-29
5. 30-34
6. 15-19
7. 35-39
8. 40-44
9. 45-49
10. 50-54
[ 10 others ]
15522(45.6%)
6614(19.4%)
2465(7.2%)
2066(6.1%)
1913(5.6%)
1867(5.5%)
1103(3.2%)
766(2.3%)
533(1.6%)
367(1.1%)
816(2.4%)
34032 (100.0%) 0 (0.0%)
44 inculpado_18_años_o_mas [character]
1. No
2. No corresponde
3. Sí
4. Sin determinar
943(2.8%)
15522(45.6%)
12135(35.7%)
5432(16.0%)
34032 (100.0%) 0 (0.0%)
45 inculpado_clase [character]
1. Civil
2. Civil detenido
3. No corresponde
4. Otra fuerza de seguridad
5. Policía detenido
6. Policía en franco
7. Policía en servicio
8. Policía retirado
9. Seguridad privada
10. Sin determinación
12890(37.9%)
118(0.3%)
15522(45.6%)
262(0.8%)
11(0.0%)
268(0.8%)
471(1.4%)
43(0.1%)
18(0.1%)
4429(13.0%)
34032 (100.0%) 0 (0.0%)
46 inculpado_otro_clase [character]
1. ----
2. Policía de la Ciudad
3. PFA
4. GNA
5. Servicio Penitenciario
6.  
7. PNA
8. Ejercito Argentino
9. Militar/Fuerzas Armadas
10. Policía Local
[ 17 others ]
15522(98.2%)
87(0.6%)
82(0.5%)
28(0.2%)
22(0.1%)
17(0.1%)
8(0.1%)
4(0.0%)
4(0.0%)
4(0.0%)
25(0.2%)
15803 (46.4%) 18229 (53.6%)
47 inculpado_relacion_victima [character]
1. No corresponde
2. Sin determinación
3. Sin relación
4. Otras relaciones no famil
5. Conyuge/ pareja
6. Otros vínculos familiares
7. Ex conyuge / ex pareja
8. Padre/Madre
9. Hermano/a
10. Hijo/a
[ 4 others ]
15656(46.0%)
7304(21.5%)
4973(14.6%)
3391(10.0%)
895(2.6%)
628(1.8%)
397(1.2%)
275(0.8%)
222(0.7%)
219(0.6%)
72(0.2%)
34032 (100.0%) 0 (0.0%)

Generated by summarytools 1.0.1 (R version 4.4.1)
2025-04-20

  1. Visualización General de los datos
View(datos)
table(str(datos))
## tibble [34,032 × 47] (S3: tbl_df/tbl/data.frame)
##  $ id_hecho                        : num [1:34032] 11535 11535 11535 11535 11536 ...
##  $ tipo_hecho_segun_victima        : chr [1:34032] "HD Varón" "HD Varón" "HD Varón" "HD Varón" ...
##  $ tipo_persona_id                 : chr [1:34032] "Víctima idRegistro 12235" "Imputado idRegistro 12929" "Imputado idRegistro 12931" "Imputado idRegistro 12930" ...
##  $ tipo_persona                    : chr [1:34032] "Víctima" "Imputado" "Imputado" "Imputado" ...
##  $ cant_inc                        : num [1:34032] 3 3 3 3 2 2 2 1 1 1 ...
##  $ cant_vic                        : num [1:34032] 1 1 1 1 1 1 1 1 1 1 ...
##  $ federal                         : chr [1:34032] "No" "No" "No" "No" ...
##  $ provincia_id                    : num [1:34032] 58 58 58 58 58 58 58 58 58 58 ...
##  $ provincia_nombre                : chr [1:34032] "Neuquén" "Neuquén" "Neuquén" "Neuquén" ...
##  $ departamento_id                 : num [1:34032] 58035 58035 58035 58035 58035 ...
##  $ departamento_nombre             : chr [1:34032] "Confluencia" "Confluencia" "Confluencia" "Confluencia" ...
##  $ localidad_id                    : chr [1:34032] "100" "100" "100" "100" ...
##  $ localidad_nombre                : chr [1:34032] "Plottier" "Plottier" "Plottier" "Plottier" ...
##  $ radio_censal                    : num [1:34032] NA NA NA NA NA ...
##  $ latitud_radio                   : num [1:34032] NA NA NA NA NA ...
##  $ longitud_radio                  : num [1:34032] NA NA NA NA NA ...
##  $ anio                            : num [1:34032] 2017 2017 2017 2017 2017 ...
##  $ mes                             : num [1:34032] 1 1 1 1 1 1 1 1 1 1 ...
##  $ fecha_hecho                     : chr [1:34032] "14/1/2017" "14/1/2017" "14/1/2017" "14/1/2017" ...
##  $ hora_hecho                      : chr [1:34032] "22:38:00" "22:38:00" "22:38:00" "22:38:00" ...
##  $ tipo_lugar                      : chr [1:34032] "Domicilio particular" "Domicilio particular" "Domicilio particular" "Domicilio particular" ...
##  $ tipo_lugar_otro                 : logi [1:34032] NA NA NA NA NA NA ...
##  $ tipo_lugar_ampliado             : chr [1:34032] "Domicilio particular" "Domicilio particular" "Domicilio particular" "Domicilio particular" ...
##  $ clase_arma                      : chr [1:34032] "Arma de fuego" "Arma de fuego" "Arma de fuego" "Arma de fuego" ...
##  $ clase_arma_otro                 : chr [1:34032] NA NA NA NA ...
##  $ en_ocasion_otro_delito          : chr [1:34032] "Sí robo" "Sí robo" "Sí robo" "Sí robo" ...
##  $ en_ocasion_otro_delito_otro     : chr [1:34032] NA NA NA NA ...
##  $ motivo_origen_registro          : chr [1:34032] "Intervención policial" "Intervención policial" "Intervención policial" "Intervención policial" ...
##  $ motivo_origen_registro_otro     : chr [1:34032] NA NA NA NA ...
##  $ victima_sexo                    : chr [1:34032] "Masculino" "No corresponde" "No corresponde" "No corresponde" ...
##  $ victima_identidad_genero        : chr [1:34032] "Varón" "No corresponde" "No corresponde" "No corresponde" ...
##  $ victima_identidad_genero_otro   : chr [1:34032] NA "-----------" "-----------" "-----------" ...
##  $ victima_tr_edad                 : chr [1:34032] "45-49" "No corresponde" "No corresponde" "No corresponde" ...
##  $ victima_18_años_o_mas           : chr [1:34032] "Sí" "No corresponde" "No corresponde" "No corresponde" ...
##  $ victima_clase                   : chr [1:34032] "Civil" "No corresponde" "No corresponde" "No corresponde" ...
##  $ victima_clase_otro              : chr [1:34032] NA "-------" "-------" "-------" ...
##  $ victima_situacion_ocupacional   : chr [1:34032] "Empleado de otros sectores" "No corresponde" "No corresponde" "No corresponde" ...
##  $ victi_situacion_ocupacional_otro: chr [1:34032] NA "---------" "---------" "---------" ...
##  $ victima_relacion_inculpado      : chr [1:34032] "Sin relación" "No corresponde" "No corresponde" "No corresponde" ...
##  $ inculpado_sexo                  : chr [1:34032] "No corresponde" "Masculino" "Masculino" "Masculino" ...
##  $ inculpado_identidad_genero      : chr [1:34032] "No corresponde" "Varón" "Varón" "Varón" ...
##  $ inculpado_identidad_genero_otro : chr [1:34032] "-------" NA NA NA ...
##  $ inculpado_tr_edad               : chr [1:34032] "No corresponde" "Sin determinar" "Sin determinar" "Sin determinar" ...
##  $ inculpado_18_años_o_mas         : chr [1:34032] "No corresponde" "Sin determinar" "Sin determinar" "Sin determinar" ...
##  $ inculpado_clase                 : chr [1:34032] "No corresponde" "Sin determinación" "Sin determinación" "Sin determinación" ...
##  $ inculpado_otro_clase            : chr [1:34032] "----" NA NA NA ...
##  $ inculpado_relacion_victima      : chr [1:34032] "No corresponde" "Sin relación" "Sin relación" "Sin relación" ...
## < table of extent 0 >
summary(datos)
##     id_hecho     tipo_hecho_segun_victima tipo_persona_id    tipo_persona      
##  Min.   :11535   Length:34032             Length:34032       Length:34032      
##  1st Qu.:17585   Class :character         Class :character   Class :character  
##  Median :22560   Mode  :character         Mode  :character   Mode  :character  
##  Mean   :22653                                                                 
##  3rd Qu.:27930                                                                 
##  Max.   :33828                                                                 
##                                                                                
##     cant_inc         cant_vic       federal           provincia_id  
##  Min.   : 1.000   Min.   :1.000   Length:34032       Min.   : 2.00  
##  1st Qu.: 1.000   1st Qu.:1.000   Class :character   1st Qu.: 6.00  
##  Median : 1.000   Median :1.000   Mode  :character   Median :14.00  
##  Mean   : 1.452   Mean   :1.064                      Mean   :34.27  
##  3rd Qu.: 1.000   3rd Qu.:1.000                      3rd Qu.:66.00  
##  Max.   :16.000   Max.   :6.000                      Max.   :94.00  
##                                                                     
##  provincia_nombre   departamento_id   departamento_nombre localidad_id      
##  Length:34032       Min.   :   2001   Length:34032        Length:34032      
##  Class :character   1st Qu.:   6427   Class :character    Class :character  
##  Mode  :character   Median :  14147   Mode  :character    Mode  :character  
##                     Mean   :  34643                                         
##                     3rd Qu.:  66126                                         
##                     Max.   :2699926                                         
##                                                                             
##  localidad_nombre    radio_censal       latitud_radio    longitud_radio  
##  Length:34032       Min.   : 20010101   Min.   :-54.83   Min.   :-72.33  
##  Class :character   1st Qu.: 64279615   1st Qu.:-34.72   1st Qu.:-63.73  
##  Mode  :character   Median :180210701   Median :-33.88   Median :-59.62  
##                     Mean   :344217886   Mean   :-32.95   Mean   :-60.96  
##                     3rd Qu.:661260204   3rd Qu.:-31.50   3rd Qu.:-58.49  
##                     Max.   :940140810   Max.   :-21.95   Max.   :-53.64  
##                     NA's   :4914        NA's   :4914     NA's   :4914    
##       anio           mes         fecha_hecho         hora_hecho       
##  Min.   :2017   Min.   : 1.000   Length:34032       Length:34032      
##  1st Qu.:2018   1st Qu.: 3.000   Class :character   Class :character  
##  Median :2020   Median : 6.000   Mode  :character   Mode  :character  
##  Mean   :2020   Mean   : 6.456                                        
##  3rd Qu.:2022   3rd Qu.:10.000                                        
##  Max.   :2023   Max.   :12.000                                        
##                                                                       
##   tipo_lugar        tipo_lugar_otro tipo_lugar_ampliado  clase_arma       
##  Length:34032       Mode:logical    Length:34032        Length:34032      
##  Class :character   NA's:34032      Class :character    Class :character  
##  Mode  :character                   Mode  :character    Mode  :character  
##                                                                           
##                                                                           
##                                                                           
##                                                                           
##  clase_arma_otro    en_ocasion_otro_delito en_ocasion_otro_delito_otro
##  Length:34032       Length:34032           Length:34032               
##  Class :character   Class :character       Class :character           
##  Mode  :character   Mode  :character       Mode  :character           
##                                                                       
##                                                                       
##                                                                       
##                                                                       
##  motivo_origen_registro motivo_origen_registro_otro victima_sexo      
##  Length:34032           Length:34032                Length:34032      
##  Class :character       Class :character            Class :character  
##  Mode  :character       Mode  :character            Mode  :character  
##                                                                       
##                                                                       
##                                                                       
##                                                                       
##  victima_identidad_genero victima_identidad_genero_otro victima_tr_edad   
##  Length:34032             Length:34032                  Length:34032      
##  Class :character         Class :character              Class :character  
##  Mode  :character         Mode  :character              Mode  :character  
##                                                                           
##                                                                           
##                                                                           
##                                                                           
##  victima_18_años_o_mas victima_clase      victima_clase_otro
##  Length:34032          Length:34032       Length:34032      
##  Class :character      Class :character   Class :character  
##  Mode  :character      Mode  :character   Mode  :character  
##                                                             
##                                                             
##                                                             
##                                                             
##  victima_situacion_ocupacional victi_situacion_ocupacional_otro
##  Length:34032                  Length:34032                    
##  Class :character              Class :character                
##  Mode  :character              Mode  :character                
##                                                                
##                                                                
##                                                                
##                                                                
##  victima_relacion_inculpado inculpado_sexo     inculpado_identidad_genero
##  Length:34032               Length:34032       Length:34032              
##  Class :character           Class :character   Class :character          
##  Mode  :character           Mode  :character   Mode  :character          
##                                                                          
##                                                                          
##                                                                          
##                                                                          
##  inculpado_identidad_genero_otro inculpado_tr_edad  inculpado_18_años_o_mas
##  Length:34032                    Length:34032       Length:34032           
##  Class :character                Class :character   Class :character       
##  Mode  :character                Mode  :character   Mode  :character       
##                                                                            
##                                                                            
##                                                                            
##                                                                            
##  inculpado_clase    inculpado_otro_clase inculpado_relacion_victima
##  Length:34032       Length:34032         Length:34032              
##  Class :character   Class :character     Class :character          
##  Mode  :character   Mode  :character     Mode  :character          
##                                                                    
##                                                                    
##                                                                    
## 

Visualización de datos faltantes

#Cantidad de datos faltantes por columna
colSums(is.na(datos))
##                         id_hecho         tipo_hecho_segun_victima 
##                                0                                0 
##                  tipo_persona_id                     tipo_persona 
##                                0                                0 
##                         cant_inc                         cant_vic 
##                                0                                0 
##                          federal                     provincia_id 
##                                0                                0 
##                 provincia_nombre                  departamento_id 
##                                0                                0 
##              departamento_nombre                     localidad_id 
##                                0                                0 
##                 localidad_nombre                     radio_censal 
##                                0                             4914 
##                    latitud_radio                   longitud_radio 
##                             4914                             4914 
##                             anio                              mes 
##                                0                                0 
##                      fecha_hecho                       hora_hecho 
##                                0                                0 
##                       tipo_lugar                  tipo_lugar_otro 
##                                0                            34032 
##              tipo_lugar_ampliado                       clase_arma 
##                                0                                0 
##                  clase_arma_otro           en_ocasion_otro_delito 
##                            33658                                0 
##      en_ocasion_otro_delito_otro           motivo_origen_registro 
##                            32518                                0 
##      motivo_origen_registro_otro                     victima_sexo 
##                            33895                                0 
##         victima_identidad_genero    victima_identidad_genero_otro 
##                                0                            15522 
##                  victima_tr_edad            victima_18_años_o_mas 
##                                0                                0 
##                    victima_clase               victima_clase_otro 
##                                0                            15469 
##    victima_situacion_ocupacional victi_situacion_ocupacional_otro 
##                                0                            15131 
##       victima_relacion_inculpado                   inculpado_sexo 
##                                0                                0 
##       inculpado_identidad_genero  inculpado_identidad_genero_otro 
##                                0                            20557 
##                inculpado_tr_edad          inculpado_18_años_o_mas 
##                                0                                0 
##                  inculpado_clase             inculpado_otro_clase 
##                                0                            18229 
##       inculpado_relacion_victima 
##                                0
#Visualización de datos faltantes
plot_missing(datos)

  1. Imputación de Valores faltantes
moda <- names(sort(table(datos$tipo_persona), decreasing = TRUE))
datos$tipo_persona[is.na(datos$tipo_persona)] <- moda
  1. Detección de Outliers
# Boxplot para identificar outliers por variable
numeric_vars <- datos %>% select(where(is.numeric))

# Visualizar todos los boxplots
numeric_vars %>%
  gather() %>%
  ggplot(aes(x = key, y = value)) +
  geom_boxplot(fill = "lightblue") +
  coord_flip() +
  theme_minimal()
## Warning: Removed 14742 rows containing non-finite outside the scale range
## (`stat_boxplot()`).