Ejercicio Práctico No. 1

Base de datos escogida: MIMP Número de casos atendidos por violencia contra la mujer, integrantes del grupo familiar y violencia sexual, según sexo y departamento

Esta base de datos recopila las cifras sobre los casos atendidos en los Centros de Emergencia Mujer (CEM) del Ministerio de la Mujer y Poblaciones Vulnerables (MIMP) del Perú. La información se desagrega por entidad, línea de intervención, servicio, centro de atención, ubicación geográfica (departamento, provincia y distrito) y características de los casos (tipo de violencia, edad y sexo de las víctimas).

La información que se tiene es desde enero del 2013 hasta junio del 2025.

Fuente de datos: Portal Nacional de Datos Abiertos del Perú
Identificador: 8bf2b1db-2d57-4197-98f8-cea7ef4a4b8a
Licencia: Open Data Commons Attribution License
Link de la base de datos: https://datosabiertos.gob.pe/dataset/mimp-número-de-casos-atendidos-por-violencia-contra-la-mujer-integrantes-del-grupo-familiar

1. Desarrollo del ejercicio

Extraer la base de datos

library(readr)

url = "https://github.com/AriannaNKZC/Experimentando/raw/refs/heads/main/2.1.1%20BdD_CEM_Casos_7.csv"
temp <- tempfile(fileext = ".csv")
download.file(url, temp, mode = "wb")

data <- read_delim(temp,
                    delim = ";",
                    locale = locale(encoding = "ISO-8859-1"),
                    quote = "\"",
                    trim_ws = TRUE)
## Rows: 4698 Columns: 54
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (14): PERIODO, FECHA ENVIO, CODIGO ENTIDAD, ENTIDAD, CODIGO LINEA, LINEA...
## dbl (25): AÑO, N° DE CEM, N° CASOS ATENDIDOS - HOMBRES - TOTAL, N° CASOS ATE...
## num  (7): N° CASOS ATENDIDOS-TOTAL, N° CASOS ATENDIDOS - MUJERES - TOTAL, N°...
## lgl  (8): N° CASOS ATENDIDOS - 18_25  - HOMBRES, N° CASOS ATENDIDOS - 18_25 ...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Identificación de la estructura de la data y la descripción de su contenido (filas, columnas, tipos de variables).

str(data)
## spc_tbl_ [4,698 × 54] (S3: spec_tbl_df/tbl_df/tbl/data.frame)
##  $ AÑO                                                   : num [1:4698] 2013 2013 2013 2013 2013 ...
##  $ PERIODO                                               : chr [1:4698] "ENE - DIC" "ENE - DIC" "ENE - DIC" "ENE - DIC" ...
##  $ FECHA ENVIO                                           : chr [1:4698] "5/01/2014" "5/01/2014" "5/01/2014" "5/01/2014" ...
##  $ CODIGO ENTIDAD                                        : chr [1:4698] "ENT001" "ENT001" "ENT001" "ENT001" ...
##  $ ENTIDAD                                               : chr [1:4698] "PROGRAMA NACIONAL PARA LA PREVENCIÓN Y ERRADICACIÓN DE LA VIOLENCIA CONTRA LA MUJER E INTEGRANTES DEL GRUPO FAMILIAR" "PROGRAMA NACIONAL PARA LA PREVENCIÓN Y ERRADICACIÓN DE LA VIOLENCIA CONTRA LA MUJER E INTEGRANTES DEL GRUPO FAMILIAR" "PROGRAMA NACIONAL PARA LA PREVENCIÓN Y ERRADICACIÓN DE LA VIOLENCIA CONTRA LA MUJER E INTEGRANTES DEL GRUPO FAMILIAR" "PROGRAMA NACIONAL PARA LA PREVENCIÓN Y ERRADICACIÓN DE LA VIOLENCIA CONTRA LA MUJER E INTEGRANTES DEL GRUPO FAMILIAR" ...
##  $ CODIGO LINEA                                          : chr [1:4698] "LIN001" "LIN001" "LIN001" "LIN001" ...
##  $ LINEA INTERVENCION                                    : chr [1:4698] "ATENCIÓN INTEGRAL Y MULTIDISCIPLINARIA PARA VICTIMAS DE VIOLENCIA" "ATENCIÓN INTEGRAL Y MULTIDISCIPLINARIA PARA VICTIMAS DE VIOLENCIA" "ATENCIÓN INTEGRAL Y MULTIDISCIPLINARIA PARA VICTIMAS DE VIOLENCIA" "ATENCIÓN INTEGRAL Y MULTIDISCIPLINARIA PARA VICTIMAS DE VIOLENCIA" ...
##  $ CODIGO SERVICIO                                       : chr [1:4698] "SER001" "SER001" "SER001" "SER001" ...
##  $ NOMBRE SERVICIO                                       : chr [1:4698] "CENTRO EMERGENCIA MUJER" "CENTRO EMERGENCIA MUJER" "CENTRO EMERGENCIA MUJER" "CENTRO EMERGENCIA MUJER" ...
##  $ UBIGEO                                                : chr [1:4698] "030101" "090201" "100201" "030201" ...
##  $ DEPARTAMENTO                                          : chr [1:4698] "APURÍMAC" "HUANCAVELICA" "HUÁNUCO" "APURÍMAC" ...
##  $ PROVINCIA                                             : chr [1:4698] "ABANCAY" "ACOBAMBA" "AMBO" "ANDAHUAYLAS" ...
##  $ DISTRITO                                              : chr [1:4698] "ABANCAY" "ACOBAMBA" "AMBO" "ANDAHUAYLAS" ...
##  $ CODIGO CENTRO ATENCION                                : chr [1:4698] "CEM001" "CEM002" "CEM003" "CEM004" ...
##  $ NOMBRE CENTRO ATENCION                                : chr [1:4698] "ABANCAY" "ACOBAMBA" "AMBO" "ANDAHUAYLAS" ...
##  $ N° DE CEM                                             : num [1:4698] 1 1 1 1 1 1 1 1 1 1 ...
##  $ N° CASOS ATENDIDOS-TOTAL                              : num [1:4698] 142 84 145 408 55 144 564 206 338 277 ...
##  $ N° CASOS ATENDIDOS - HOMBRES - TOTAL                  : num [1:4698] 6 7 10 34 5 20 47 49 47 55 ...
##  $ N° CASOS ATENDIDOS - MUJERES - TOTAL                  : num [1:4698] 136 77 135 374 50 124 517 157 291 222 ...
##  $ N° CASOS ATENDIDOS - VIOLENCIA PSICOLOGICA            : num [1:4698] 106 14 64 253 15 78 321 76 227 110 ...
##  $ N° CASOS ATENDIDOS - VIOLENCIA FISICA                 : num [1:4698] 33 57 57 117 38 50 202 82 99 120 ...
##  $ N° CASOS ATENDIDOS - VIOLENCIA SEXUAL                 : num [1:4698] 3 13 24 38 2 16 41 48 12 47 ...
##  $ N° CASOS ATENDIDOS - VIOLENCIA ECONÓMICA O PATRIMONIAL: num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 0_5 - TOTAL                      : num [1:4698] 0 1 5 12 1 6 3 14 16 19 ...
##  $ N° CASOS ATENDIDOS - 0_5 - HOMBRES                    : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 0_5 - MUJERES                    : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 6_11 - TOTAL                     : num [1:4698] 5 7 9 43 1 20 44 46 45 56 ...
##  $ N° CASOS ATENDIDOS - 6_11 - HOMBRES                   : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 6_11 - MUJERES                   : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 12_17 - TOTAL                    : num [1:4698] 8 9 22 49 6 25 55 50 37 44 ...
##  $ N° CASOS ATENDIDOS - 12_17 - HOMBRES                  : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 12_17 - MUJERES                  : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 18_25 - TOTAL                    : num [1:4698] 22 18 37 69 9 19 86 27 57 29 ...
##  $ N° CASOS ATENDIDOS - 18_25  - HOMBRES                 : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 18_25 - MUJERES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 18_29 - TOTAL                    : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 18_29  - HOMBRES                 : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 18_29 - MUJERES                  : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 26_35 - TOTAL                    : num [1:4698] 40 21 38 96 15 39 139 25 92 68 ...
##  $ N° CASOS ATENDIDOS - 26_35 - HOMBRES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 26_35 - MUJERES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 36_45 - TOTAL                    : num [1:4698] 40 14 15 88 9 16 132 28 56 33 ...
##  $ N° CASOS ATENDIDOS - 36_45 - HOMBRES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 36_45 - MUJERES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 30_59 - TOTAL                    : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 30_59 - HOMBRES                  : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 30_59 - MUJERES                  : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 46_59 - TOTAL                    : num [1:4698] 20 9 16 41 9 13 82 10 23 22 ...
##  $ N° CASOS ATENDIDOS - 46_59 - HOMBRES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 46_59 - MUJERES                  : logi [1:4698] NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 60_MÁS - TOTAL                   : num [1:4698] 7 5 3 10 5 6 23 6 12 6 ...
##  $ N° CASOS ATENDIDOS - 60_MÁS - HOMBRES                 : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° CASOS ATENDIDOS - 60_MÁS - MUJERES                 : num [1:4698] NA NA NA NA NA NA NA NA NA NA ...
##  $ N° DE ACTIVIDADES - TOTAL                             : num [1:4698] 4146 4595 8977 4460 1345 ...
##  - attr(*, "spec")=
##   .. cols(
##   ..   AÑO = col_double(),
##   ..   PERIODO = col_character(),
##   ..   `FECHA ENVIO` = col_character(),
##   ..   `CODIGO ENTIDAD` = col_character(),
##   ..   ENTIDAD = col_character(),
##   ..   `CODIGO LINEA` = col_character(),
##   ..   `LINEA INTERVENCION` = col_character(),
##   ..   `CODIGO SERVICIO` = col_character(),
##   ..   `NOMBRE SERVICIO` = col_character(),
##   ..   UBIGEO = col_character(),
##   ..   DEPARTAMENTO = col_character(),
##   ..   PROVINCIA = col_character(),
##   ..   DISTRITO = col_character(),
##   ..   `CODIGO CENTRO ATENCION` = col_character(),
##   ..   `NOMBRE CENTRO ATENCION` = col_character(),
##   ..   `N° DE CEM` = col_double(),
##   ..   `N° CASOS ATENDIDOS-TOTAL` = col_number(),
##   ..   `N° CASOS ATENDIDOS - HOMBRES - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - MUJERES - TOTAL` = col_number(),
##   ..   `N° CASOS ATENDIDOS - VIOLENCIA PSICOLOGICA` = col_number(),
##   ..   `N° CASOS ATENDIDOS - VIOLENCIA FISICA` = col_number(),
##   ..   `N° CASOS ATENDIDOS - VIOLENCIA SEXUAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - VIOLENCIA ECONÓMICA O PATRIMONIAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 0_5 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 0_5 - HOMBRES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 0_5 - MUJERES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 6_11 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 6_11 - HOMBRES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 6_11 - MUJERES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 12_17 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 12_17 - HOMBRES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 12_17 - MUJERES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 18_25 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 18_25  - HOMBRES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 18_25 - MUJERES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 18_29 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 18_29  - HOMBRES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 18_29 - MUJERES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 26_35 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 26_35 - HOMBRES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 26_35 - MUJERES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 36_45 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 36_45 - HOMBRES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 36_45 - MUJERES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 30_59 - TOTAL` = col_number(),
##   ..   `N° CASOS ATENDIDOS - 30_59 - HOMBRES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 30_59 - MUJERES` = col_number(),
##   ..   `N° CASOS ATENDIDOS - 46_59 - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 46_59 - HOMBRES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 46_59 - MUJERES` = col_logical(),
##   ..   `N° CASOS ATENDIDOS - 60_MÁS - TOTAL` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 60_MÁS - HOMBRES` = col_double(),
##   ..   `N° CASOS ATENDIDOS - 60_MÁS - MUJERES` = col_double(),
##   ..   `N° DE ACTIVIDADES - TOTAL` = col_number()
##   .. )
##  - attr(*, "problems")=<externalptr>

Este conjunto de datos contiene información detallada sobre los casos de violencia atendidos por los Centros de Emergencia Mujer (CEM) en Perú. Incluye variables que describen:

1. Identificación temporal: año, periodo y fecha de envío de información.
2. Identificación institucional: entidad, línea de intervención, servicio y centro de atención.
3. Ubicación geográfica: departamento, provincia, distrito y código UBIGEO.
4. Estadísticas de atención: número de casos atendidos, desagregados por sexo, tipo de violencia (psicológica, física, sexual, económica/patrimonial) y grupo etario (desde 0 hasta 60+ años).
5. Actividades realizadas: número total de actividades de atención registradas.

Estructura:
1. Observaciones: 4,698 registros.
2. Variables: 54 columnas (categóricas, numéricas y lógicas).

Información obtenida de una variable: No. de casos atendidos

str(data$`N° CASOS ATENDIDOS-TOTAL`)
##  num [1:4698] 142 84 145 408 55 144 564 206 338 277 ...
summary(data$`N° CASOS ATENDIDOS-TOTAL`)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##     0.0   146.0   242.5   327.0   406.0  3926.0       2

Descripción: La mayoría de los centros reportan entre 146 (Q1) y 406 (Q3) casos al año, con algunos valores extremos que llegan hasta 3926, lo cual indica una alta dispersión y posible concentración de casos en ciertas sedes.

Elija una variable categórica y convierta la misma en factor (ordenado o no ordenado). Muestre y verifique que la clase efectivamente indique factor.

str(data$DEPARTAMENTO)
##  chr [1:4698] "APURÍMAC" "HUANCAVELICA" "HUÁNUCO" "APURÍMAC" "APURÍMAC" ...
data$DEPARTAMENTO<-factor(data$DEPARTAMENTO)
str(data$DEPARTAMENTO)
##  Factor w/ 33 levels "AMAZONAS","ANCASH",..: 5 11 13 5 5 27 7 1 8 9 ...

La variable DEPARTAMENTO es categórica porque representa regiones geográficas con un número limitado de categorías fijas. No tiene valores numéricos ni orden jerárquico que impliquen magnitud. En análisis estadístico, se trata como un factor para agrupar y comparar datos por ubicación.