Conjunto de datos, tamaño de muestra y número de variables

Se realizará el análisis de los datos “Defunciones de la ciudad de Pereira” extraído de la página datos.gov.co. Este estudio de orden territorial fue actualizado el 25 de febrero de 2025 por la Secretaría de Salud de la Alcaldía de la ciudad mencionada. El conjunto de datos cuenta con 5,841 filas y 13 variables para cada una de estas, donde se presenta información sobre la persona y su defunción.

Decripción de variables
Variable Tipo Descripción
Departamento Cualitativa (nominal) Departamento donde ocurre la defunción.
Municipio Cualitativa (nominal) Municipio donde ocurre la defunción.
Área de defunción Cualitativa (nominal) Área donde ocurre la defunción.
Sitio de defunción Cualitativa (nominal) Sitio donde ocurre la defunción.
Tipo de defunción Cualitativa (nominal) Tipo de defunción.
Fecha de defunción Cualitativa (ordinal) Fecha de la defunción.
Sexo Cualitativa (nominal) Masculino o femenino.
Edad Cuantitativo (discreto) Edad cuando ocurre la defunción.
Nivel educativo Cualitativa (ordinal) Nivel educativo del difunto.
Ocupación Cualitativa (nominal) Ocupación del difunto.
Área de residencia Cualitativa (nominal) Área de residencia del difunto.
Probable manera de muerte Cualitativa (nominal) Probable manera de muerte.
Causa básica de la defunción Cualitativa (nominal) Causa básica de la defunción.

Presencia de inconsistencias, errores de digitación, información faltante, entre otros (Corrección de datos)

Se corrigió el campo de edad ya que se presentaba como datos cualitativos al mencionar número y “mes”, “año” o “días” según el caso. Teniendo esto en cuenta se realiza la eliminación de estas palabras y se borran las filas que contenían “días” y “meses”, incluyendo únicamente los datos que en la columna de edad tenían “años” registrados, esto provocó un cambio en el número de datos de 5841 a 5765 y se debe mencionar que la estadística se aplicará entonces en “Defunciones de la ciudad de Pereira en personas mayores o iguales a 1 año de edad”.

Estadísticas descriptivas de forma univariada

Resumen de la variable cuantitativa
Variable Mínimo Máximo Promedio Mediana Rango intercuartílico Desviación Estándar Coeficiente de variación (%)
Edad 1 107 74.5 79 25 21.06 28.27
Resumen de las variables cualitativas
Variable Cantidad (%)
Departamento Risaralda: 5765 (100%)
Municipio Pereira: 5765 (100%)
Área de defunción Cabecera municipal: 5568 (96.7%) / Centro poblado: 89 (1.5%) / Rural disperso: 108 (1.87%)
Sitio de defunción Casa/Domicilio: 1103 (19.13%) / Centro/Puesto de salud: 5 (0.09%) / Hospital/Clínica: 4469 (77.5%) / Lugar de trabajo: 8 (0.14%) / Vía Pública: 118 (2.04%) / Otro: 62 (1.1%)
Fecha de defunción 04/02/2023: 28 (0.49%) / 22/08/2023: 26 (0.46%) / 05/07/2023: 25 (0.43%) / 14/05/2023: 25 (0.43%) / 17/01/2023: 25 (0.43%) / 22/11/2023: 25 (0.43%) / (Other): 5611 (97.33%)
Sexo Femenino: 2684 (46.56%) / Masculino: 3081 (53.44%)
Nivel educativo Básica primaria: 2067 (35.85%) / Sin información: 1933 (33.53%) / Básica secundaria: 498 (8.64%) / Ninguno: 461 (8%) / Media académica o clásica: 329 (5.71%) / Profesional: 212 (3.68%) / Otro: 265 (4.59%)
Ocupación Sin información: 5335 (97%) / Agricultores y trabajadores calificados de cultivos mixtos: 49 (0.86%) / Comerciantes de tiendas: 32 (0.59%) / Agricultores y trabajadores calificados de plantaciones de árboles y arbustos: 21 (0.38%) / Personas que realizan trabajos varios: 21 (0.38%) / Agricultores y trabajadores calificados de cultivos extensivos: 14 (0.26%) / Otros: 296 (5.41%)
Área de residencia Cabecera municipal: 4951 (85.9%) / Centro poblado: 219 (3.79%) / Rural disperso: 565 (9.8%) / Sin información: 30 (0.52%)
Probable manera de muerte En estudio: 5 (0.087%) / Natural: 5324 (92.35%) / Violenta: 436 (7.56%)
Causa básica de defunción Infarto agudo del miocardio, sin otra especificación: 785 (13.6%) / Enfermedad pulmonar obstructiva crónica con infección aguda de las vías respiratorias inferiores: 168 (2.9%) / Tumor maligno del estómago, parte no especificada: 147 (2.54%) / Enfermedad pulmonar obstructiva crónica, no especificada: 145 (2.51%) / Neumonía, no especificada: 135 (2.34%) / Tumor maligno de los bronquios o del pulmón, parte no especificada: 128 (2.2%) / Otros: 4257 (73.8%)

Gráficas

Sexo

Área de defunción

Causa

Sitio de defunción

Nivel educativo

Área de residencia

Probable manera de muerte

Ocupación

Histograma de edades

Análisis con dos variables

Este apartado tiene como objetivo analizar la relación entre variables o establecer comparaciones estadísticas a partir de los datos disponibles. Se imposibilita la realización del análisis mediante diversas variables cuantitativas ya que solo se cuenta con una variable de este tipo.

Diagrama de cajas

  • El grupo que presenta muerte natural cuenta con la mayor mediana de edad, alrededor de los 75 años, lo que indica que la mayoría de las muertes naturales ocurren en personas mayores. Además, presenta un rango intercuartílico amplio y varios valores atípicos en edades muy bajas, lo que refleja cierta variabilidad en los casos.

  • Las defunciones por causas violentas presentan una mediana más baja, cerca de los 45 años, y un rango más amplio, lo que evidencia que afectan a personas en un espectro etario más diverso, desde jóvenes hasta adultos mayores. Para el anális con variables cualitativas, se presenta una tabla cruzada y un diagrama de barras apiladas:

  • En el grupo de causas en estudio, aunque cuente con pocos casos, concentra la mayoría de las muertes en edades jóvenes o adultas tempranas (mediana cercana a los 30-35 años). El rango intercuartílico es más estrecho, lo que indica menos variabilidad en comparación con los otros grupos.

Tabla cruzada (Sitio y nivel educativo)

##                         
##                          BASICA PRIMARIA BASICA SECUNDARIA DOCTORADO
##   CASA/DOMICILIO                     489               103         0
##   CENTRO/PUESTO DE SALUD               2                 0         0
##   HOSPITAL/CLINICA                  1532               370         2
##   LUGAR DE TRABAJO                     3                 3         0
##   OTRO                                16                 9         0
##   VIA P?BLICA                         25                13         0
##   Sum                               2067               498         2
##                         
##                          ESPECIALIZACION MAESTRIA MEDIA ACADEMICA O CLASICA
##   CASA/DOMICILIO                       6        2                        53
##   CENTRO/PUESTO DE SALUD               0        0                         0
##   HOSPITAL/CLINICA                    19        5                       247
##   LUGAR DE TRABAJO                     0        0                         1
##   OTRO                                 0        0                         6
##   VIA P?BLICA                          0        0                        22
##   Sum                                 25        7                       329
##                         
##                          MEDIA TECNICA NINGUNO NORMALISTA PREESCOLAR
##   CASA/DOMICILIO                    11     105          9         32
##   CENTRO/PUESTO DE SALUD             0       0          0          0
##   HOSPITAL/CLINICA                  36     352          7         52
##   LUGAR DE TRABAJO                   0       0          0          0
##   OTRO                               0       3          0          0
##   VIA P?BLICA                        0       1          1          0
##   Sum                               47     461         17         84
##                         
##                          PROFESIONAL SIN INFORMACION TECNICA PROFESIONAL
##   CASA/DOMICILIO                  49             233                   7
##   CENTRO/PUESTO DE SALUD           0               3                   0
##   HOSPITAL/CLINICA               159            1620                  43
##   LUGAR DE TRABAJO                 0               1                   0
##   OTRO                             1              26                   0
##   VIA P?BLICA                      3              50                   3
##   Sum                            212            1933                  53
##                         
##                          TECNOLOGICA  Sum
##   CASA/DOMICILIO                   4 1103
##   CENTRO/PUESTO DE SALUD           0    5
##   HOSPITAL/CLINICA                25 4469
##   LUGAR DE TRABAJO                 0    8
##   OTRO                             1   62
##   VIA P?BLICA                      0  118
##   Sum                             30 5765

Los resultados de la tabla cruzada se resumen en la siguiente imágen/tabla:

Distribución de las defunciones según el sitio y el nivel educativo
Sitio.de.defunción Básica.primaria Básica.secundaria Doctorado Especialización Maestría Media.académica.o.clásica Media.técnica Ninguno Normalista Preescolar Profesional Sin.información Técnica.profesional Tecnológica Total
Casa/Domicilio 489 103 0 6 2 53 11 105 9 32 49 233 7 4 1103
Centro/Puesto de salud 2 0 0 0 0 0 0 0 0 0 0 3 0 0 5
Hospital/Clínica 1532 370 2 19 5 247 36 352 7 52 159 1620 43 25 4469
Lugar de trabajo 3 3 0 0 0 1 0 0 0 0 0 1 0 0 8
Otro 16 9 0 0 0 6 0 3 0 0 1 26 0 1 62
Vía pública 25 13 0 0 0 22 0 1 1 0 3 50 3 0 118
Sum 2067 498 2 25 7 329 47 461 17 84 212 1933 53 30 5765

Gráfico de barras apiladas