Analisis descriptivo variables cualitativas

table (Cáncer_infantil_20260208$Municipio_residencia)

PEREIRA 
     79 
summarytools::freq(Cáncer_infantil_20260208$Municipio_residencia, cumul = FALSE)
Frequencies  
Cáncer_infantil_20260208$Municipio_residencia  
Type: Character  

                Freq   % Valid   % Total
------------- ------ --------- ---------
      PEREIRA     79    100.00    100.00
         <NA>      0                0.00
        Total     79    100.00    100.00
summarytools::freq(Cáncer_infantil_20260208$SEXO, cumul = FALSE)
Frequencies  
Cáncer_infantil_20260208$SEXO  
Type: Character  

                  Freq   % Valid   % Total
--------------- ------ --------- ---------
       FEMENINO     43     54.43     54.43
      MASCULINO     36     45.57     45.57
           <NA>      0                0.00
          Total     79    100.00    100.00
summarytools::freq(Cáncer_infantil_20260208$estrato, cumul = FALSE)
Frequencies  
Cáncer_infantil_20260208$estrato  
Type: Numeric  

              Freq   % Valid   % Total
----------- ------ --------- ---------
          1     19     24.05     24.05
          2     37     46.84     46.84
          3     18     22.78     22.78
          4      2      2.53      2.53
          5      2      2.53      2.53
          6      1      1.27      1.27
       <NA>      0                0.00
      Total     79    100.00    100.00

Analisis descriptivo variables cuantitativas

summary(Cáncer_infantil_20260208$EDAD)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.000   4.000   9.000   9.114  14.000  17.000 
summary(Cáncer_infantil_20260208$SEMANA)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
   1.00   16.00   31.00   29.33   44.50   50.00 
summarytools::descr(Cáncer_infantil_20260208[,c(1,3,4,10)])
Descriptive Statistics  
Cáncer_infantil_20260208[, c(1, 3, 4, 10)]  
N: 79  

                        AÑO     EDAD   estrato   SEMANA
----------------- --------- -------- --------- --------
             Mean   1790.43     9.11      2.16    29.33
          Std.Dev    645.37     5.39      0.99    15.40
              Min      2.02     1.00      1.00     1.00
               Q1   2018.00     4.00      2.00    16.00
           Median   2020.00     9.00      2.00    31.00
               Q3   2022.00    14.00      3.00    45.00
              Max   2024.00    17.00      6.00    50.00
              MAD      2.97     7.41      1.48    20.76
              IQR      4.00    10.00      1.00    28.50
               CV      0.36     0.59      0.46     0.53
         Skewness     -2.38    -0.03      1.23    -0.29
      SE.Skewness      0.27     0.27      0.27     0.27
         Kurtosis      3.73    -1.51      2.37    -1.36
          N.Valid     79.00    79.00     79.00    79.00
                N     79.00    79.00     79.00    79.00
        Pct.Valid    100.00   100.00    100.00   100.00

Analisis bivariado

table(Cáncer_infantil_20260208$Municipio_residencia, Cáncer_infantil_20260208$SEXO)
         
          FEMENINO MASCULINO
  PEREIRA       43        36

Preguntas y respuestas:

1.¿Qué variables son cualitativas y cuáles son cuantitativas en la base? Justifique su clasificación.

Respuesta:

Variables cualitativas:

Municipio_residencia es cualitativa porque identifica el municipio donde reside el menor (en este caso, todas las observaciones corresponden a PEREIRA), sin orden numérico asociado.

La variable sexo es cualitativa, clasifica a los niños en categorías FEMENINO y MASCULINO, que no tienen jerarquía numérica sino que representan grupos.

Variables cuantitativas:

El año es cuantitativa porque registra el año calendario del evento (2017, 2018,etc); aunque son fechas, se analizan como números enteros sobre los cuales se calculan media, desviación estándar, etc.

La variable edad es cuantitativa porque expresa la edad en años (y en pocos casos en meses) de los pacientes; es una magnitud numérica que admite operaciones y comparaciones de magnitud.

Estrato es cuantitativa de tipo ordinal codificada numéricamente (1, 2, 3,etc); aunque conceptualmente representa categorías socioeconómicas, en el análisis se usa como variable numérica con media, desviación estándar e indicadores de dispersión.

La variable SEMANA es cuantitativa porque indica el número de semana epidemiológica (1 a 50); se comporta como conteo y permite cálculo de promedios, cuartiles y medidas de dispersión.

2. Para cada variable cualitativa, ¿cuál es su tabla de frecuencias (absoluta y relativa) y qué categorías concentran la mayor proporción?

Respuesta:

Variable: Municipio de residencia

Municipio Frecuencia absoluta Frecuencia relativa (%)
Pereira 79 100.00
Total 79 100.00

Conclusión: en esta base, la totalidad de los casos de cáncer infantil analizados residen en el municipio de Pereira, por lo que no hay diferenciación territorial dentro de la muestra.

Variable: Sexo

Sexo Frecuencia absoluta Frecuencia relativa (%)
Femenino 43 54.43
Masculino 36 45.57
Total 79 100.00

Conclusión: la categoría que concentra la mayor proporción de casos es el sexo femenino, con algo más de la mitad de los registros (54,43%), mientras que el sexo masculino representa cerca de la mitad restante (45,57%).

3.Para cada variable cuantitativa, ¿cuáles son los indicadores de resumen (mínimo, máximo, media, mediana, cuartiles, desviación estándar)?

Respuesta:

Estadísticos descriptivos de las variables cuantitativas

Estadístico Año Edad Estrato Semana
Media 1790.43 9.11 2.16 29.33
Desviación estándar 645.37 5.39 0.99 15.40
Mínimo 2.02 1.00 1.00 1.00
Q1 2018.00 4.00 2.00 16.00
Mediana 2020.00 9.00 2.00 31.00
Q3 2022.00 14.00 3.00 45.00
Máximo 2024.00 17.00 6.00 50.00
Coeficiente de variación (CV) 0.36 0.59 0.46 0.53

Para la variable año,el mínimo es 2018, pues el valor 2,02 en la tabla corresponde a un problema de formato, pero los cuartiles indican años entre 2018 y 2024.

4.¿Qué variables muestran mayor variabilidad y cómo se interpreta en este contexto?

Respuesta:

Para evaluar la variabilidad relativa se utiliza el coeficiente de variación (CV) reportado en la tabla descriptiva.

La variable que muestra mayor variabilidad relativa es EDAD (CV = 0,59), seguida de SEMANA (0,53), estrato (0,46) y AÑO (0,36). Esto indica que, en proporción a su media, las edades de los niños con cáncer infantil en Pereira están bastante dispersas: hay casos desde la primera infancia hasta los 17 años, lo que sugiere que la enfermedad afecta de manera amplia a distintos grupos etarios dentro de la población infantil y adolescente.

La alta variabilidad en SEMANA (0,53) refleja que los casos se distribuyen a lo largo de muchas semanas epidemiológicas, sin concentrarse exclusivamente en un periodo corto del año, lo que apunta a que el diagnóstico de cáncer infantil se presenta de manera relativamente constante durante el año, más que en brotes puntuales. En contraste, el AÑO tiene menor variación relativa porque la base se concentra en un rango de años relativamente acotado (2018–2024), y estrato, aunque variable, se mueve sobre todo entre estratos 1, 2 y 3.

5. ¿Qué patrones o diferencias relevantes se observan entre las variables cualitativas?

Respuesta:

FEMENINO MASCULINO
PEREIRA 43 36

Conclusiones:

A nivel territorial, no se observan diferencias entre municipios porque toda la base corresponde a un único municipio (Pereira); esto implica que la variación observada en edad, estrato o semana se interpreta dentro de la realidad local de Pereira.

En términos de sexo, se observa una ligera predominancia de casos en el sexo femenino (54,43%) frente al masculino (45,57%), lo cual sugiere que, en este conjunto de datos, la carga de cáncer infantil está levemente más concentrada en niñas y adolescentes, aunque las proporciones son relativamente cercanas.

El estrato medio alrededor de 2 y el rango de 1 a 6 indican que, aunque predominan los estratos bajos, existen casos en casi todos los niveles socioeconómicos, por lo que el cáncer infantil no se restringe a un único grupo de estrato dentro del municipio.

6.¿Qué conclusiones descriptivas preliminares se pueden extraer sobre las variables cuantitativas?

Respuesta:

AÑO: el rango va aproximadamente de 2018 a 2024, con una mediana en 2020 y un sesgo negativo (skewness = −2,38); esto sugiere una mayor concentración de casos en los primeros años del periodo y relativamente menos registros en los años más recientes, lo que puede deberse a cambios en la vigilancia, el registro o la incidencia.

EDAD: toma valores entre 1 y 17 años, con mediana 9 y media cercana (9,11), y skewness cercano a cero (−0,03), lo que indica una distribución aproximadamente simétrica; ello refleja que hay una presencia relevante tanto de niños pequeños como de adolescentes, sin una acumulación extrema hacia edades muy bajas o muy altas.

estrato: oscila entre 1 y 6, con media 2,16, mediana 2 y Q3 = 3, y presenta sesgo positivo (skewness = 1,23); este patrón sugiere que la gran mayoría de los casos se concentra en estratos bajos (1 y 2) y que los estratos altos (4, 5 y 6) son menos frecuentes, lo cual es coherente con la estructura socioeconómica general y con una mayor vulnerabilidad o mayor peso poblacional en los estratos bajos.

SEMANA: varía desde la semana 1 hasta la 50, con mediana 31, media 29,33 y un sesgo ligeramente negativo (skewness = −0,29); esto indica que los casos se distribuyen a lo largo del año con leve mayor peso hacia la primera mitad, pero sin una asimetría marcada, lo que sugiere que el diagnóstico de cáncer infantil se da de manera relativamente uniforme durante las semanas del año.