🧪 Resumen del Análisis y preparación de tablas en este proyecto

Este proyecto consistió en el procesamiento y análisis descriptivo comparativo de una cohorte de pacientes con cáncer de recto tratados con terapias neoadyuvantes y cirugía (TNT).

🔍 Objetivos principales:

  1. Describir características clínicas y demográficas de la cohorte (Tabla 1).

  2. Comparar factores clínicos según respuesta patológica (residual parcial vs respuesta completa, RP vs RC) usando pruebas estadísticas apropiadas (Tabla 2).

🗄️ Carga y preparación de datos:

  • Datos provenientes de un archivo Excel (Base EBP.xlsx), hoja “Final”.

  • Uso de readxl::read_excel() para cargar, janitor::clean_names() para homogeneizar nombres.

  • Normalización de variables claves

    • sexo unificado a “Masculino” / “Femenino”

    • localización tumoral codificada en “Superior”, “Medio”, “Inferior”

    • respuesta patológica parcial vs completa basada en respuesta_patologica_t.

    • grado de diferenciación ordenado (Bien / Moderadamente / Poco diferenciada).

    • estadificación clínica (TNM) normalizada según convenciones estándar.

  • Adecuación de variables numéricas (edad, ACE, tamaño tumoral, días a cirugía) para análisis posterior.

📊 Análisis descriptivo — Tabla 1:

  • Variables continuas (edad, ACE, tamaño, días a cirugía) presentadas como media ± desviación estándar.

  • Variables categóricas (sexo, grado de diferenciación, localización, etapa clínica, esquema de RT, tipo de cirugía, respuesta patológica) mostradas como frecuencias (n, %).

  • Notas en español al pie de tabla explicando formato y abreviaturas utilizadas.

📈 Análisis comparativo — Tabla 2:

  • Comparación entre pacientes con respuesta patológica parcial (RP) y respuesta completa (RC).

  • Pruebas estadísticas empleadas:

    • t-test de Welch para variables continuas.

    • Test de chi-cuadrado de Pearson para variables categóricas.

    • Valores p reportados como Valor p.

  • Nombres de grupos renombrados a RP y RC.

  • Notas informativas al pie explicando pruebas estadísticas en español.

🧾 Notas al pie:

  • Tabla 1: abreviaturas definidas y formato de presentación (Media ± DE; n %).

  • Tabla 2: detalle de las pruebas estadísticas utilizadas y códigos de grupo.

📥 Limpieza y preparación de la base de datos en R:

Base_EBP <- read_excel("C:/Users/fidel/OneDrive - UNIVERSIDAD AUTONOMA DE SINALOA/MDATOS/DraISSSTETABLAS/Base EBP.xlsx")

datos <- Base_EBP %>%
  clean_names() %>%
  mutate(
    # SEXO
    sexo = case_when(
      str_detect(sexo, regex("masculino", ignore_case = TRUE)) ~ "Masculino",
      str_detect(sexo, regex("femenino", ignore_case = TRUE)) ~ "Femenino",
      TRUE ~ NA_character_
    ) %>% factor(levels = c("Femenino", "Masculino")),

    # LOCALIZACIÓN
    localizacion = case_when(
      str_detect(localizacion, regex("sup", ignore_case = TRUE)) ~ "Superior",
      str_detect(localizacion, regex("med", ignore_case = TRUE)) ~ "Medio",
      str_detect(localizacion, regex("inf", ignore_case = TRUE)) ~ "Inferior",
      TRUE ~ NA_character_
    ) %>% factor(levels = c("Superior", "Medio", "Inferior")),

    # RESPUESTA PATOLÓGICA
    respuesta_patologica = case_when(
      str_detect(respuesta_patologica_t, regex("completa", ignore_case = TRUE)) ~ "Completa",
      str_detect(respuesta_patologica_t, regex("parcial", ignore_case = TRUE)) ~ "Parcial",
      TRUE ~ NA_character_
    ) %>% factor(levels = c("Parcial", "Completa")),

    # GRADO DE DIFERENCIACIÓN
    grado_diferenciacion = case_when(
      str_detect(grado_de_diferenciacion, regex("bien", ignore_case = TRUE)) ~ "Bien diferenciada",
      str_detect(grado_de_diferenciacion, regex("modera", ignore_case = TRUE)) ~ "Moderadamente diferenciada",
      str_detect(grado_de_diferenciacion, regex("poco", ignore_case = TRUE)) ~ "Poco diferenciada",
      TRUE ~ NA_character_
    ) %>% factor(levels = c("Bien diferenciada", "Moderadamente diferenciada", "Poco diferenciada")),

    # ETAPA CLÍNICA (AGRUPADA: II, III, IV)
    etapa = case_when(
      str_detect(etapa_clinica, regex("^II[A-C]?$", ignore_case = TRUE)) ~ "II",
      str_detect(etapa_clinica, regex("^III[A-C]?$", ignore_case = TRUE)) ~ "III",
      str_detect(etapa_clinica, regex("^IV$", ignore_case = TRUE)) ~ "IV",
      TRUE ~ NA_character_
    ) %>% factor(levels = c("II", "III", "IV")),

    # ESQUEMA RT: unificar 5.04, 50 → 50.4
    esquema_rt = case_when(
      dosis_rt %in% c(5.04, 50, 50.4) ~ "50.4",
      dosis_rt == 45 ~ "45",
      dosis_rt == 25 ~ "25",
      TRUE ~ as.character(dosis_rt)
    ) %>% factor(levels = c("25", "45", "50.4")),

    # RESTO DE VARIABLES
    tipo_cirugia = factor(tipo_de_cirugia),
    tamanio_cm = as.numeric(tamano),
    ace = as.numeric(ace),
    edad = as.numeric(edad)
  )

📉 Tabla 1. Características basales

Tabla 1. Características basales de pacientes con cáncer de recto tratados con TNT (n = 40)
Variable1 N = 402
Edad (años) 62.3 (10.9)
Sexo
    Femenino 20 (51%)
    Masculino 19 (49%)
ACE (ng/ml) 12.2 (29.0)
Tamaño (cm) 6.4 (3.0)
Grado de diferenciación
    Bien diferenciada 4 (10%)
    Moderadamente diferenciada 35 (88%)
    Poco diferenciada 1 (2.5%)
Localización tumoral
    Superior 1 (2.5%)
    Medio 19 (48%)
    Inferior 20 (50%)
Etapa clínica
    II 7 (18%)
    III 32 (80%)
    IV 1 (2.5%)
Esquema RT (Gy)
    25 1 (2.5%)
    45 1 (2.5%)
    50.4 38 (95%)
Tipo de cirugía
    RAB 10 (25%)
    RAP 30 (75%)
Días a cirugía 126.2 (37.0)
Respuesta patológica
    Parcial 28 (70%)
    Completa 12 (30%)
RP = respuesta parcial; RC = respuesta completa. Nota: Media ± DE para variables continuas; frecuencia (n %) para categóricas.
1 Frecuencia (n %)
2 Media ± desviación estándar (Media ± DE)

📉 Tabla 2.Comparación según respuesta patológica

Tabla2. Comparación de factores clínicos según respuesta patológica a TNT (RP vsRC)
Factor1 RP
N = 28
2
RC
N = 12
2
Valor p
Edad (años) 62.5 (9.9) 61.9 (13.0) >0.9
Sexo

>0.9
    Femenino 14 (50%) 6 (55%)
    Masculino 14 (50%) 5 (45%)
ACE (ng/ml) 14.1 (34.7) 8.3 (9.9) 0.4
Tamaño tumoral (cm) 6.3 (3.1) 6.7 (2.8) 0.7
Localización (Inferior / Medio‑Superior)

0.7
    Superior 1 (3.6%) 0 (0%)
    Medio 14 (50%) 5 (42%)
    Inferior 13 (46%) 7 (58%)
Tiempo a cirugía (días) 126.1 (39.1) 126.4 (33.3) >0.9
t‑test de Welch para variables continuas; chi‑cuadrado de Pearson para categóricas.
1 Frecuencia (n%)
2 Media ± DE

Análisis Estadístico

El análisis estadístico se llevó a cabo utilizando el software R. Las variables cuantitativas continuas se describieron mediante medidas de tendencia central y dispersión, específicamente media y desviación estándar. Las variables cualitativas categóricas se resumieron como frecuencias absolutas y porcentajes.

Para la comparación entre grupos según la respuesta patológica al tratamiento neoadyuvante total (TNT), se emplearon pruebas paramétricas y no paramétricas, según el tipo de variable y la distribución observada. En particular, se utilizó la prueba t de Student con corrección de Welch para variables continuas, y la prueba de chi-cuadrado de Pearson para la comparación de proporciones en variables categóricas. Se consideró estadísticamente significativa toda diferencia con un valor p menor a 0.05.

La respuesta patológica se clasificó en dos grupos: respuesta completa (RC) y respuesta parcial (RP), y se establecieron agrupamientos adicionales para variables como el estadio clínico, el esquema de radioterapia y la localización tumoral, con el propósito de facilitar la interpretación clínica de los resultados.

Los resultados del análisis se organizaron en tablas de resumen descriptivo y comparativo, lo que permitió caracterizar adecuadamente a la población estudiada y evaluar posibles asociaciones entre las variables clínicas y la magnitud de la respuesta tumoral.

Resultados

Se analizaron un total de 40 pacientes con diagnóstico de cáncer de recto localmente avanzado, tratados mediante un esquema de terapia neoadyuvante total (TNT) seguido de cirugía con intención curativa. Las características clínicas y demográficas de la cohorte se presentan en la Tabla 1.

La edad media de los pacientes fue de 62.3 años (DE: 10.9). La distribución por sexo fue equilibrada, con un 51 % de mujeres y un 49 % de hombres. El valor medio del antígeno carcinoembrionario (ACE) fue de 12.2 ng/ml (DE: 29.0), evidenciando una amplia variabilidad en los niveles basales. En relación con el grado de diferenciación histológica, la mayoría de los casos correspondieron a tumores moderadamente diferenciados (88 %), mientras que el 10 % fueron bien diferenciados y el 2.5 % pobremente diferenciados.

Respecto a la localización del tumor, el 50 % de los casos se identificaron en el recto inferior, el 48 % en el tercio medio y únicamente un caso (2.5 %) en el segmento superior. La etapa clínica agrupada al momento del diagnóstico mostró que el 11.4 % de los pacientes se encontraban en estadio II, el 88.6 % en estadio III, y un solo caso (2.5 %) correspondió a estadio IV. En cuanto al tratamiento radioterapéutico, el esquema más frecuentemente empleado fue de 50.4 Gy (95 %), mientras que esquemas alternativos como 25 Gy y 45 Gy se utilizaron en proporciones marginales (2.5 % cada uno). La mayoría de los pacientes (75 %) fueron intervenidos mediante resección abdominoperineal (RAP), mientras que el 25 % restante recibió una resección anterior baja (RAB). El intervalo promedio entre la finalización de la radioterapia y la cirugía fue de 126.2 días (DE: 37.0). En términos de respuesta patológica, el 30 % de los pacientes presentó una respuesta completa (RC), mientras que el 70 % restante obtuvo una respuesta parcial (RP).

El análisis comparativo entre los grupos RP y RC, mostrado en la Tabla 2, no evidenció diferencias estadísticamente significativas en ninguna de las variables evaluadas. La edad media fue similar en ambos grupos (62.5 ± 9.9 años en RP vs. 61.9 ± 13.0 años en RC; p > 0.9). La proporción por sexo fue equivalente, con una distribución de 50 % femenino y 50 % masculino en RP, frente a 55 % femenino y 45 % masculino en RC (p > 0.9). Los niveles medios de ACE fueron más altos en el grupo RP (14.1 ± 34.7 ng/ml) que en RC (8.3 ± 9.9 ng/ml), aunque sin alcanzar significación estadística (p = 0.4).

El tamaño tumoral medio fue de 6.3 ± 3.1 cm en RP y 6.7 ± 2.8 cm en RC (p = 0.7). La distribución por localización tumoral también fue similar entre los grupos: en RP, 50 % de los tumores se localizaron en el segmento medio y 46 % en el inferior; en RC, el 42 % fueron medios y el 58 % inferiores (p = 0.7). Finalmente, el tiempo promedio a cirugía fue prácticamente idéntico entre grupos (126.1 ± 39.1 días en RP vs. 126.4 ± 33.3 días en RC; p > 0.9).

Estos resultados indican que, en esta cohorte, no se identificaron factores clínicos o demográficos significativamente asociados con la obtención de una respuesta patológica completa tras la terapia neoadyuvante. La falta de asociación estadística sugiere que variables adicionales, posiblemente de tipo molecular o genético, podrían estar involucradas en la modulación de la respuesta al tratamiento.