Este conjunto de datos está relacionado con un estudio de análisis de supervivencia en pacientes con cirrosis, lo que significa que se analiza la duración del tiempo hasta que ocurre un evento de interés (la muerte). Se utilizan técnicas estadísticas como Kaplan-Meier para estimar la función de supervivencia y evaluar diferencias entre grupos.
El conjunto de datos incluye información demográfica, clínica y bioquímica de los pacientes, así como su tiempo de seguimiento y estado al final del estudio.
| Variable | Tipo | Descripción |
|---|---|---|
| ID | Nominal | Identificador único del paciente. |
| Días_Seguimiento | Continua | Número de días de seguimiento del paciente. |
| Estado | Ordinal | Estado del paciente (0 = vivo, 1 = fallecido). |
| Medicamento | Nominal | Tipo de tratamiento recibido. |
| Edad | Continua | Edad del paciente en días. |
| Sexo | Nominal | Sexo del paciente (hombre/mujer). |
| Ascitis | Nominal | Presencia de ascitis (sí/no). |
| Hepatomegalia | Nominal | Presencia de hepatomegalia (sí/no). |
| Angiomas | Nominal | Presencia de angiomas aracniformes (sí/no). |
| Edema | Nominal | Presencia de edema (sí/no). |
| Bilirrubina | Continua | Nivel de bilirrubina en sangre (mg/dL). |
| Colesterol | Continua | Nivel de colesterol en sangre (mg/dL). |
| Albúmina | Continua | Nivel de albúmina en sangre (g/dL). |
| Cobre | Continua | Nivel de cobre en sangre (µg/dL). |
| Fosfatasa_Alcalina | Continua | Fosfatasa alcalina (UI/L). |
| SGOT | Continua | Enzima transaminasa glutámico oxaloacética (UI/L). |
| Triglicéridos | Continua | Nivel de triglicéridos en sangre (mg/dL). |
| Plaquetas | Discreta | Conteo de plaquetas (mil/mcL). |
| Protrombina | Discreta | Tiempo de protrombina (segundos). |
| Etapa | Ordinal (discreta) | Estadío de la cirrosis (1 a 4, donde 4 es el más severo). |
## ID Días_Seguimiento Estado Medicamento
## 0 0 0 0
## Edad Sexo Ascitis Hepatomegalia
## 0 0 0 0
## Angiomas Edema Bilirrubina Colesterol
## 0 0 0 0
## Albúmina Cobre Fosfatasa_Alcalina SGOT
## 0 0 0 0
## Triglicéridos Plaquetas Protrombina Etapa
## 0 0 0 0
Distribución de Medicamento : El gráfico muestra la frecuencia de los participantes en dos grupos: D-penicilamine y Placebo. Ambas categorías tienen la misma frecuencia, lo que indica un balance en la distribución de los participantes para los dos tratamientos analizados. Esto es útil para validar comparaciones equitativas en el análisis del estudio.
Distribución de Sexo: El gráfico muestra dos barras que representan la frecuencia de hombres (M) y mujeres (F) en el conjunto de datos. La barra de las mujeres tiene una frecuencia mucho más alta (alrededor de 200), mientras que los hombres están por encima de 50. Esto indica un claro predominio femenino en los datos.
Distribución de Ascitis: El gráfico titulado “Distribución de Ascitis” muestra dos barras que indican la frecuencia de pacientes con ascitis. El valor “N” (sin ascitis) tiene una frecuencia mayor, cercana a 240, mientras que “Y” (con ascitis) apenas alcanza los 30. Esto sugiere que la mayoría de los pacientes no presentan esta condición.
Distribución de Hepatomegalia: El gráfico titulado “Distribución de Hepatomegalia” muestra la frecuencia de esta condición en los pacientes. Las categorías “N” (No) y “Y” (Sí) tienen la misma frecuencia, aproximadamente 150. Esto indica que la presencia y la ausencia de hepatomegalia están equilibradas en el conjunto de datos.
Distribución de Angiomas: El gráfico titulado “Distribución de Angiomas” muestra dos categorías: “N” (sin angiomas) con una frecuencia aproximada de 160, y “Y” (con angiomas) con una frecuencia cercana a 80. Esto indica que la mayoría de los pacientes no presentan esta condición.
Distribución de Edema: En el gráfico titulado “Distribución de Edema,” se observa que la categoría “N” (sin edema) tiene una frecuencia significativamente mayor, superando las 200 ocurrencias, mientras que “S” y “T” están por debajo de 50.
Distribución de Etapas: El gráfico presenta la frecuencia de las diferentes etapas de la enfermedad. La etapa 3 es la más común, con aproximadamente 105 casos, seguida de la etapa 4 con 85. Las etapas 2 y 1 son menos frecuentes, con 55 y 20 casos, respectivamente.
Para la variable Albúmina, el histograma muestra que los valores se concentran entre 3.2 y 3.8, con un pico de frecuencia alrededor de 3.5. El boxplot refuerza esta observación, mostrando una mediana también cercana a 3.5. Además, se identifican algunos valores atípicos por debajo del rango, lo que podría indicar casos clínicos interesantes que merecen una revisión más detallada.
Para la variable Cobre, el histograma muestra que la mayoría de los valores están concentrados en la parte baja del rango, lo que indica que los niveles bajos de cobre son predominantes entre los pacientes. En el boxplot, se observa la mediana en el rango bajo y la presencia de outliers por encima del límite superior, lo que sugiere algunos casos con valores significativamente elevados que podrían ser clínicamente relevantes.
Para la variable SGOT, observamos que el histograma tiene un claro pico de frecuencias alrededor de 30, con la mayoría de los valores concentrados entre 0 y 200. El boxplot muestra una mediana cercana a 100, con un rango intercuartílico entre 50 y 150, además de algunos valores atípicos que se extienden más allá de 200. Esto refleja una distribución ligeramente sesgada que podría estar influenciada por casos específicos con niveles altos de SGOT.
Para la variable Plaquetas, el histograma muestra que la mayoría de los valores están concentrados entre 200 y 400 mil/mcL, con un pico claro alrededor de 300. En el boxplot, se confirma que la mediana está cercana a 300, con un rango intercuartílico que va de 200 a 400. También se observa un outlier por encima de 500, lo que podría señalar un caso especial que requiere mayor análisis.
Para la variable Triglicéridos, el histograma muestra que la mayor frecuencia se encuentra entre 100 y 150 mg/dL, indicando que la mayoría de los pacientes tienen niveles moderados. El boxplot refuerza esto al mostrar una mediana cercana a 100 y un rango intercuartílico entre 75 y 150. También se identifica un outlier por encima de 250, lo cual podría ser relevante para análisis adicionales.
El histograma de la variable Edad muestra que la mayoría de las edades están concentradas alrededor de los 20,000 días (~55 años). En el boxplot de la misma variable, se observa que la mediana está cerca de este valor, con algunos valores atípicos en los extremos. Esto refleja una población mayormente homogénea en términos de edad, con pocos casos fuera del rango esperado.
Para la variable Bilirrubina, el histograma muestra que los niveles están concentrados en valores bajos, con un pico pronunciado al inicio y una cola larga hacia la derecha, indicando una distribución sesgada. En el boxplot, se observa que la mediana está cerca de 1, con un rango intercuartílico entre 0.5 y 2, y un outlier superior a 8. Esto sugiere que, aunque la mayoría de los pacientes tienen niveles bajos, hay casos que se desvían significativamente del promedio.
Para la variable Colesterol, el histograma muestra que los niveles más comunes se encuentran entre 200 y 300 mg/dL, con una disminución en frecuencia fuera de este rango. El boxplot confirma que la mediana está cerca de 300, con un rango intercuartílico de 200 a 400. Además, se observan valores atípicos superiores a 600, lo que podría indicar casos extremos o condiciones específicas en ciertos pacientes.
## Estado Frecuencia
## 1 Censurado 147
## 2 No Censurado 111
El modelo de Kaplan-Meier permite estimar la probabilidad de supervivencia a lo largo del tiempo. A continuación, ajustamos el modelo y visualizamos la curva de supervivencia.
## Call: survfit(formula = Surv(Días_Seguimiento, Estado) ~ 1, data = data)
##
## n events median 0.95LCL 0.95UCL
## [1,] 258 111 3282 2796 3762
Para la variable Supervivencia Global, el análisis Kaplan-Meier muestra que de 258 pacientes, hubo 111 eventos observados. La mediana de supervivencia fue de 3282 días, con un intervalo de confianza al 95% entre 2796 y 3762 días. Esto sugiere una alta variabilidad en los tiempos de supervivencia dentro de este grupo de pacientes.
La mediana de supervivencia representa el tiempo en el que la probabilidad de supervivencia es del 50%. Es un indicador robusto para comparar grupos de pacientes.
## median
## 3282
## Call: survfit(formula = Surv(Días_Seguimiento, Estado) ~ 1, data = data)
##
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 41 258 1 0.996 0.00387 0.989 1.000
## 51 257 1 0.992 0.00546 0.982 1.000
## 71 256 1 0.988 0.00667 0.975 1.000
## 77 255 1 0.984 0.00769 0.970 1.000
## 110 254 1 0.981 0.00858 0.964 0.998
## 131 253 1 0.977 0.00938 0.959 0.995
## 140 252 1 0.973 0.01011 0.953 0.993
## 179 251 1 0.969 0.01079 0.948 0.990
## 186 250 1 0.965 0.01142 0.943 0.988
## 191 249 1 0.961 0.01202 0.938 0.985
## 198 248 1 0.957 0.01258 0.933 0.982
## 216 247 1 0.953 0.01311 0.928 0.980
## 223 246 1 0.950 0.01362 0.923 0.977
## 264 245 1 0.946 0.01410 0.918 0.974
## 304 244 1 0.942 0.01457 0.914 0.971
## 321 243 1 0.938 0.01502 0.909 0.968
## 326 242 1 0.934 0.01545 0.904 0.965
## 334 241 1 0.930 0.01586 0.900 0.962
## 348 240 1 0.926 0.01626 0.895 0.959
## 388 239 1 0.922 0.01665 0.890 0.956
## 400 238 1 0.919 0.01702 0.886 0.953
## 460 237 1 0.915 0.01739 0.881 0.949
## 515 236 1 0.911 0.01774 0.877 0.946
## 549 235 1 0.907 0.01808 0.872 0.943
## 552 234 1 0.903 0.01842 0.868 0.940
## 597 233 1 0.899 0.01874 0.863 0.937
## 611 232 1 0.895 0.01906 0.859 0.933
## 673 231 1 0.891 0.01936 0.854 0.930
## 694 230 1 0.888 0.01966 0.850 0.927
## 733 229 1 0.884 0.01996 0.845 0.924
## 750 228 1 0.880 0.02024 0.841 0.920
## 762 227 1 0.876 0.02052 0.837 0.917
## 769 226 1 0.872 0.02079 0.832 0.914
## 786 225 1 0.868 0.02106 0.828 0.910
## 790 223 1 0.864 0.02132 0.824 0.907
## 797 222 1 0.860 0.02158 0.819 0.904
## 799 221 1 0.857 0.02183 0.815 0.900
## 850 219 1 0.853 0.02208 0.810 0.897
## 853 218 1 0.849 0.02232 0.806 0.894
## 859 217 1 0.845 0.02256 0.802 0.890
## 890 216 1 0.841 0.02279 0.797 0.887
## 904 215 1 0.837 0.02302 0.793 0.883
## 930 214 1 0.833 0.02324 0.789 0.880
## 943 212 1 0.829 0.02346 0.784 0.876
## 974 211 1 0.825 0.02367 0.780 0.873
## 980 210 1 0.821 0.02389 0.776 0.869
## 999 208 1 0.817 0.02409 0.771 0.866
## 1012 207 1 0.813 0.02430 0.767 0.862
## 1077 205 1 0.809 0.02450 0.763 0.859
## 1080 204 1 0.805 0.02470 0.758 0.855
## 1083 203 1 0.801 0.02490 0.754 0.852
## 1152 201 1 0.797 0.02509 0.750 0.848
## 1165 199 1 0.793 0.02528 0.745 0.845
## 1170 198 1 0.789 0.02547 0.741 0.841
## 1191 197 2 0.781 0.02583 0.732 0.834
## 1212 195 1 0.777 0.02601 0.728 0.830
## 1235 190 1 0.773 0.02619 0.724 0.826
## 1297 185 1 0.769 0.02638 0.719 0.823
## 1356 178 1 0.765 0.02659 0.714 0.819
## 1360 177 1 0.761 0.02679 0.710 0.815
## 1413 171 1 0.756 0.02700 0.705 0.811
## 1427 168 1 0.752 0.02721 0.700 0.807
## 1434 166 1 0.747 0.02742 0.695 0.803
## 1444 164 1 0.743 0.02763 0.690 0.799
## 1487 160 1 0.738 0.02784 0.685 0.795
## 1536 158 1 0.733 0.02805 0.680 0.790
## 1576 154 1 0.728 0.02827 0.675 0.786
## 1657 148 1 0.724 0.02851 0.670 0.782
## 1682 146 1 0.719 0.02874 0.664 0.777
## 1690 145 2 0.709 0.02918 0.654 0.768
## 1741 140 1 0.704 0.02941 0.648 0.764
## 1786 133 1 0.698 0.02966 0.643 0.759
## 1827 130 1 0.693 0.02992 0.637 0.754
## 1847 127 1 0.687 0.03017 0.631 0.749
## 1925 123 1 0.682 0.03044 0.625 0.744
## 2055 114 1 0.676 0.03076 0.618 0.739
## 2090 113 1 0.670 0.03106 0.612 0.734
## 2105 112 1 0.664 0.03135 0.605 0.728
## 2224 105 1 0.658 0.03169 0.598 0.723
## 2256 102 1 0.651 0.03203 0.591 0.717
## 2288 100 1 0.645 0.03236 0.584 0.711
## 2297 98 1 0.638 0.03269 0.577 0.705
## 2386 90 1 0.631 0.03309 0.569 0.699
## 2400 89 1 0.624 0.03347 0.562 0.693
## 2419 88 1 0.617 0.03383 0.554 0.687
## 2466 83 1 0.609 0.03423 0.546 0.680
## 2540 80 1 0.602 0.03464 0.538 0.674
## 2583 75 1 0.594 0.03509 0.529 0.667
## 2598 74 1 0.586 0.03552 0.520 0.660
## 2689 69 1 0.577 0.03601 0.511 0.652
## 2769 66 1 0.568 0.03651 0.501 0.645
## 2796 64 1 0.560 0.03701 0.492 0.637
## 2847 61 1 0.550 0.03752 0.482 0.629
## 3086 51 1 0.540 0.03830 0.470 0.620
## 3090 50 1 0.529 0.03903 0.458 0.611
## 3170 45 1 0.517 0.03989 0.445 0.601
## 3244 44 1 0.505 0.04068 0.432 0.592
## 3282 42 1 0.493 0.04145 0.418 0.582
## 3358 39 1 0.481 0.04227 0.405 0.571
## 3395 37 1 0.468 0.04308 0.390 0.560
## 3428 35 1 0.454 0.04387 0.376 0.549
## 3445 34 1 0.441 0.04457 0.362 0.538
## 3574 32 1 0.427 0.04526 0.347 0.526
## 3584 29 1 0.412 0.04603 0.331 0.513
## 3762 25 1 0.396 0.04705 0.314 0.500
## 3839 22 1 0.378 0.04823 0.294 0.485
## 3853 21 1 0.360 0.04918 0.275 0.470
## 4079 14 1 0.334 0.05196 0.246 0.453
## 4191 10 1 0.301 0.05650 0.208 0.435
El análisis Kaplan-Meier Global muestra que el tiempo inicial tiene una alta probabilidad de supervivencia (0.996) que disminuye gradualmente, con eventos distribuidos de manera uniforme. Por ejemplo, a los 3282 días, la supervivencia es de 0.493 (mediana), y el intervalo de confianza al 95% oscila entre 0.418 y 0.582. Esto indica una pérdida constante de sujetos en riesgo con variabilidad moderada en los tiempos de supervivencia.
Hipótesis nula : No hay diferencias en las curvas de supervivencia.
Hipótesis alternativa : Hay diferencias significativas en las curvas de supervivencia.
Si p-valor > 0.05 → No hay evidencia suficiente para afirmar que las curvas de supervivencia son diferentes.
Si p-valor ≤ 0.05 → Se rechaza ya que hay diferencias significativas en las curvas de supervivencia
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Sexo, data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Sexo=F 227 90 97.3 0.552 4.53
## Sexo=M 31 21 13.7 3.932 4.53
##
## Chisq= 4.5 on 1 degrees of freedom, p= 0.03
p-valor es 0.03 (< 0.05), por lo que hay diferencias significativas en la supervivencia entre hombres y mujeres.
Los hombres tienen una mayor mortalidad observada (21) que la esperada (13.7), lo que sugiere que tienen peor supervivencia en comparación con las mujeres.
El sexo influye en la supervivencia. Específicamente, los hombres parecen tener un mayor riesgo de fallecimiento en comparación con las mujeres.
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Ascitis,
## data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Ascitis=N 239 93 108.55 2.23 102
## Ascitis=Y 19 18 2.45 98.61 102
##
## Chisq= 102 on 1 degrees of freedom, p= <2e-16
El p-valor es extremadamente bajo (< 0.0001), lo que indica diferencias altamente significativas en la supervivencia entre los grupos.
Los pacientes con ascitis (Y) tienen una mortalidad observada (18) muchísimo mayor a la esperada (2.45), lo que sugiere que la ascitis está fuertemente asociada con una peor supervivencia.
El alto valor de chi-cuadrado (102) refuerza que la diferencia no es por azar.
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Hepatomegalia,
## data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Hepatomegalia=N 128 36 63.7 12.0 28.7
## Hepatomegalia=Y 130 75 47.3 16.2 28.7
##
## Chisq= 28.7 on 1 degrees of freedom, p= 8e-08
El p-valor es extremadamente bajo (< 0.0001), lo que indica diferencias altamente significativas en la supervivencia entre los grupos.
Los pacientes con hepatomegalia (Y) tienen una mortalidad observada (75) mucho mayor a la esperada (47.3), lo que sugiere una asociación con peor supervivencia.
El alto valor de chi-cuadrado (28.7) confirma que la diferencia no es por azar.
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Angiomas,
## data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Angiomas=N 183 65 87.2 5.64 26.8
## Angiomas=Y 75 46 23.8 20.63 26.8
##
## Chisq= 26.8 on 1 degrees of freedom, p= 2e-07
El p-valor es extremadamente bajo (< 0.0001), indicando diferencias altamente significativas en la supervivencia entre los grupos.
Los pacientes con angiomas (Y) tienen una mortalidad observada (46) mucho mayor que la esperada (23.8), lo que sugiere una fuerte asociación con peor supervivencia.
El alto valor de chi-cuadrado (26.8) confirma que la diferencia no es por azar.
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Edema, data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Edema=N 218 79 100.92 4.76 52.76
## Edema=S 23 16 7.98 8.06 8.71
## Edema=Y 17 16 2.10 91.98 94.81
##
## Chisq= 106 on 2 degrees of freedom, p= <2e-16
El p-valor extremadamente bajo (< 0.0001) indica diferencias altamente significativas en la supervivencia entre los grupos.
Los pacientes sin edema (N) tienen menor mortalidad observada que los que presentan edema (S o Y).
El grupo “Y” tiene la mayor diferencia entre fallecimientos observados (16) y esperados (2.10), lo que sugiere una supervivencia mucho menor.
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Medicamento,
## data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Medicamento=D-penicillamine 127 57 54 0.171 0.333
## Medicamento=Placebo 131 54 57 0.161 0.333
##
## Chisq= 0.3 on 1 degrees of freedom, p= 0.6
El p-valor de 0.6 es muy alto, lo que indica que no hay diferencias significativas en la supervivencia entre los grupos de tratamiento.
Los valores observados y esperados son muy similares en ambos grupos, lo que sugiere que el medicamento no tuvo un impacto relevante en la supervivencia.
## Call:
## survdiff(formula = Surv(Días_Seguimiento, Estado) ~ Etapa, data = data)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## Etapa=1 12 1 7.95 6.080 6.62
## Etapa=2 56 14 29.07 7.812 10.66
## Etapa=3 103 41 47.31 0.841 1.47
## Etapa=4 87 55 26.67 30.103 40.24
##
## Chisq= 45.8 on 3 degrees of freedom, p= 6e-10
El p-valor (<0.0000000006) es extremadamente bajo, lo que indica que hay diferencias altamente significativas en la supervivencia según la etapa de la enfermedad.
Los pacientes en etapa 4 tienen una mortalidad mucho mayor de la esperada, mientras que los de etapa 1 tienen una mortalidad menor de lo esperado.
La etapa de la enfermedad tiene un impacto significativo en la supervivencia, con una tendencia clara de peor pronóstico a medida que la enfermedad avanza.
La curva de Kaplan-Meier muestra que la supervivencia para las mujeres (F) es consistentemente mayor que la de los hombres (M) a lo largo del tiempo, con un valor p de 0.033 que indica una diferencia estadísticamente significativa. Las bandas de confianza reflejan menor incertidumbre inicial, aumentando hacia los extremos, y el número de individuos en riesgo disminuye notablemente en ambos grupos con el tiempo.
La curva de Kaplan-Meier de la variable Ascitis indica que los pacientes sin ascitis (Ascitis=N) tienen una mayor probabilidad de supervivencia en comparación con aquellos con ascitis (Ascitis=Y). La diferencia entre los grupos es estadísticamente significativa (p < 0.0001). Las bandas de confianza alrededor de las curvas indican mayor incertidumbre hacia el final del período de seguimiento.
La curva Kaplan-Meier muestra que los pacientes sin hepatomegalia (Hepatomegalia=N) tienen una mayor probabilidad de supervivencia en comparación con aquellos con hepatomegalia (Hepatomegalia=Y), con una diferencia estadísticamente significativa (p < 0.0001). Las bandas de confianza destacan menor incertidumbre inicial, y la tabla inferior indica una notable reducción en el número de pacientes en riesgo a lo largo del tiempo en ambos grupos.
La curva Kaplan-Meier para la variable Angiomas muestra una probabilidad de supervivencia significativamente mayor para los pacientes sin angiomas (Angiomas-N) en comparación con aquellos con angiomas (Angiomas-Y), con un valor p < 0.0001. El número de pacientes en riesgo disminuye gradualmente para ambos grupos a lo largo del tiempo.
La curva Kaplan-Meier para la variable Edema muestra diferencias significativas en la supervivencia según los niveles de edema, con un valor p < 0.0001. El grupo “Edema-N” tiene la mayor probabilidad de supervivencia, seguido de “Edema-S” y “Edema”, mientras que “Edema-Y” muestra la menor supervivencia. El número en riesgo disminuye progresivamente en todos los grupos, destacando las diferencias clínicas entre ellos.
La curva Kaplan-Meier para la variable Medicamento muestra que no hay diferencias significativas en la probabilidad de supervivencia entre los grupos que recibieron D-penicilamina y Placebo (p=0.56). Las curvas se superponen en su mayoría, lo que refleja una similitud en los patrones de supervivencia entre ambos grupos. El número de pacientes en riesgo disminuye de manera constante en todos los grupos a lo largo del tiempo.
La curva Kaplan-Meier para la variable Etapa muestra una disminución significativa en la probabilidad de supervivencia a medida que avanza el estadio de la enfermedad. Los pacientes en Etapa-4 tienen la menor supervivencia, seguida por Etapa-3, Etapa-2 y, finalmente, Etapa-1, que tiene la mayor probabilidad de supervivencia. El valor p < 0.0001 indica una diferencia estadísticamente significativa entre las etapas.