a) Se realiza un seguimiento durante 13 años a un grupo de adultos de al menos 60 años de edad para ver qué tanto tiempo permanecen vivos.
Evento: Muerte del adulto.
Variable respuesta: Tiempo en años durante un periodo de 13 años que trascurre hasta que el adulto de al menos 60 años muere.
b) Un grupo de pacientes con un trasplante de corazón son monitoreados para ver cuánto tiempo sobreviven.
Evento: Muerte del paciente.
Variable respuesta: Tiempo que trascurre hasta que el paciente muere.
Usando los datos de hepatitis crónica (CAH.txt) se obtiene una estimacion para \(\hat{S(t)}\)
Se ordenan los datos y se calcula el \(\hat{S}(t)_{KM}\) y luego
Primero se realiza la tabla para el grupo 1:
\[\begin{array}{| c | c | c | c | c |} \hline t_j & n_j & d_j & q_j&\hat{S}_{KM}(j) \\ \hline 0 & 22 & 0 & 0 & (1 - \frac{0}{22}) = 1\\ \hline 2 & 22 & 2 & 0 & (1 - \frac{2}{22})\times 1 = \frac{20}{22} = 0.9091 \\ \hline 12 & 20 & 1 & 0 & \frac{20}{22}(1 - \frac{1}{20}) = \frac{20}{22} \times \frac{19}{20} = \frac{19}{22} = 0.8636 \\ \hline 54 & 19 & 1 & 0 & \frac{19}{22}(1 - \frac{1}{19}) = \frac{19}{22} \times \frac{18}{19} = \frac{18}{22} = 0.8182 \\ \hline 56 & 18 & 0 & 1 & \frac{18}{22}(1 - \frac{0}{18}) = \frac{18}{22} = 0.8182 \\ \hline 68 & 17 & 1 & 0 & \frac{18}{22}(1 - \frac{1}{17}) = \frac{18}{22} \times \frac{16}{17} = 0.77 \\ \hline 89 & 16 & 1 & 0 & 0.77(1 - \frac{1}{16}) = 0.77 \times \frac{15}{16} = 0.7219 \\ \hline 96 & 15 & 2 & 0 & 0.7219(1 - \frac{2}{15}) = 0.7219 \times \frac{13}{15} = 0.6257 \\ \hline 125 & 13 & 0 & 1 & 0.6257(1 - \frac{0}{13}) = 0.6257 \\ \hline 128 & 12 & 0 & 1 & 0.6257(1 - \frac{0}{12}) = 0.6257 \\ \hline 131 & 11 & 0 & 1 & 0.6257(1 - \frac{0}{11}) = 0.6257 \\ \hline 140 & 10 & 0 & 1 & 0.6257(1 - \frac{0}{10}) = 0.6257 \\ \hline 141 & 9 & 0 & 1 & 0.6257(1 - \frac{0}{9}) = 0.6257 \\ \hline 143 & 8 & 1 & 0 & 0.6257(1 - \frac{1}{8}) = 0.6257 \times \frac{7}{8} = 0.5475 \\ \hline 145 & 7 & 0 & 1 & 0.5475(1 - \frac{0}{7}) = 0.5475 \\ \hline 146 & 6 & 1 & 0 & 0.5475(1 - \frac{1}{6}) = 0.5475 \times \frac{5}{6} = 0.4563 \\ \hline 148 & 5 & 0 & 1 & 0.4563(1 - \frac{0}{5}) = 0.4563 \\ \hline 162 & 4 & 0 & 1 & 0.4563(1 - \frac{0}{4}) = 0.4563 \\ \hline 163 & 3 & 1 & 0 & 0.4563(1 - \frac{1}{3}) = 0.4563 \times \frac{2}{3} = 0.3042 \\ \hline 173 & 2 & 0 & 1 & 0.3042(1 - \frac{0}{2}) = 0.3042 \\ \hline 181 & 1 & 0 & 1 & 0.3042(1 - \frac{0}{1}) = 0.3042 \\ \hline \end{array}\]
Ahora calculamos la tabla para el grupo 2:
\[\begin{array}{| c | c | c | c | c |} \hline t_j & n_j & d_j & q_j&\hat{S}_{KM}(j) \\ \hline 0 & 22 & 0 & 0 & (1 - \frac{0}{22}) = 1 \\ \hline 2 & 22 & 1 & 0 & 1(1 - \frac{1}{22}) = \frac{21}{22} = 0.9546 \\ \hline 3 & 21 & 1 & 0 & \frac{21}{22}(1 - \frac{1}{21}) = \frac{21}{22} \times \frac{20}{21} = \frac{20}{22} = 0.9091 \\ \hline 4 & 20 & 1 & 0 & \frac{20}{22}(1 - \frac{1}{20}) = \frac{20}{22} \times \frac{19}{20} = \frac{19}{22} = 0.8636 \\ \hline 7 & 19 & 1 & 0 & \frac{19}{22}(1 - \frac{1}{19}) = \frac{19}{22} \times \frac{18}{19} = \frac{18}{22} = 0.8182 \\ \hline 10 & 18 & 1 & 0 & \frac{18}{22}(1 - \frac{1}{18}) = \frac{18}{22} \times \frac{17}{18} = \frac{17}{22} = 0.7727 \\ \hline 22 & 17 & 1 & 0 & \frac{17}{22}(1 - \frac{1}{17}) = \frac{17}{22} \times \frac{16}{17} = \frac{16}{22} = 0.7273 \\ \hline 28 & 16 & 1 & 0 & \frac{16}{22}(1 - \frac{1}{16}) = \frac{16}{22} \times \frac{15}{16} = \frac{15}{22} = 0.6818 \\ \hline 29 & 15 & 1 & 0 & \frac{15}{22}(1 - \frac{1}{15}) = \frac{15}{22} \times \frac{14}{15} = \frac{14}{22} = 0.6364 \\ \hline 32 & 14 & 1 & 0 & \frac{14}{22}(1 - \frac{1}{14}) = \frac{14}{22} \times \frac{13}{14} = \frac{13}{22} = 0.5909 \\ \hline 37 & 13 & 1 & 0 & \frac{13}{22}(1 - \frac{1}{13}) = \frac{13}{22} \times \frac{12}{13} = \frac{12}{22} = 0.5455 \\ \hline 40 & 12 & 1 & 0 & \frac{12}{22}(1 - \frac{1}{12}) = \frac{12}{22} \times \frac{11}{12} = \frac{11}{22} = 0.5 \\ \hline 41 & 11 & 1 & 0 & \frac{11}{22}(1 - \frac{1}{11}) = \frac{11}{22} \times \frac{10}{11} = \frac{10}{22} = 0.4546 \\ \hline 54 & 10 & 1 & 0 & \frac{10}{22}(1 - \frac{1}{10}) = \frac{10}{22} \times \frac{9}{10} = \frac{9}{22} = 0.4091 \\ \hline 61 & 9 & 1 & 0 & \frac{9}{22}(1 - \frac{1}{9}) = \frac{9}{22} \times \frac{8}{9} = \frac{8}{22} = 0.3636 \\ \hline 63 & 8 & 1 & 0 & \frac{8}{22}(1 - \frac{1}{8}) = \frac{8}{22} \times \frac{7}{8} = \frac{7}{22} = 0.3182 \\ \hline 71 & 7 & 1 & 0 & \frac{7}{22}(1 - \frac{1}{7}) = \frac{7}{22} \times \frac{6}{7} = \frac{6}{22} = 0.2727 \\ \hline 127 & 6 & 0 & 1 & \frac{6}{22}(1 - \frac{0}{6}) = \frac{6}{22} = 0.2727 \\ \hline 140 & 5 & 0 & 1 & \frac{6}{22}(1 - \frac{0}{5}) = \frac{6}{22} = 0.2727 \\ \hline 146 & 4 & 0 & 1 & \frac{6}{22}(1 - \frac{0}{4}) = \frac{6}{22} = 0.2727 \\ \hline 158 & 3 & 0 & 1 & \frac{6}{22}(1 - \frac{0}{3}) = \frac{6}{22} = 0.2727 \\ \hline 167 & 2 & 0 & 1 & \frac{6}{22}(1 - \frac{0}{2}) = \frac{6}{22} = 0.2727 \\ \hline 182 & 1 & 0 & 1 & \frac{6}{22}(1 - \frac{0}{1}) = \frac{6}{22} = 0.2727 \\ \hline \end{array}\]
Con respecto al grupo 1 se pudo observar como al final del estudio usando el método de K-M se obtuvo una tasa de supervivencia 0.3042. Mientras que para el grupo 2 se obtuvo una tasa de supervivencia 0.2727. Lo que indica que el grupo de pacientes de control que sufren hepatitis crónica activa y recibieron tratamiento tuvieron una supervivencia meses después de ser admitidos al ensayo de aproximadamente el 30%. A diferencia de los pacientes que estuvieron en control meses después de ser admitidos al ensayo y no recibieron tratamiento tuvieron una supervivencia de aproximadamente el 27%. Lo cual da muestra de un leve incremento en la supervivencia de los pacientes que sufren CAH si ingieren prednisolona.
Ahora el calculo de \(\hat{S(t)}\) usando Nelson-Aalen es como sigue:
Primero se realiza la tabla para el grupo 1:
\[\begin{array}{| c | c | c | c | c |} \hline \#Fallas & Tiempo(meses) & \hat{h}(t) & \hat{H}(t) & \hat{S}(t)\\ \hline 2 & 2 & \frac{2}{22} & \frac{2}{22} = 0.091 & e^{-0.091} = 0.91\\ \hline 1 & 12 & \frac{1}{20} & 0.0921 + \frac{1}{20} = 0.141 & e^{-0.141} = 0.87\\ \hline 1 & 54 & \frac{1}{19} & 0.141 + \frac{1}{19} = 0.194 & e^{-0.194} = 0.82\\ \hline 0 & 56 & \frac{0}{18} & 0.194 + \frac{0}{18} = 0.194 & e^{-0.194} = 0.82 \\ \hline 1 & 68 & \frac{1}{17} & 0.194 + \frac{1}{17} = 0.253 & e^{-0.253} = 0.78 \\ \hline 1 & 89 & \frac{1}{16} & 0.253 + \frac{1}{16} = 0.316 & e^{-0.316} = 0.73\\ \hline 2 & 96 & \frac{2}{15} & 0.316 + \frac{2}{15} = 0.45 & e^{-0.45} = 0.64\\ \hline 0 & 125 & \frac{0}{13} & 0.45 + \frac{0}{13} = 0.45 & e^{-0.45} = 0.64 \\ \hline 0 & 128 & \frac{0}{12} & 0.45 + \frac{0}{12} = 0.45 & e^{-0.45} = 0.64\\ \hline 0 & 131 & \frac{0}{11} & 0.45 + \frac{0}{11} = 0.45 & e^{-0.45} = 0.64\\ \hline 0 & 140 & \frac{0}{10} & 0.45 + \frac{0}{10}= 0.45 & e^{-0.45} = 0.64 \\ \hline 0 & 141 & \frac{0}{9} & 0.45 + \frac{0}{9} = 0.45 & e^{-0.45} = 0.64\\ \hline 1 & 143 & \frac{1}{8} & 0.45 + \frac{1}{8} = 0.575 & e^{-0.575} = 0.56 \\ \hline 0 & 145 & \frac{0}{7} & 0.575 + \frac{0}{7} = 0.575 & e^{-0.575} = 0.56 \\ \hline 1 & 146 & \frac{1}{6} & 0.575 + \frac{1}{6} = 0.742 & e^{-0.742} = 0.48 \\ \hline 0 & 148 & \frac{0}{5} & 0.742 + \frac{0}{5} = 0.742 & e^{-0.742} = 0.48 \\ \hline 0 & 162 & \frac{0}{4} & 0.742 + \frac{0}{4} = 0.742 & e^{-0.742} = 0.48 \\ \hline 1 & 168 & \frac{1}{3} & 0.742 + \frac{1}{3} = 1.075 & e^{-1.075} = 0.34 \\ \hline 0 & 170 & \frac{0}{2} & 1.075 + \frac{0}{2} = 1.075 & e^{-1.075} = 0.34 \\ \hline 0 & 181 & \frac{0}{1} & 1.075 + \frac{0}{1} = 1.075 & e^{-1.075} = 0.34 \\ \hline \end{array}\]
Aplicando el método de N-A se pudo observar como con respecto al grupo 1 al final del estudio se obtuvo un número promedio de fallas 0.34. mientras que en el grupo 2 obtuvo un número promedio de fallas de 0.29. Lo cual nos indica que el grupo de pacientes que de control meses después de ser admitidos al ensayo y recibieron tratamiento ingiriendo prednisolona resultaron ser mas resilientes ante dicha enfermedad.
# cargando los paquetes correspondientes
library(survival)
library(ggplot2)
library(ggfortify)
library(gridExtra)
library(survminer)
Primeramente se cargan los datos:
# lectura de la base de datos
CAH <- read.table(file = "CAH.txt", header = T)
head(CAH)
Posteriormente subdividimos los datos entre los que pertenecen al grupo 1 y 2 respectivamente.
# datos grupo 1
grupo1=CAH[CAH[,2]==1,]
grupo1
# datos grupo 2
grupo2=CAH[CAH[,2]==2,]
grupo2
Luego obtenemos las estimaciones para curvas de supervivencia del grupo 1 y 2 respectivamente, usando primero el método de KM y después usando el método de NA.
# estimación de la curva de supervivencia para el grupo 1
# usando kaplan Meier
KM_fit1 <- survfit(Surv(time, status) ~ group, data = grupo1, type = "kaplan-meier")
summary(KM_fit1) # resumen estadistico de la estimación por KM para el grupo 1
## Call: survfit(formula = Surv(time, status) ~ group, data = grupo1,
## type = "kaplan-meier")
##
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 2 22 2 0.909 0.0613 0.797 1.000
## 12 20 1 0.864 0.0732 0.732 1.000
## 54 19 1 0.818 0.0822 0.672 0.996
## 68 17 1 0.770 0.0904 0.612 0.969
## 89 16 1 0.722 0.0967 0.555 0.939
## 96 15 2 0.626 0.1051 0.450 0.870
## 143 8 1 0.547 0.1175 0.359 0.834
## 146 6 1 0.456 0.1285 0.263 0.793
## 168 3 1 0.304 0.1509 0.115 0.804
# estimación de la curva de supervivencia para el grupo 2
# usando kaplan Meier
KM_fit2 <- survfit(Surv(time, status) ~ group, data = grupo2, type = "kaplan-meier")
summary(KM_fit2) # resumen estadistico de la estimación por KM para el grupo 2
## Call: survfit(formula = Surv(time, status) ~ group, data = grupo2,
## type = "kaplan-meier")
##
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 2 22 1 0.955 0.0444 0.871 1.000
## 3 21 1 0.909 0.0613 0.797 1.000
## 4 20 1 0.864 0.0732 0.732 1.000
## 7 19 1 0.818 0.0822 0.672 0.996
## 10 18 1 0.773 0.0893 0.616 0.969
## 22 17 1 0.727 0.0950 0.563 0.939
## 28 16 1 0.682 0.0993 0.513 0.907
## 29 15 1 0.636 0.1026 0.464 0.873
## 32 14 1 0.591 0.1048 0.417 0.837
## 37 13 1 0.545 0.1062 0.372 0.799
## 40 12 1 0.500 0.1066 0.329 0.759
## 41 11 1 0.455 0.1062 0.288 0.718
## 54 10 1 0.409 0.1048 0.248 0.676
## 61 9 1 0.364 0.1026 0.209 0.632
## 63 8 1 0.318 0.0993 0.173 0.587
## 71 7 1 0.273 0.0950 0.138 0.540
Ahora se obtendrá las estimaciones para el grupo 1 y 2 usando el método de Nelson-Aalen.
# estimación de la curva de supervivencia para el grupo 1
# usando Nelson-Aalen
# primero se cálcula el h(t) para el grupo 1
h_st1_CAH <- KM_fit1$n.event / KM_fit1$n.risk
H1_CAH<-cumsum(h_st1_CAH)
S_est1_CAH <- exp(-H1_CAH)
S_NA_CAH <- data.frame(
time = c(KM_fit1$time),
St=S_est1_CAH,
group="1: S(t)_NA",
method="N-A"
)
S_NA_CAH
# estimación de la curva de supervivencia para el grupo 2
# usando Nelson-Aalen
# primero se cálcula el h(t) para el grupo 2
h_st2_CAH <- KM_fit2$n.event / KM_fit2$n.risk
H1_2_CAH<-cumsum(h_st2_CAH)
S_est2_CAH <- exp(-H1_2_CAH)
S_NA_2_CAH <- data.frame(
time = c(KM_fit2$time),
St=S_est2_CAH,
group="2: S(t)_NA",
method="N-A"
)
S_NA_2_CAH
Se calculara H(t) utilizando NA como se observa en la siguiente tabla:
Para el grupo 1:
\[\begin{array}{| c | c | c | c | c |} \hline \#Fallas & Tiempo(meses) & \hat{h}(t) & \hat{H}(t)\\ \hline 2 & 2 & \frac{2}{22} & \frac{2}{22} = 0.091\\ \hline 1 & 12 & \frac{1}{20} & 0.0921 + \frac{1}{20} = 0.141\\ \hline 1 & 54 & \frac{1}{19} & 0.141 + \frac{1}{19} = 0.194\\ \hline 0 & 56 & \frac{0}{18} & 0.194 + \frac{0}{18} = 0.194\\ \hline 1 & 68 & \frac{1}{17} & 0.194 + \frac{1}{17} = 0.253\\ \hline 1 & 89 & \frac{1}{16} & 0.253 + \frac{1}{16} = 0.316\\ \hline 2 & 96 & \frac{2}{15} & 0.316 + \frac{2}{15} = 0.45\\ \hline 0 & 125 & \frac{0}{13} & 0.45 + \frac{0}{13} = 0.45\\ \hline 0 & 128 & \frac{0}{12} & 0.45 + \frac{0}{12} = 0.45\\ \hline 0 & 131 & \frac{0}{11} & 0.45 + \frac{0}{11} = 0.45\\ \hline 0 & 140 & \frac{0}{10} & 0.45 + \frac{0}{10}= 0.45\\ \hline 0 & 141 & \frac{0}{9} & 0.45 + \frac{0}{9} = 0.45\\ \hline 1 & 143 & \frac{1}{8} & 0.45 + \frac{1}{8} = 0.575\\ \hline 0 & 145 & \frac{0}{7} & 0.575 + \frac{0}{7} = 0.575 \\ \hline 1 & 146 & \frac{1}{6} & 0.575 + \frac{1}{6} = 0.742 \\ \hline 0 & 148 & \frac{0}{5} & 0.742 + \frac{0}{5} = 0.742 \\ \hline 0 & 162 & \frac{0}{4} & 0.742 + \frac{0}{4} = 0.742 \\ \hline 1 & 168 & \frac{1}{3} & 0.742 + \frac{1}{3} = 1.075 \\ \hline 0 & 170 & \frac{0}{2} & 1.075 + \frac{0}{2} = 1.075 \\ \hline 0 & 181 & \frac{0}{1} & 1.075 + \frac{0}{1} = 1.075 \\ \hline \end{array}\]
Para el grupo 2:
\[\begin{array}{| c | c | c | c | c |} \hline \#Fallas & Tiempo(meses) & \hat{h}(t) & \hat{H}(t) \\ \hline 1 & 2 & \frac{1}{22} & \frac{1}{22} = 0.046 \\ \hline 1 & 3 & \frac{1}{21} & 0.046 + \frac{1}{21} = 0.094 \\ \hline 1 & 4 & \frac{1}{20} & 0.094 + \frac{1}{20} = 0.144 \\ \hline 1 & 7 & \frac{1}{19} & 0.144 + \frac{1}{19} = 0.197 \\ \hline 1 & 10 & \frac{1}{18} & 0.197 + \frac{1}{18} = 0.253 \\ \hline 1 & 22 & \frac{1}{17} & 0.253 + \frac{1}{17} = 0.312 \\ \hline 1 & 28 & \frac{1}{16} & 0.312 + \frac{1}{16} = 0.375 \\ \hline 1 & 29 & \frac{1}{15} & 0.375 + \frac{1}{15} = 0.442 \\ \hline 1 & 32 & \frac{1}{14} & 0.442 + \frac{1}{14} = 0.513 \\ \hline 1 & 37 & \frac{1}{13} & 0.513 + \frac{1}{13} = 0.59 \\ \hline 1 & 40 & \frac{1}{12} & 0.59 + \frac{1}{12} = 0.67 \\ \hline 1 & 41 & \frac{1}{11} & 0.67 + \frac{1}{11} = 0.761 \\ \hline 1 & 54 & \frac{1}{10} & 0.761 + \frac{1}{10} = 0.861 \\ \hline 1 & 61 & \frac{1}{9} & 0.861 + \frac{1}{9} = 0.972 \\ \hline 1 & 63 & \frac{1}{8} & 0.972 + \frac{1}{8} = 1.097 \\ \hline 1 & 71 & \frac{1}{7} & 1.097 + \frac{1}{7} = 1.24 \\ \hline 0 & 127 & \frac{0}{6} & 1.24 + \frac{0}{6} = 1.24 \\ \hline 0 & 140 & \frac{0}{5} & 1.24 + \frac{0}{5} = 1.24 \\ \hline 0 & 146 & \frac{0}{4} & 1.24 + \frac{0}{4} = 1.24 \\ \hline 0 & 158 & \frac{0}{3} & 1.24 + \frac{0}{3} = 1.24 \\ \hline 0 & 167 & \frac{0}{2} & 1.24 + \frac{0}{2} = 1.24 \\ \hline 0 & 182 & \frac{0}{1} & 1.24 + \frac{0}{1} = 1.24 \\ \hline \end{array}\]
# calculo de h(t) para el grupo 1 usando N-A
ht_g1 <- -log(S_NA_CAH$St)
ht_g1
## [1] 0.09090909 0.14090909 0.19354067 0.19354067 0.25236420 0.31486420
## [7] 0.44819753 0.44819753 0.44819753 0.44819753 0.44819753 0.44819753
## [13] 0.57319753 0.57319753 0.73986420 0.73986420 0.73986420 1.07319753
## [19] 1.07319753 1.07319753
# calculo de h(t) para el grupo 2 usando N-A
ht_g2 <- -log(S_NA_2_CAH$St)
ht_g2
## [1] 0.04545455 0.09307359 0.14307359 0.19570517 0.25126073 0.31008426
## [7] 0.37258426 0.43925092 0.51067950 0.58760257 0.67093591 0.76184500
## [13] 0.86184500 0.97295611 1.09795611 1.24081325 1.24081325 1.24081325
## [19] 1.24081325 1.24081325 1.24081325 1.24081325