Comparación no paramétrica

El objetivo de este ejercicio es hacer una comparación de los tiempos de supervivencia de dos grupos de pacientes.

El Grupo Control está compuesto por 3 pacientes.

El Grupo Tratamiento está compuesto por 3 pacientes.

Estos son los tiempos de supervivencia observados

Control 6 7+ 15
Tratamiento 10 19+ 25

El símbolo + indica un tiempo censurado (no se tiene la información completa de su tiempo de vida)

Los tiempos de vida ordenados de manera ascendente se muestren en la siguiente tabla

j Tiempo Grupo
1 6 C
2 7+ C
3 10 T
4 15 C
5 19+ T
6 25 T

Tabla resumen para el cálculo de los estadísticos \(U_L\) y \(V_L\) para la prueba de log-rangos

La forma general para el \(j-\)ésimo tiempo de evento o fallecimiento es

El valor esperado de eventos \(E(d_{1j})=e_{1j}\) para el grupo 1 (Control) es \[e_{1j}=\frac{n_{1j}\cdot d_j}{n_j}\] La varianza \(Var(d_{1j})\) para el grupo 1 (Control) es \[v_{1j}=\frac{n_{1j}\cdot n_{2j}\cdot d_j\cdot(n_j-d_j)}{n^2_j\cdot(n_j-1)}\]

\(t_1=6\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0

\(e_{1j}=\frac{3\cdot 1}{6}=\frac{3}{6}=\frac{1}{2}\)

\(v_{1j}=\frac{3\cdot3\cdot 1\cdot (6-1)}{6^2(6-1)}=\frac{1}{4}\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4

\(t_2=10\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4
2 10 4 1 1 0 3 1

\(e_{1j}=\frac{1\cdot 1}{4}=\frac{1}{4}\)

\(v_{1j}=\frac{1\cdot3\cdot 1\cdot (4-1)}{4^2(4-1)}=\frac{3}{16}\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4
2 10 4 1 1 0 3 1 1/4 3/16

\(t_3=15\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4
2 10 4 1 1 0 3 1 1/4 3/16
3 15 3 1 1 1 2 0

\(e_{1j}=\frac{1\cdot 1}{3}=\frac{1}{3}\)

\(v_{1j}=\frac{1\cdot 2\cdot 1\cdot (3-1)}{3^2(3-1)}=\frac{2}{9}\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4
2 10 4 1 1 0 3 1 1/4 3/16
3 15 3 1 1 1 2 0 1/3 2/9

\(t_4=25\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4
2 10 4 1 1 0 3 1 1/4 3/16
3 15 3 1 1 1 2 0 1/3 2/9
4 25 1 1 0 0 1 1

\(e_{1j}=\frac{0\cdot 1}{1}=0\)

\(v_{1j}=0\)

j Tiempo \(n_j\) \(d_j\) \(n_{1j}\) \(d_{1j}\) \(n_{2j}\) \(d_{2j}\) \(e_{1j}\) \(v_{1j}\)
1 6 6 1 3 1 3 0 1/2 1/4
2 10 4 1 1 0 3 1 1/4 3/16
3 15 3 1 1 1 2 0 1/3 2/9
4 25 1 1 0 0 1 1 0 0
\(\sum\limits_{j=1}^n d_{1j}=2\) \(\sum\limits_{j=1}^n e_{1j}=\frac{13}{12}\) \(\sum\limits_{j=1}^n v_{1j}=\frac{95}{144}\)

Cálculo del estadístico \(W_L\) para la prueba de log rangos

La hipótesis a probar es

\(H_0=\) Los tiempos de supervivencia son iguales en los dos grupos.

El estadistico de prueba se obtiene como \(U_L=\sum\limits_{j=1}^{n}(d_{1j}-e_{1j})=2-\frac{13}{12}=\frac{11}{12}\)

donde \(\sum_{j=1}^n e_{1j}=\frac{13}{12}=\) 1.0833333 y \(n=4\) tiempos donde ocurre un evento.

\(V_L=\sum\limits_{j=1}^n v_{1j}=\frac{95}{144}=\) 0.6597222.

\(\frac{U_L^2}{V_L}\sim\chi^2_{1\,g.l.}\)

\(W_L=\frac{U_L^2}{V_L}=\frac{(11/12)^2}{(95/144)}=\) 1.2736842

el valor del cuantil de\(\chi^2_{1\,g.l., 0.95}\) con una nivel de confianza de \((1-\alpha)100\%=95\%\) es 3.8414588, dado que \(W_L<\chi^2_{1\,g.l., 0.95}\), \(H_0\) no se rechaza, es decir, la diferencia en los tiempos de supervivencia entre el grupo Control y grupo Tratamiento no es estadísticamente significativa.

Para obtener la probablidad asociada \((p-value)\) al estadístico \(W_L=1.2736842\) se halla como el complemento del la probabilidad acumulada.

1-pchisq(1.2736842,df=1)
## [1] 0.2590767

el valor \(p\) es \(0.259\) y el nivel de significancia es \(\alpha=0.05\), por lo que \(p>0.05\). Esta es otra forma de probar la hipótesis nula.

Comparación de tiempos de supervivencia usando survival de R

Preparación de los datos para hacer la prueba de log-rangos en R

tiempo<-c(6,7,15,10,19,25)

censura<-c(1,0,1,1,0,1)

grupo<-c("Control","Control","Control","Tratamiento","Tratamiento","Tratamiento")

Comparacion<-data.frame(tiempo, grupo, censura)

Comparación de las estimaciones de Kaplan-Meier para el grupo Control y grupo Tratamiento

Con el paquete survival se hace la comparación de los tiempos de supervivencia. Primero se presenta por separado para cada grupo las estimaciones de Kaplan-Meier.

time n.risk n.event n.censor estimate std.error conf.high conf.low strata
6 3 1 0 0.667 0.408 0.945 0.054 grupo=Control
7 2 0 1 0.667 0.408 0.945 0.054 grupo=Control
15 1 1 0 0.000 Inf NA NA grupo=Control
10 3 1 0 0.667 0.408 0.945 0.054 grupo=Tratamiento
19 2 0 1 0.667 0.408 0.945 0.054 grupo=Tratamiento
25 1 1 0 0.000 Inf NA NA grupo=Tratamiento

Gráficas de las funciones de supervivencia

En la primer gráfica se comparan las curvas de supervivencia. Se puede observar que la función de supervivencia del grupo Tratamiento, \(S_T(t)\), siempre se halla por arriba de la función de supervivencia del grupo Control, \(S_C(t)\). Esto podría sugerir que los tiempos de supervivencia del grupo Tratamiento son mayores que los del grupo Control. Sin embargo, es necesario llevar a cabo la prueba estadística correspondiente para respaldar la afirmación anterior.

En la siguiente gráfica con los intervalos de confianza del 95% se observan los traslapes en los tiempos de supervivencia observados, lo que ahora respaldaría la hipótesis \(H_0\) no hay diferencia estadísticamente significativa entre los tiempos de supervivencia de los dos grupos analizados.

Prueba de log-rangos en R

Con el siguiente código se hace la prueba de la hipótesis \(H_0\) usando survival de R con la prueba de log-rangos. El resultado de prueba indica que la diferencia en los tiempos de supervivencia de los dos grupos no es significativa \((p=0.06)\). Las cantidades Expected del grupo Control es \(\sum_{j=1}^{n}e_{1j}\) y (O-E)^2/V es \(W_{L}=\frac{U^2_{L}}{V_L}\).

(Resultado<-
survdiff(Surv(tiempo, censura) ~ grupo, data = Comparacion, rho = 0))
## Call:
## survdiff(formula = Surv(tiempo, censura) ~ grupo, data = Comparacion, 
##     rho = 0)
## 
##                   N Observed Expected (O-E)^2/E (O-E)^2/V
## grupo=Control     3        2     1.08     0.776      1.27
## grupo=Tratamiento 3        2     2.92     0.288      1.27
## 
##  Chisq= 1.3  on 1 degrees of freedom, p= 0.3
Resultado$var[1,1]
## [1] 0.6597222