- Objetivo: poner a prueba las habilidades para resolver e interpretar el conocimiento adquirido sobre el análisis de supervivencia, el cual abarca los capítulos 1-5 del libro digital Modelos de Supervivencia

Para este trabajo se ocuparon datos propocionados por el ayudante, se encuentran disponibles en este link

Con la información proporcionada, debemos:

\(\blacksquare\) Calcular la función de riesgo y la función de riesgo acumulado, para lo cual deberan ocupar las fórmulas del caso discreto. También, hay que explicar la parte teórica correspondiente.

\(\blacksquare\) Finalmente agrega las gráficas que consideres necessarias.

Nota: No se toma en cuenta el tamaño de los intervalos.


Análisis de supervivencia

En numerosas situaciones se desea conocer el tiempo hasta la ocurrencia de un evento específico de interés, ya sea éste beneficioso (curación) o perjudicial (fallo de una máquina).

Aparece entonces el concepto de tiempo de superviviencia o falla, donde lo que se valora es el tiempo transcurrido desde un momento inicial, el comienzo de un tratamiento, hasta un tiempo final donde se puede demostrar o no la aparición de un suceso, la muerte del paciente o su curación.

Al conjunto de técnicas usadas para analizar estos datos se le conoce como “análisis de supervivencia”, originalmente se diseñaron para estudiar el tiempo transcurrido hasta el fallecimiento de un paciente.

Funciones para el Análisis de Supervivencia

Sea \(T\) una variable aleatoria que describe el tiempo de supervivencia, las funciones que describen o caracterizan a \(T\) son:

  1. Función de densidad de probabilidad, \(F(t)\)

  2. Función de supervivencia, \(S(t)\)

  3. Función de riesgo, \(h(t)\)

  4. Función de riesgo acumulado, \(H(t)\)


Carguemos las siguientes librerias

library(tidyverse)
library(kableExtra)

Comenzaremos creando una función que calcule los valores de cada una de estas funciones, excepto la función de densidad que ya nos fue dada

analisis_supervivencia <- function(datos){
  
  info <- as_tibble(read.csv(datos, header = TRUE, sep = ","))
  
    new_info <- info %>% mutate(supervivencia = 1 - Ft) %>% 
      mutate(supervivencia_aux = lead(supervivencia)) %>% 
      mutate(risk = 1 - (supervivencia_aux/supervivencia)) %>% 
      mutate(risk_acum = cumsum(risk)) %>%
      select(-supervivencia_aux)
    
    #new_info <- na.omit(new_info)
  
    new_info %>% rename("$t$" = t, "$F(t)$" = Ft, "$S(t)$" = supervivencia, 
                        "$h(t)$" = risk, "$H(t)$" = risk_acum) %>% 
      kbl() %>% kable_paper() %>% 
      scroll_box(width = "100%", height = "300px")
}

Tambien queremos ver de manera grafica como se verían estas funciones

grafica_supervivencia <- function(datos){
  info <- as_tibble(read.csv(datos, header = TRUE, sep = ","))
  
  new_info <- info %>% mutate(supervivencia = 1 - Ft)
  
  new_info %>% ggplot(aes(x = t, y = supervivencia, color = "S(t)")) +
    geom_step() + labs(y = "S(t)") + scale_color_manual(values = "#5584BD")+
    ggtitle("Grafica de supervivencia")
}

grafica_riesgoAcum <- function(datos){
  info <- as_tibble(read.csv(datos, header = TRUE, sep = ","))
  
  new_info <- info %>% mutate(supervivencia = 1 - Ft) %>% 
    mutate(supervivencia_aux = lead(supervivencia)) %>% 
    mutate(risk = 1 - (supervivencia_aux/supervivencia)) %>% 
    mutate(risk_acum = cumsum(risk)) %>% select(-Ft) %>%
    select(-supervivencia_aux) %>% select(-supervivencia) %>%
    head(-1)
  
  new_info %>% ggplot(aes(x = t, y = risk_acum, color = "H(t)")) +
    geom_step() + labs(y = "H(t)") + scale_color_manual(values = "#55BD76")+
    ggtitle("Grafica de riesgo acumulado")
}

Apliquemos la función sobre cada uno de los datasets que debemos trabajar

- Videojuegos

datos1 <- "videogames.csv"
analisis_supervivencia(datos1)
\(t\) \(F(t)\) \(S(t)\) \(h(t)\) \(H(t)\)
0 0.0000000 1.0000000 0.4868419 0.4868419
1 0.4868419 0.5131581 0.4561488 0.9429907
2 0.7209184 0.2790816 0.4289617 1.3719524
3 0.8406337 0.1593663 0.4047393 1.7766917
4 0.9051355 0.0948645 0.3830394 2.1597311
5 0.9414723 0.0585277 0.3634992 2.5232303
6 0.9627471 0.0372529 0.3458198 2.8690501
7 0.9756299 0.0243701 0.3297529 3.1988030
8 0.9836660 0.0163340 0.3150919 3.5138949
9 0.9888127 0.0111873 0.3016627 3.8155575
10 0.9921875 0.0078125 0.2893187 4.1048762
11 0.9944478 0.0055522 0.2779350 4.3828112
12 0.9959910 0.0040090 0.2674051 4.6502163
13 0.9970630 0.0029370 0.2576374 4.9078537
14 0.9978197 0.0021803 0.2485524 5.1564061
15 0.9983616 0.0016384 NA NA
grafica_supervivencia(datos1)

grafica_riesgoAcum(datos1)

- Auto

datos2 <- "auto.csv"
analisis_supervivencia(datos2)
\(t\) \(F(t)\) \(S(t)\) \(h(t)\) \(H(t)\)
0 0.0000000 1.0000000 0.0000000 0.0000000
1 0.0000000 1.0000000 0.0000000 0.0000000
2 0.0000000 1.0000000 0.0000000 0.0000000
3 0.0000000 1.0000000 0.0000000 0.0000000
4 0.0000000 1.0000000 0.0000000 0.0000000
5 0.0000000 1.0000000 0.0000000 0.0000000
6 0.0000000 1.0000000 0.0000000 0.0000000
7 0.0000000 1.0000000 0.0000000 0.0000000
8 0.0000000 1.0000000 0.0000000 0.0000000
9 0.0000000 1.0000000 0.0000000 0.0000000
10 0.0000000 1.0000000 0.0000000 0.0000000
11 0.0000000 1.0000000 0.0000000 0.0000000
12 0.0000000 1.0000000 0.0000000 0.0000000
13 0.0000000 1.0000000 0.0000000 0.0000000
14 0.0000000 1.0000000 0.0000000 0.0000000
15 0.0000000 1.0000000 0.0000000 0.0000000
16 0.0000000 1.0000000 0.0000000 0.0000000
17 0.0000000 1.0000000 0.0000000 0.0000000
18 0.0000000 1.0000000 0.0000000 0.0000000
19 0.0000000 1.0000000 0.0000000 0.0000000
20 0.0000000 1.0000000 0.0000000 0.0000000
21 0.0000000 1.0000000 0.0000000 0.0000000
22 0.0000000 1.0000000 0.0000000 0.0000000
23 0.0000000 1.0000000 0.0000000 0.0000000
24 0.0000000 1.0000000 0.0000000 0.0000000
25 0.0000000 1.0000000 0.0000000 0.0000000
26 0.0000000 1.0000000 0.0000000 0.0000000
27 0.0000000 1.0000000 0.0000001 0.0000001
28 0.0000001 0.9999999 0.0000003 0.0000004
29 0.0000004 0.9999996 0.0000011 0.0000015
30 0.0000015 0.9999985 0.0000041 0.0000056
31 0.0000056 0.9999944 0.0000134 0.0000190
32 0.0000190 0.9999810 0.0000396 0.0000586
33 0.0000586 0.9999414 0.0001070 0.0001656
34 0.0001656 0.9998344 0.0002648 0.0004304
35 0.0004304 0.9995696 0.0006034 0.0010339
36 0.0010336 0.9989664 0.0012727 0.0023066
37 0.0023049 0.9976951 0.0024952 0.0048018
38 0.0047944 0.9952056 0.0045677 0.0093694
39 0.0093402 0.9906598 0.0078414 0.0172108
40 0.0171083 0.9828917 0.0126811 0.0298919
41 0.0295724 0.9704276 0.0194087 0.0493006
42 0.0484071 0.9515929 0.0282479 0.0775484
43 0.0752876 0.9247124 0.0392857 0.1168341
44 0.1116156 0.8883844 0.0524609 0.1692950
45 0.1582210 0.8417790 0.0675806 0.2368756
46 0.2151089 0.7848911 0.0843558 0.3212315
47 0.2813191 0.7186809 0.1024439 0.4236754
48 0.3549436 0.6450564 0.1214885 0.5451639
49 0.4333105 0.5666895 0.1411501 0.6863140
50 0.5132988 0.4867012 0.1611252 0.8474392
51 0.5917186 0.4082814 0.1811566 1.0285959
52 0.6656815 0.3343185 0.2010353 1.2296311
53 0.7328913 0.2671087 0.2205978 1.4502289
54 0.7918149 0.2081851 0.2397214 1.6899503
55 0.8417213 0.1582787 0.2583179 1.9482682
56 0.8826075 0.1173925 0.2763273 2.2245955
57 0.9150463 0.0849537 0.2937120 2.5183076
58 0.9399982 0.0600018 0.3104522 2.8287598
59 0.9586259 0.0413741 0.3265414 3.1553012
60 0.9721363 0.0278637 0.3419832 3.4972845
61 0.9816652 0.0183348 0.3567885 3.8540730
62 0.9882068 0.0117932 0.3709735 4.2250465
63 0.9925818 0.0074182 0.3845580 4.6096045
64 0.9954345 0.0045655 0.3975640 5.0071684
65 0.9972496 0.0027504 0.4100150 5.4171835
66 0.9983773 0.0016227 0.4219353 5.8391188
67 0.9990620 0.0009380 0.4333490 6.2724677
68 0.9994685 0.0005315 0.4442801 6.7167478
69 0.9997046 0.0002954 0.4547523 7.1715001
70 0.9998389 0.0001611 0.4647882 7.6362883
71 0.9999138 0.0000862 0.4744098 8.1106981
72 0.9999547 0.0000453 0.4836381 8.5943362
73 0.9999766 0.0000234 0.4924932 9.0868294
74 0.9999881 0.0000119 0.5009942 9.5878236
75 0.9999941 0.0000059 0.5091591 10.0969828
76 0.9999971 0.0000029 0.5170052 10.6139880
77 0.9999986 0.0000014 0.5245486 11.1385365
78 0.9999993 0.0000007 0.5318046 11.6703411
79 0.9999997 0.0000003 0.5387877 12.2091288
80 0.9999999 0.0000001 NA NA
grafica_supervivencia(datos2)

grafica_riesgoAcum(datos2)

- Mezcla corrosiva

datos3 <- "corrosive_mixture.csv"
analisis_supervivencia(datos3)
\(t\) \(F(t)\) \(S(t)\) \(h(t)\) \(H(t)\)
0.0 0.0000000 1.0000000 0.0000000 0.0000000
0.1 0.0000000 1.0000000 0.0000001 0.0000001
0.2 0.0000001 0.9999999 0.0000025 0.0000026
0.3 0.0000026 0.9999974 0.0000230 0.0000256
0.4 0.0000256 0.9999744 0.0001268 0.0001524
0.5 0.0001524 0.9998476 0.0005028 0.0006552
0.6 0.0006551 0.9993449 0.0015927 0.0022479
0.7 0.0022468 0.9977532 0.0042877 0.0065356
0.8 0.0065248 0.9934752 0.0101976 0.0167332
0.9 0.0166559 0.9833441 0.0219772 0.0387104
1.0 0.0382670 0.9617330 0.0436402 0.0823505
1.1 0.0802372 0.9197628 0.0806907 0.1630413
1.2 0.1544535 0.8455465 0.1397337 0.3027749
1.3 0.2726049 0.7273951 0.2270528 0.5298277
1.4 0.4377619 0.5622381 0.3456874 0.8755151
1.5 0.6321206 0.3678794 0.4912657 1.3667808
1.6 0.8128471 0.1871529 0.6486606 2.0154414
1.7 0.9342458 0.0657542 0.7936095 2.8090508
1.8 0.9864290 0.0135710 0.9024026 3.7114535
1.9 0.9986755 0.0013245 0.9653341 4.6767876
2.0 0.9999541 0.0000459 0.9915126 5.6683002
2.1 0.9999996 0.0000004 0.9987109 6.6670111
2.2 1.0000000 0.0000000 0.9998926 7.6669037
2.3 1.0000000 0.0000000 NA NA
grafica_supervivencia(datos3)

grafica_riesgoAcum(datos3)

- Servicio al cliente en oficina de correos

datos4 <- "mail.csv"
analisis_supervivencia(datos4)
\(t\) \(F(t)\) \(S(t)\) \(h(t)\) \(H(t)\)
0 0.1331221 0.8668779 0.1331221 0.1331221
1 0.2485227 0.7514773 0.1331221 0.2662442
2 0.3485609 0.6514391 0.1331221 0.3993663
3 0.4352819 0.5647181 0.1331221 0.5324884
4 0.5104583 0.4895417 0.1331221 0.6656105
5 0.5756272 0.4243728 0.1331221 0.7987326
6 0.6321206 0.3678794 0.1331221 0.9318547
7 0.6810934 0.3189066 0.1331221 1.0649768
8 0.7235470 0.2764530 0.1331221 1.1980989
9 0.7603490 0.2396510 0.1331221 1.3312210
10 0.7922518 0.2077482 0.1331221 1.4643431
11 0.8199077 0.1800923 0.1331221 1.5974652
12 0.8438820 0.1561180 0.1331221 1.7305873
13 0.8646647 0.1353353 0.1331221 1.8637094
14 0.8826808 0.1173192 0.1331221 1.9968315
15 0.8982986 0.1017014 0.1331221 2.1299536
16 0.9118373 0.0881627 0.1331221 2.2630757
17 0.9235737 0.0764263 0.1331221 2.3961978
18 0.9337477 0.0662523 0.1331221 2.5293199
19 0.9425674 0.0574326 0.1331221 2.6624420
20 0.9502129 0.0497871 0.1331221 2.7955641
21 0.9568407 0.0431593 0.1331221 2.9286862
22 0.9625861 0.0374139 0.1331221 3.0618083
23 0.9675668 0.0324332 0.1331221 3.1949304
24 0.9718843 0.0281157 0.1331221 3.3280525
25 0.9756272 0.0243728 0.1331221 3.4611746
26 0.9788717 0.0211283 0.1331221 3.5942967
27 0.9816844 0.0183156 0.1331221 3.7274188
28 0.9841226 0.0158774 0.1331221 3.8605409
29 0.9862362 0.0137638 NA NA
grafica_supervivencia(datos4)

grafica_riesgoAcum(datos4)

- OBSERVACIONES