ANÁLISE DE SOBREVIVÊNCIA E CONFIABILIDADE

AULA 2: COMPARAÇÃO DE CURVAS DE SOBREVIVÊNCIA (CONFIABILIDADE)

\[\\[0.05in]\]

1 PACOTES NECESSÁRIOS

Para esta segunda aula prática de Análise de Sobrevivência e Confiabilidade, precisaremos dos seguintes pacotes:

require(ggplot2)
require(survival)    
require(survminer)

Pacote ggplot2: Pacote fundamental para construção de gráficos no R
Pacote survival: É o pacote básico para o estudo de Análise de Sobrevivência e Confiabilidade. Contém as principais rotinas, incluindo definição de objetos Surv, curvas Kaplan-Meier, modelos Cox e modelos paramétricos.
Pacote survminer: O pacote survivaldo R ajusta e traça curvas de sobrevivência (confiabilidade) usando gráficos básicos do R. Os gráficos do pacote survminer são baseados na estrutura gráfica do pacote ggplot2:

2 BASES DE DADOS

Esta seção é dedicada à descrição das bases de dados utilizadas nesta aula.

2.1 HEPATITE

Um estudo clínico aleatorizado com o objetivo de investigar o efeito da terapia com esteroide no tratamento de hepatite viral aguda. Vinte e nove pacientes com esta doença foram aleatorizados para receber um placebo ou o tratamento com esteroide. Cada paciente foi acompanhado por 16 semanas ou até a morte (evento de interesse) ou até a perda de acompanhamento. Os dados são retratados a seguir:

2.2 MALÁRIA

Um estudo experimental realizado com camundongos para verificar a eficácia da imunização pela malária foi conduzido no Centro de Pesquisas René Rachou, Fiocruz, MG. Nesse estudo, quarenta e quatro camundongos foram aleatoriamente divididos em três grupos e todos foram infectados pela malária (Plasmodium berguei).

Os camundongos do grupo 1 foram imunizados 30 dias antes da infecção. Além da infecção pela malária, os camundongos dos grupos 1 e 3 foram, também, infectados pela esquistossomose (Schistossoma mansoní). A resposta de interesse nesse estudo foi o tempo decorrido desde a infecção pela malária até a morte do camundongo. Este tempo foi medido em dias e o estudo foi acompanhado por 30 dias. Os tempos de sobrevivência observados para os três grupos encontram-se abaixo. 0 simbolo + indica censura.

2.3 AIDS

O estudo é constituído de pacientes portadores de HIV atendidos entre 1986 e 2000 no Instituto de Pesquisa Clínica Evandro Chagas (Ipec/Fiocruz). Dessa coorte, obteve-se uma amostra de 193 indivíduos que foram diagnosticados como portadores de AIDS (critério CDC 1993) durante o período de acompanhamento. O objetivo é mensurar o tempo, em dias, do diagnóstico até a morte dos pacientes. Para comparação da sobrevivência, vamos ver como o sexo e tipo de tratamento retroviral impactam a sobrevivência do paciente. Para o caso da variável tratamento retroviral, tem-se 0 = nenhum, 1 = mono, 2 = combinada e 3 = potente. Essa base de dados está armazenada no objeto DadosAIDS.csv

2.4 FUNGO EM REQUEIJÃO

Um produtor de requeijão deseja comparar dois tipos de embalagens (A e B) para o seu produto. Ele deseja saber se existe diferença na durabilidade de seu produto com relação às embalagens. O produto dele é vendido à temperatura ambiente e sem conservantes. O evento de interesse é o aparecimento de algum tipo de fungo no produto. Os dados estão apresentados na Tabela abaixo, em que o tempo foi medido em horas. 0 simbolo + indica censura.

2.5 CÂNCER DE OVÁRIO

Os dados apresentados na Tabela abaixo representam o tempo (em dias) até a morte de pacientes com câncer de ovário tratados na Mayo Clinic. O símbolo + indica censura.

2.6 LEISHMANIOSE

Vinte e oito cães com leishmaniose foram selecionados para comparar quatro diferentes tipos de tratamentos (A, B, C e D) e um grupo controle. O evento de interese foi a morte do animal. Os dados estão apresentados na Tabela abaixo em que o tempo foi medido em meses. O simbolo + indica censura.

3 INTRODUÇÃO

Um procedimento natural para comparar curvas de sobrevivência (confiabilidade) usaria os resultados assintóticos de S(t), apresentados em sala, para testar a igualdade de funções de sobrevivência em um determinado tempo t. Esta forma, no entanto, não faria uso eficiente dos dados disponíveis, pois não se estaria usando todo o período do estudo. Esta aula tem por objetivo a aplicação no R de dois testes muito utilizados na comparação de curvas de sobrevivência (confiabilidade): Logrank e Peto.

Ambos os testes podem ser vistos como generalizações para dados censurados de testes não-paramétricos conhecidos. Considere o interesse de comparar curvas de sobrevivência (confiabilidade) entre \(k\) estratos. Nos dois testes, as hipóteses nula e alternativa são:

\(H_0: S_1(t)=S_2(t)=\cdots=S_k(t), \quad \forall t\)

\(H_1: \textrm{Pelo menos alguma curva se difere das outras em algum} \\ \quad \quad \textrm{momento do tempo.}\)

Vamos carregar a base dos dados de hepatite:

tempos <- c(1,2,3,3,3,5,5,16,16,16,16,16,16,16,16,1,1,1,1,4,5,7,8,10,10,12,16,16,16)
cens <- c(0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,0,0,1,1,1,1,0,0,0,0,0)
grupos <- c(rep("Controle",15),rep("Esteroide",14))    
Dados1 <- data.frame(tempos,cens,grupos)

Relembrando as estimativas de Kaplan-Meier e os respectivos intervalos com 95% de confiança:

ekm3<- survfit(data=Dados1,formula = Surv(tempos,cens)~grupos,
               conf.type = "log-log", conf.int=0.95)
ggsurvplot(ekm3,legend.title = " ",
           legend.labs = c("Controle", "Esteroide"), 
           legend = c(0.15, 0.4),
           conf.int=T)+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

4 TESTE LOGRANK

É o teste de comparação de curvas de sobrevivência (confiabilidade) mais utilizado. O teste Logrank compara a distribuição da ocorrência dos eventos observados em cada estrato com a distribuição que seria esperada se a incidência fosse igual em todos os estratos. Se a distribuição observada for equivalente à distribuição esperada, dizemos que a curva de sobrevivência dos pacientes pertencentes ao estrato é equivalente a curva de sobrevivência dos pacientes em geral, ou seja, essa variável não afeta a sobrevivência.

Considere o caso da comparação das curvas de sobrevivência do grupo controle e esteroide para os pacientes com hepatite. De acordo com a hipótese nula do teste, pacientes do grupo controle e esteroide têm a mesma chance de morrer por hepatite em todos os momentos de tempo.

Assim, se tivéssemos 50 pacientes no grupo controle e 50 pacientes no grupo esteroide e 10 mortes são observadas na primeira semana, seria esperado, sob a hipótese nula, que 50% das mortes sejam no grupo controle e os outros 50% no grupo esteroide. Por outro lado, se tivéssemos 10 pacientes no grupo controle e 90 pacientes no grupo esteroide e 10 mortes são observadas na primeira semana, seria esperado, sob a hipótese nula, 10% das mortes sejam no grupo controle e 90% das mortes sejam no grupo esteroide.

De uma forma bem simplista, o teste Logrank compara os valores observados com os valores esperados, sob a hipótese nula. Sua estatística de teste T, pode ser expressa como:

\[T=\frac{(O-E)^2}{Var(O-E)},\]

em que O e E representam os valores observados e esperados, respectivamente. Sob a hipótese nula, a estatística de teste T possui distribuição qui-quadrado com \(k-1\) graus de liberdade (k=número de estratos). Assim, no exemplo dos dados de hepatite, tem-se que a estatística de teste possui distribuição qui-quadrado com 2-1 = 1 grau de liberdade.

No R o teste Logrank é feito com a função survdiff() do pacote survival. Sua sintaxe é análoga à sintaxe da função survfit(), vista na aula prática passada. Seguem os comandos:

survdiff(Surv(tempos,cens)~grupos, data=Dados1)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados1)
## 
##                   N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Controle  15        2     4.81      1.64      3.67
## grupos=Esteroide 14        7     4.19      1.89      3.67
## 
##  Chisq= 3.7  on 1 degrees of freedom, p= 0.06

Para este exemplo, o p-valor é pequeno o que favorece a rejeição da hipótese nula indicando que há evidências de que as curvas de sobrevivência dos dois grupos são diferentes.

Graficamente, podemos incluir o p-valor do teste nas curvas de sobrevivência incluindo o comando pval=T:

ggsurvplot(ekm3,legend.title = " ",
           legend.labs = c("Controle", "Esteroide"), 
           legend = c(0.15, 0.4),
           conf.int=T,
           pval = T)+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

5 TESTE PETO

O teste Logrank coloca o mesmo peso para todos os tempos distintos de ocorrência do evento no cálculo de sua estatística de teste. Isso motiva a construção de outros testes pois pode ser de interesse ponderar as observações na estatística de teste de acordo com pesos diferentes. Assim, é possível colocar mais peso no início do estudo ou no final do estudo, por exemplo.

Peto sugere utilizar uma função de peso que depende diretamente da experiência passada de sobrevivência. O teste dá maior peso ao perfil de sobrevivência de tempos menores, ou seja, às diferenças (ou semelhanças) no início da curva. A justificativa para isso é que os tempos iniciais concentram a maior parte dos dados e, por isso, são mais informativos. Esse maior peso no início da curva é obtido pela inclusão de um fator de ponderação igual ao valor estimado da sobrevivência \(S(t)\) na estatística do teste Logrank.

No R o teste Logrank é feito com a função survdiff() do pacote survival. Sua sintaxe é análoga à do teste anterior, apenas com o acréscimo do argumento rho=1:

survdiff(Surv(tempos,cens)~grupos, data=Dados1, rho=1)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados1, 
##     rho = 1)
## 
##                   N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Controle  15     1.79     4.16      1.35      3.43
## grupos=Esteroide 14     6.00     3.63      1.54      3.43
## 
##  Chisq= 3.4  on 1 degrees of freedom, p= 0.06

Conforme visto em sala, como o p-valor é pequeno, rejeita-se a hipótese nula, isto é, há evidências estatísticas para inferir que as curvas de sobrevivência dos grupos controle e esteroide são diferentes.

Para colocar o p-valor do teste de Peto no gráfico, a manipulação deve ser feita manualmente na função ggsurvplot():

p.value = survdiff(Surv(tempos,cens)~grupos, data=Dados1, rho=1)$pvalue

ggsurvplot(ekm3,legend.title = " ",
           legend.labs = c("Controle", "Esteroide"), 
           legend = c(0.15, 0.4),
           pval=round(p.value,3))+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

6 COMPARAÇÕES MÚLTIPLAS

No exemplo anterior, vimos a aplicação dos testes Logrank e Peto para a comparação de duas curvas de sobrevivência. Entretanto, estes testes podem ser facilmenete adaptados para o caso em que há mais de k=2 curvas de sobrevivência. Para exemplificar, utilizaremos os teste de Logrank e Peto para os dados de Malária. Para isto, vamos carregar a base de dados:

tempos<-c(7,8,8,8,8,12,12,17,18,22,30,30,30,30,30,30,8,8,9,10,10,14,
          15,15,18,19,21,22,22,23,25,8,8,8,8,8,8,9,10,10,10,11,17,19)
cens<-c(rep(1,10), rep(0,6),rep(1,15),rep(1,13))
grupos<-c(rep("Grupo 1",16), rep("Grupo 2",15), rep("Grupo 3",13))
Dados2<-data.frame(tempos,cens,grupos)

Podemos obter as estimativas de Kaplan-Meier para as três funções de sobrevivência:

ekm3<- survfit(data=Dados2,formula = Surv(tempos,cens)~grupos,
               conf.type = "log-log", conf.int=0.95)
summary(ekm3)

## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = Dados2, 
##     conf.type = "log-log", conf.int = 0.95)
## 
##                 grupos=Grupo 1 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     7     16       1    0.938  0.0605        0.632        0.991
##     8     15       4    0.688  0.1159        0.405        0.856
##    12     11       2    0.562  0.1240        0.295        0.762
##    17      9       1    0.500  0.1250        0.245        0.710
##    18      8       1    0.438  0.1240        0.198        0.656
##    22      7       1    0.375  0.1210        0.154        0.598
## 
##                 grupos=Grupo 2 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     8     15       2   0.8667  0.0878       0.5639        0.965
##     9     13       1   0.8000  0.1033       0.4998        0.931
##    10     12       2   0.6667  0.1217       0.3753        0.846
##    14     10       1   0.6000  0.1265       0.3176        0.797
##    15      9       2   0.4667  0.1288       0.2123        0.687
##    18      7       1   0.4000  0.1265       0.1649        0.628
##    19      6       1   0.3333  0.1217       0.1215        0.564
##    21      5       1   0.2667  0.1142       0.0826        0.496
##    22      4       2   0.1333  0.0878       0.0219        0.346
##    23      2       1   0.0667  0.0644       0.0043        0.260
##    25      1       1   0.0000     NaN           NA           NA
## 
##                 grupos=Grupo 3 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     8     13       6   0.5385  0.1383      0.24766        0.760
##     9      7       1   0.4615  0.1383      0.19161        0.696
##    10      6       3   0.2308  0.1169      0.05584        0.475
##    11      3       1   0.1538  0.1001      0.02476        0.388
##    17      2       1   0.0769  0.0739      0.00477        0.292
##    19      1       1   0.0000     NaN           NA           NA

Além disso, podemos representá-las em um gráfico:

ggsurvplot(ekm3,legend.title = " ",
           legend.labs = c("Grupo 1", "Grupo 2", "Grupo 3"), 
           legend = c(0.15, 0.4))+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

E acrescentar os intervalos de confiança:

ggsurvplot(ekm3,legend.title = " ",
           legend.labs = c("Grupo 1", "Grupo 2", "Grupo 3"), 
           legend = c(0.15, 0.4),
           conf.int=T)+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

6.1 TESTE LOGRANK

Inicialmente, o teste é conduzido da mesma forma como no exemplo dos dados de hepatite:

 survdiff(Surv(tempos,cens)~grupos, data=Dados2)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados2)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16       10    17.00    2.8816    6.4111
## grupos=Grupo 2 15       15    14.51    0.0167    0.0317
## grupos=Grupo 3 13       13     6.49    6.5190   10.4447
## 
##  Chisq= 12.6  on 2 degrees of freedom, p= 0.002

Considere a utilização de um nível de significância \(\alpha\) de 5%. A estatística de teste possui agora, sob \(H_0\), uma distribuição qui-quadrado com k-1 = 3 - 1 = 2 graus de liberdade. O p-valor é pequeno o que favorece a rejeição da hipótese nula indicando que há evidências de que as curvas de sobrevivência dos três grupos são diferentes.

Com a rejeição da hipótese nula do teste principal, três subtestes devem ser realizados para detectar a diferença entre as curvas de sobrevivência:

Grupo 1 x Grupo 2
Grupo 1 x Grupo 3
Grupo 2 x Grupo 3

Para não inflar o nível de significância na realização de novos testes de hipóteses, é preciso utilizar um método de correção dessa quantidade. Se foi utilizado um \(\alpha=0,05\) no teste principal, o método de Bonferroni utiliza, por exemplo, para cada subteste, um nível de significância \(\alpha^*\) de 0,05/3=0,017. Assim, garante-se uma conclusão geral a um nível máximo de significância \(\alpha\) de 0,05.

Para isto, vamos preparar as bases para cada subteste:

DadosG1_2<-Dados2[-c(32:44),]
DadosG1_3<-Dados2[-c(17:31),]
DadosG2_3<-Dados2[-c(1:17),]

6.1.1 GRUPOS 1 E 2

Para os grupos 1 e 2, temos as estimativas de Kaplan-Meier:

ekmg1_2<- survfit(data=DadosG1_2,formula = Surv(tempos,cens)~grupos,
               conf.type = "log-log", conf.int=0.95)
summary(ekmg1_2)

## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_2, 
##     conf.type = "log-log", conf.int = 0.95)
## 
##                 grupos=Grupo 1 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     7     16       1    0.938  0.0605        0.632        0.991
##     8     15       4    0.688  0.1159        0.405        0.856
##    12     11       2    0.562  0.1240        0.295        0.762
##    17      9       1    0.500  0.1250        0.245        0.710
##    18      8       1    0.438  0.1240        0.198        0.656
##    22      7       1    0.375  0.1210        0.154        0.598
## 
##                 grupos=Grupo 2 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     8     15       2   0.8667  0.0878       0.5639        0.965
##     9     13       1   0.8000  0.1033       0.4998        0.931
##    10     12       2   0.6667  0.1217       0.3753        0.846
##    14     10       1   0.6000  0.1265       0.3176        0.797
##    15      9       2   0.4667  0.1288       0.2123        0.687
##    18      7       1   0.4000  0.1265       0.1649        0.628
##    19      6       1   0.3333  0.1217       0.1215        0.564
##    21      5       1   0.2667  0.1142       0.0826        0.496
##    22      4       2   0.1333  0.0878       0.0219        0.346
##    23      2       1   0.0667  0.0644       0.0043        0.260
##    25      1       1   0.0000     NaN           NA           NA

Graficamente, temos os comandos:

ggsurvplot(ekmg1_2,legend.title = " ",
           legend = c(0.15, 0.4),
             legend.labs = c("Grupo 1", "Grupo 2"))+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:

survdiff(Surv(tempos,cens)~grupos, data=DadosG1_2)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_2)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16       10     13.7      1.01      2.53
## grupos=Grupo 2 15       15     11.3      1.23      2.53
## 
##  Chisq= 2.5  on 1 degrees of freedom, p= 0.1

Considerando o nível de significância \(\alpha^*=0,017\), não rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são iguais.

6.1.2 GRUPOS 1 E 3

Para os grupos 1 e 3, temos as estimativas de Kaplan-Meier:

ekmg1_3<- survfit(data=DadosG1_3,formula = Surv(tempos,cens)~grupos,
               conf.type = "log-log", conf.int=0.95)
summary(ekmg1_3)

## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_3, 
##     conf.type = "log-log", conf.int = 0.95)
## 
##                 grupos=Grupo 1 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     7     16       1    0.938  0.0605        0.632        0.991
##     8     15       4    0.688  0.1159        0.405        0.856
##    12     11       2    0.562  0.1240        0.295        0.762
##    17      9       1    0.500  0.1250        0.245        0.710
##    18      8       1    0.438  0.1240        0.198        0.656
##    22      7       1    0.375  0.1210        0.154        0.598
## 
##                 grupos=Grupo 3 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     8     13       6   0.5385  0.1383      0.24766        0.760
##     9      7       1   0.4615  0.1383      0.19161        0.696
##    10      6       3   0.2308  0.1169      0.05584        0.475
##    11      3       1   0.1538  0.1001      0.02476        0.388
##    17      2       1   0.0769  0.0739      0.00477        0.292
##    19      1       1   0.0000     NaN           NA           NA

Graficamente, temos os comandos:

ggsurvplot(ekmg1_3,legend.title = " ",
           legend = c(0.15, 0.4),
             legend.labs = c("Grupo 1", "Grupo 3"))+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:

survdiff(Surv(tempos,cens)~grupos, data=DadosG1_3)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_3)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16       10    15.34      1.86      7.86
## grupos=Grupo 3 13       13     7.66      3.72      7.86
## 
##  Chisq= 7.9  on 1 degrees of freedom, p= 0.005

Considerando o nível de significância \(\alpha^*=0,017\), rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são diferentes.

6.1.3 GRUPOS 2 E 3

Para os grupos 2 e 3, temos as estimativas de Kaplan-Meier:

ekmg2_3<- survfit(data=DadosG2_3,formula = Surv(tempos,cens)~grupos,
               conf.type = "log-log", conf.int=0.95)
summary(ekmg2_3)

## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = DadosG2_3, 
##     conf.type = "log-log", conf.int = 0.95)
## 
##                 grupos=Grupo 2 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     8     14       1   0.9286  0.0688      0.59077        0.990
##     9     13       1   0.8571  0.0935      0.53945        0.962
##    10     12       2   0.7143  0.1207      0.40630        0.882
##    14     10       1   0.6429  0.1281      0.34331        0.833
##    15      9       2   0.5000  0.1336      0.22859        0.722
##    18      7       1   0.4286  0.1323      0.17727        0.660
##    19      6       1   0.3571  0.1281      0.13035        0.594
##    21      5       1   0.2857  0.1207      0.08834        0.524
##    22      4       2   0.1429  0.0935      0.02322        0.366
##    23      2       1   0.0714  0.0688      0.00452        0.275
##    25      1       1   0.0000     NaN           NA           NA
## 
##                 grupos=Grupo 3 
##  time n.risk n.event survival std.err lower 95% CI upper 95% CI
##     8     13       6   0.5385  0.1383      0.24766        0.760
##     9      7       1   0.4615  0.1383      0.19161        0.696
##    10      6       3   0.2308  0.1169      0.05584        0.475
##    11      3       1   0.1538  0.1001      0.02476        0.388
##    17      2       1   0.0769  0.0739      0.00477        0.292
##    19      1       1   0.0000     NaN           NA           NA

Graficamente, temos os comandos:

ggsurvplot(ekmg2_3,legend.title = " ",
           legend = c(0.15, 0.4),
             legend.labs = c("Grupo 2", "Grupo 3"))+
  xlab("Tempo (semanas)")+
  ylab("Sobrevivencia estimada")

O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:

survdiff(Surv(tempos,cens)~grupos, data=DadosG2_3)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG2_3)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 2 14       14    19.87      1.73      9.32
## grupos=Grupo 3 13       13     7.13      4.83      9.32
## 
##  Chisq= 9.3  on 1 degrees of freedom, p= 0.002

Considerando o nível de significância \(\alpha^*=0,017\), rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são diferentes.

6.2 TESTE PETO

Para o teste Peto, basta acrescentar o comando rho=1 nos testes, Inicialmente, o teste é conduzido da mesma forma como no exemplo dos dados de hepatite:

 survdiff(Surv(tempos,cens)~grupos, data=Dados2,rho=1)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados2, 
##     rho = 1)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16     6.98     9.57     0.702      1.96
## grupos=Grupo 2 15     7.16     9.07     0.402      1.06
## grupos=Grupo 3 13     9.82     5.32     3.808      7.63
## 
##  Chisq= 7.7  on 2 degrees of freedom, p= 0.02

Com a rejeição da hipótese nula do teste principal, três subtestes devem ser realizados para detectar a diferença entre as curvas de sobrevivência.

6.2.1 GRUPOS 1 E 2

O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:

survdiff(Surv(tempos,cens)~grupos, data=DadosG1_2, rho=1)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_2, 
##     rho = 1)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16     7.58     8.39    0.0775     0.247
## grupos=Grupo 2 15     8.45     7.65    0.0851     0.247
## 
##  Chisq= 0.2  on 1 degrees of freedom, p= 0.6

Considerando o nível de significância \(\alpha^*=0,017\), não rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são iguais.

6.2.2 GRUPOS 1 E 3

O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:

survdiff(Surv(tempos,cens)~grupos, data=DadosG1_3,rho=1)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_3, 
##     rho = 1)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16     6.69     9.76     0.965      4.22
## grupos=Grupo 3 13     9.31     6.24     1.509      4.22
## 
##  Chisq= 4.2  on 1 degrees of freedom, p= 0.04

Considerando o nível de significância \(\alpha^*=0,017\), não rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são iguais.

6.2.3 GRUPOS 2 E 3

O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:

survdiff(Surv(tempos,cens)~grupos, data=DadosG2_3, rho=1)

## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG2_3, 
##     rho = 1)
## 
##                 N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 2 14     5.48     9.78      1.89      8.73
## grupos=Grupo 3 13     9.81     5.52      3.34      8.73
## 
##  Chisq= 8.7  on 1 degrees of freedom, p= 0.003

Considerando o nível de significância \(\alpha^*=0,017\), rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são diferentes.

7 EXERCÍCIOS

1- Dados de AIDS

Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência por sexo e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos dois grupos do item a) usando dois testes diferentes. Os resultados dos dois testes fornecem a mesma conclusão? Em caso negativo, reflita sobre a diferença dos resultados.
Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência por tipo de tratamento retroviral e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos quatro grupos do item c) usando algum teste de hipótese. Há diferenças entre os diferentes tipos de tratamento? Se necessário, faça comparações múltiplas

2- Dados de Fungo em Requeijão

Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência de ambos os grupos e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos dois grupos usando dois testes diferentes. Os resultados dos dois testes fornecem a mesma conclusão? Em caso negativo, reflita sobre a razão da diferença dos resultados.

3- Dados de Câncer de Ovário

Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência de ambos os grupos e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos dois grupos usando dois testes diferentes. Os resultados dos dois testes fornecem a mesma conclusão? Em caso negativo, reflita sobre a razão da diferença dos resultados.

4- Dados de Leishmaniose

Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência de ambos os grupos e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos cinco grupos utilizando algum teste de hipótese. Há diferença entre os grupos?