Para esta segunda aula prática de Análise de Sobrevivência e Confiabilidade, precisaremos dos seguintes pacotes:
require(ggplot2)
require(survival)
require(survminer)
Pacote ggplot2: Pacote
fundamental para construção de gráficos no
R
Pacote survival: É o pacote
básico para o estudo de Análise de
Sobrevivência e Confiabilidade. Contém as principais
rotinas, incluindo definição de objetos
Surv, curvas Kaplan-Meier, modelos
Cox e modelos paramétricos.
Pacote survminer: O pacote
survivaldo R ajusta e traça curvas de
sobrevivência (confiabilidade) usando gráficos
básicos do R. Os gráficos do pacote
survminer são baseados na estrutura
gráfica do pacote ggplot2:
Esta seção é dedicada à descrição das bases de dados utilizadas nesta aula.
Um estudo clínico aleatorizado com o objetivo de investigar o efeito da terapia com esteroide no tratamento de hepatite viral aguda. Vinte e nove pacientes com esta doença foram aleatorizados para receber um placebo ou o tratamento com esteroide. Cada paciente foi acompanhado por 16 semanas ou até a morte (evento de interesse) ou até a perda de acompanhamento. Os dados são retratados a seguir:
Um estudo experimental realizado com camundongos para verificar a eficácia da imunização pela malária foi conduzido no Centro de Pesquisas René Rachou, Fiocruz, MG. Nesse estudo, quarenta e quatro camundongos foram aleatoriamente divididos em três grupos e todos foram infectados pela malária (Plasmodium berguei).
Os camundongos do grupo 1 foram imunizados 30 dias antes da infecção. Além da infecção pela malária, os camundongos dos grupos 1 e 3 foram, também, infectados pela esquistossomose (Schistossoma mansoní). A resposta de interesse nesse estudo foi o tempo decorrido desde a infecção pela malária até a morte do camundongo. Este tempo foi medido em dias e o estudo foi acompanhado por 30 dias. Os tempos de sobrevivência observados para os três grupos encontram-se abaixo. 0 simbolo + indica censura.
O estudo é constituído de pacientes portadores de HIV
atendidos entre 1986 e 2000 no Instituto de Pesquisa Clínica
Evandro Chagas (Ipec/Fiocruz). Dessa coorte, obteve-se uma
amostra de 193 indivíduos que foram diagnosticados como portadores de
AIDS (critério CDC 1993) durante o período de acompanhamento. O
objetivo é mensurar o tempo, em dias, do diagnóstico até a morte
dos pacientes. Para comparação da sobrevivência, vamos ver como
o sexo e tipo de tratamento retroviral impactam a sobrevivência do
paciente. Para o caso da variável tratamento
retroviral, tem-se 0 = nenhum, 1 = mono, 2 = combinada e 3 =
potente. Essa base de dados está armazenada no objeto
DadosAIDS.csv
Um produtor de requeijão deseja comparar dois tipos de embalagens (A e B) para o seu produto. Ele deseja saber se existe diferença na durabilidade de seu produto com relação às embalagens. O produto dele é vendido à temperatura ambiente e sem conservantes. O evento de interesse é o aparecimento de algum tipo de fungo no produto. Os dados estão apresentados na Tabela abaixo, em que o tempo foi medido em horas. 0 simbolo + indica censura.
Os dados apresentados na Tabela abaixo representam o tempo (em dias) até a morte de pacientes com câncer de ovário tratados na Mayo Clinic. O símbolo + indica censura.
Vinte e oito cães com leishmaniose foram selecionados para comparar quatro diferentes tipos de tratamentos (A, B, C e D) e um grupo controle. O evento de interese foi a morte do animal. Os dados estão apresentados na Tabela abaixo em que o tempo foi medido em meses. O simbolo + indica censura.
Um procedimento natural para comparar curvas de
sobrevivência (confiabilidade) usaria os resultados assintóticos de
S(t), apresentados em sala, para testar a igualdade de funções de
sobrevivência em um determinado tempo t. Esta forma, no entanto,
não faria uso eficiente dos dados disponíveis, pois não se
estaria usando todo o período do estudo. Esta aula tem por
objetivo a aplicação no R de dois
testes muito utilizados na comparação de curvas de sobrevivência
(confiabilidade): Logrank e Peto.
Ambos os testes podem ser vistos como generalizações para dados censurados de testes não-paramétricos conhecidos. Considere o interesse de comparar curvas de sobrevivência (confiabilidade) entre \(k\) estratos. Nos dois testes, as hipóteses nula e alternativa são:
\(H_0: S_1(t)=S_2(t)=\cdots=S_k(t), \quad \forall t\)
\(H_1: \textrm{Pelo menos alguma curva se difere das outras em algum} \\ \quad \quad \textrm{momento do tempo.}\)
Vamos carregar a base dos dados de hepatite:
tempos <- c(1,2,3,3,3,5,5,16,16,16,16,16,16,16,16,1,1,1,1,4,5,7,8,10,10,12,16,16,16)
cens <- c(0,0,1,1,0,0,0,0,0,0,0,0,0,0,0,1,1,1,0,0,1,1,1,1,0,0,0,0,0)
grupos <- c(rep("Controle",15),rep("Esteroide",14))
Dados1 <- data.frame(tempos,cens,grupos)
Relembrando as estimativas de Kaplan-Meier e os respectivos intervalos com 95% de confiança:
ekm3<- survfit(data=Dados1,formula = Surv(tempos,cens)~grupos,
conf.type = "log-log", conf.int=0.95)
ggsurvplot(ekm3,legend.title = " ",
legend.labs = c("Controle", "Esteroide"),
legend = c(0.15, 0.4),
conf.int=T)+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
É o teste de comparação de curvas de sobrevivência (confiabilidade) mais utilizado. O teste Logrank compara a distribuição da ocorrência dos eventos observados em cada estrato com a distribuição que seria esperada se a incidência fosse igual em todos os estratos. Se a distribuição observada for equivalente à distribuição esperada, dizemos que a curva de sobrevivência dos pacientes pertencentes ao estrato é equivalente a curva de sobrevivência dos pacientes em geral, ou seja, essa variável não afeta a sobrevivência.
Considere o caso da comparação das curvas de sobrevivência do grupo controle e esteroide para os pacientes com hepatite. De acordo com a hipótese nula do teste, pacientes do grupo controle e esteroide têm a mesma chance de morrer por hepatite em todos os momentos de tempo.
Assim, se tivéssemos 50 pacientes no grupo controle e 50 pacientes no grupo esteroide e 10 mortes são observadas na primeira semana, seria esperado, sob a hipótese nula, que 50% das mortes sejam no grupo controle e os outros 50% no grupo esteroide. Por outro lado, se tivéssemos 10 pacientes no grupo controle e 90 pacientes no grupo esteroide e 10 mortes são observadas na primeira semana, seria esperado, sob a hipótese nula, 10% das mortes sejam no grupo controle e 90% das mortes sejam no grupo esteroide.
De uma forma bem simplista, o teste Logrank compara os valores observados com os valores esperados, sob a hipótese nula. Sua estatística de teste T, pode ser expressa como:
\[T=\frac{(O-E)^2}{Var(O-E)},\]
em que O e E representam os valores observados e esperados, respectivamente. Sob a hipótese nula, a estatística de teste T possui distribuição qui-quadrado com \(k-1\) graus de liberdade (k=número de estratos). Assim, no exemplo dos dados de hepatite, tem-se que a estatística de teste possui distribuição qui-quadrado com 2-1 = 1 grau de liberdade.
No R o teste Logrank é feito com a função
survdiff() do pacote survival. Sua
sintaxe é análoga à sintaxe da função
survfit(), vista na aula prática passada. Seguem
os comandos:
survdiff(Surv(tempos,cens)~grupos, data=Dados1)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados1)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Controle 15 2 4.81 1.64 3.67
## grupos=Esteroide 14 7 4.19 1.89 3.67
##
## Chisq= 3.7 on 1 degrees of freedom, p= 0.06
Para este exemplo, o p-valor é pequeno o que favorece a rejeição da hipótese nula indicando que há evidências de que as curvas de sobrevivência dos dois grupos são diferentes.
Graficamente, podemos incluir o p-valor do teste nas curvas
de sobrevivência incluindo o comando
pval=T:
ggsurvplot(ekm3,legend.title = " ",
legend.labs = c("Controle", "Esteroide"),
legend = c(0.15, 0.4),
conf.int=T,
pval = T)+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
O teste Logrank coloca o mesmo peso para todos os tempos distintos de ocorrência do evento no cálculo de sua estatística de teste. Isso motiva a construção de outros testes pois pode ser de interesse ponderar as observações na estatística de teste de acordo com pesos diferentes. Assim, é possível colocar mais peso no início do estudo ou no final do estudo, por exemplo.
Peto sugere utilizar uma função de peso que depende diretamente da experiência passada de sobrevivência. O teste dá maior peso ao perfil de sobrevivência de tempos menores, ou seja, às diferenças (ou semelhanças) no início da curva. A justificativa para isso é que os tempos iniciais concentram a maior parte dos dados e, por isso, são mais informativos. Esse maior peso no início da curva é obtido pela inclusão de um fator de ponderação igual ao valor estimado da sobrevivência \(S(t)\) na estatística do teste Logrank.
No R o teste Logrank é feito com a função
survdiff() do pacote survival. Sua
sintaxe é análoga à do teste anterior, apenas com o
acréscimo do argumento rho=1:
survdiff(Surv(tempos,cens)~grupos, data=Dados1, rho=1)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados1,
## rho = 1)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Controle 15 1.79 4.16 1.35 3.43
## grupos=Esteroide 14 6.00 3.63 1.54 3.43
##
## Chisq= 3.4 on 1 degrees of freedom, p= 0.06
Conforme visto em sala, como o p-valor é pequeno, rejeita-se a hipótese nula, isto é, há evidências estatísticas para inferir que as curvas de sobrevivência dos grupos controle e esteroide são diferentes.
Para colocar o p-valor do teste de Peto no gráfico,
a manipulação deve ser feita manualmente na função
ggsurvplot():
p.value = survdiff(Surv(tempos,cens)~grupos, data=Dados1, rho=1)$pvalue
ggsurvplot(ekm3,legend.title = " ",
legend.labs = c("Controle", "Esteroide"),
legend = c(0.15, 0.4),
pval=round(p.value,3))+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
No exemplo anterior, vimos a aplicação dos testes Logrank e Peto para a comparação de duas curvas de sobrevivência. Entretanto, estes testes podem ser facilmenete adaptados para o caso em que há mais de k=2 curvas de sobrevivência. Para exemplificar, utilizaremos os teste de Logrank e Peto para os dados de Malária. Para isto, vamos carregar a base de dados:
tempos<-c(7,8,8,8,8,12,12,17,18,22,30,30,30,30,30,30,8,8,9,10,10,14,
15,15,18,19,21,22,22,23,25,8,8,8,8,8,8,9,10,10,10,11,17,19)
cens<-c(rep(1,10), rep(0,6),rep(1,15),rep(1,13))
grupos<-c(rep("Grupo 1",16), rep("Grupo 2",15), rep("Grupo 3",13))
Dados2<-data.frame(tempos,cens,grupos)
Podemos obter as estimativas de Kaplan-Meier para as três funções de sobrevivência:
ekm3<- survfit(data=Dados2,formula = Surv(tempos,cens)~grupos,
conf.type = "log-log", conf.int=0.95)
summary(ekm3)
## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = Dados2,
## conf.type = "log-log", conf.int = 0.95)
##
## grupos=Grupo 1
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 7 16 1 0.938 0.0605 0.632 0.991
## 8 15 4 0.688 0.1159 0.405 0.856
## 12 11 2 0.562 0.1240 0.295 0.762
## 17 9 1 0.500 0.1250 0.245 0.710
## 18 8 1 0.438 0.1240 0.198 0.656
## 22 7 1 0.375 0.1210 0.154 0.598
##
## grupos=Grupo 2
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 8 15 2 0.8667 0.0878 0.5639 0.965
## 9 13 1 0.8000 0.1033 0.4998 0.931
## 10 12 2 0.6667 0.1217 0.3753 0.846
## 14 10 1 0.6000 0.1265 0.3176 0.797
## 15 9 2 0.4667 0.1288 0.2123 0.687
## 18 7 1 0.4000 0.1265 0.1649 0.628
## 19 6 1 0.3333 0.1217 0.1215 0.564
## 21 5 1 0.2667 0.1142 0.0826 0.496
## 22 4 2 0.1333 0.0878 0.0219 0.346
## 23 2 1 0.0667 0.0644 0.0043 0.260
## 25 1 1 0.0000 NaN NA NA
##
## grupos=Grupo 3
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 8 13 6 0.5385 0.1383 0.24766 0.760
## 9 7 1 0.4615 0.1383 0.19161 0.696
## 10 6 3 0.2308 0.1169 0.05584 0.475
## 11 3 1 0.1538 0.1001 0.02476 0.388
## 17 2 1 0.0769 0.0739 0.00477 0.292
## 19 1 1 0.0000 NaN NA NA
Além disso, podemos representá-las em um gráfico:
ggsurvplot(ekm3,legend.title = " ",
legend.labs = c("Grupo 1", "Grupo 2", "Grupo 3"),
legend = c(0.15, 0.4))+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
E acrescentar os intervalos de confiança:
ggsurvplot(ekm3,legend.title = " ",
legend.labs = c("Grupo 1", "Grupo 2", "Grupo 3"),
legend = c(0.15, 0.4),
conf.int=T)+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
Inicialmente, o teste é conduzido da mesma forma como no exemplo dos dados de hepatite:
survdiff(Surv(tempos,cens)~grupos, data=Dados2)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados2)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16 10 17.00 2.8816 6.4111
## grupos=Grupo 2 15 15 14.51 0.0167 0.0317
## grupos=Grupo 3 13 13 6.49 6.5190 10.4447
##
## Chisq= 12.6 on 2 degrees of freedom, p= 0.002
Considere a utilização de um nível de significância \(\alpha\) de 5%. A estatística de teste possui agora, sob \(H_0\), uma distribuição qui-quadrado com k-1 = 3 - 1 = 2 graus de liberdade. O p-valor é pequeno o que favorece a rejeição da hipótese nula indicando que há evidências de que as curvas de sobrevivência dos três grupos são diferentes.
Com a rejeição da hipótese nula do teste principal, três subtestes devem ser realizados para detectar a diferença entre as curvas de sobrevivência:
Para não inflar o nível de significância na realização de novos testes de hipóteses, é preciso utilizar um método de correção dessa quantidade. Se foi utilizado um \(\alpha=0,05\) no teste principal, o método de Bonferroni utiliza, por exemplo, para cada subteste, um nível de significância \(\alpha^*\) de 0,05/3=0,017. Assim, garante-se uma conclusão geral a um nível máximo de significância \(\alpha\) de 0,05.
Para isto, vamos preparar as bases para cada subteste:
DadosG1_2<-Dados2[-c(32:44),]
DadosG1_3<-Dados2[-c(17:31),]
DadosG2_3<-Dados2[-c(1:17),]
Para os grupos 1 e 2, temos as estimativas de Kaplan-Meier:
ekmg1_2<- survfit(data=DadosG1_2,formula = Surv(tempos,cens)~grupos,
conf.type = "log-log", conf.int=0.95)
summary(ekmg1_2)
## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_2,
## conf.type = "log-log", conf.int = 0.95)
##
## grupos=Grupo 1
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 7 16 1 0.938 0.0605 0.632 0.991
## 8 15 4 0.688 0.1159 0.405 0.856
## 12 11 2 0.562 0.1240 0.295 0.762
## 17 9 1 0.500 0.1250 0.245 0.710
## 18 8 1 0.438 0.1240 0.198 0.656
## 22 7 1 0.375 0.1210 0.154 0.598
##
## grupos=Grupo 2
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 8 15 2 0.8667 0.0878 0.5639 0.965
## 9 13 1 0.8000 0.1033 0.4998 0.931
## 10 12 2 0.6667 0.1217 0.3753 0.846
## 14 10 1 0.6000 0.1265 0.3176 0.797
## 15 9 2 0.4667 0.1288 0.2123 0.687
## 18 7 1 0.4000 0.1265 0.1649 0.628
## 19 6 1 0.3333 0.1217 0.1215 0.564
## 21 5 1 0.2667 0.1142 0.0826 0.496
## 22 4 2 0.1333 0.0878 0.0219 0.346
## 23 2 1 0.0667 0.0644 0.0043 0.260
## 25 1 1 0.0000 NaN NA NA
Graficamente, temos os comandos:
ggsurvplot(ekmg1_2,legend.title = " ",
legend = c(0.15, 0.4),
legend.labs = c("Grupo 1", "Grupo 2"))+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:
survdiff(Surv(tempos,cens)~grupos, data=DadosG1_2)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_2)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16 10 13.7 1.01 2.53
## grupos=Grupo 2 15 15 11.3 1.23 2.53
##
## Chisq= 2.5 on 1 degrees of freedom, p= 0.1
Considerando o nível de significância \(\alpha^*=0,017\), não rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são iguais.
Para os grupos 1 e 3, temos as estimativas de Kaplan-Meier:
ekmg1_3<- survfit(data=DadosG1_3,formula = Surv(tempos,cens)~grupos,
conf.type = "log-log", conf.int=0.95)
summary(ekmg1_3)
## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_3,
## conf.type = "log-log", conf.int = 0.95)
##
## grupos=Grupo 1
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 7 16 1 0.938 0.0605 0.632 0.991
## 8 15 4 0.688 0.1159 0.405 0.856
## 12 11 2 0.562 0.1240 0.295 0.762
## 17 9 1 0.500 0.1250 0.245 0.710
## 18 8 1 0.438 0.1240 0.198 0.656
## 22 7 1 0.375 0.1210 0.154 0.598
##
## grupos=Grupo 3
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 8 13 6 0.5385 0.1383 0.24766 0.760
## 9 7 1 0.4615 0.1383 0.19161 0.696
## 10 6 3 0.2308 0.1169 0.05584 0.475
## 11 3 1 0.1538 0.1001 0.02476 0.388
## 17 2 1 0.0769 0.0739 0.00477 0.292
## 19 1 1 0.0000 NaN NA NA
Graficamente, temos os comandos:
ggsurvplot(ekmg1_3,legend.title = " ",
legend = c(0.15, 0.4),
legend.labs = c("Grupo 1", "Grupo 3"))+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:
survdiff(Surv(tempos,cens)~grupos, data=DadosG1_3)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_3)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16 10 15.34 1.86 7.86
## grupos=Grupo 3 13 13 7.66 3.72 7.86
##
## Chisq= 7.9 on 1 degrees of freedom, p= 0.005
Considerando o nível de significância \(\alpha^*=0,017\), rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são diferentes.
Para os grupos 2 e 3, temos as estimativas de Kaplan-Meier:
ekmg2_3<- survfit(data=DadosG2_3,formula = Surv(tempos,cens)~grupos,
conf.type = "log-log", conf.int=0.95)
summary(ekmg2_3)
## Call: survfit(formula = Surv(tempos, cens) ~ grupos, data = DadosG2_3,
## conf.type = "log-log", conf.int = 0.95)
##
## grupos=Grupo 2
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 8 14 1 0.9286 0.0688 0.59077 0.990
## 9 13 1 0.8571 0.0935 0.53945 0.962
## 10 12 2 0.7143 0.1207 0.40630 0.882
## 14 10 1 0.6429 0.1281 0.34331 0.833
## 15 9 2 0.5000 0.1336 0.22859 0.722
## 18 7 1 0.4286 0.1323 0.17727 0.660
## 19 6 1 0.3571 0.1281 0.13035 0.594
## 21 5 1 0.2857 0.1207 0.08834 0.524
## 22 4 2 0.1429 0.0935 0.02322 0.366
## 23 2 1 0.0714 0.0688 0.00452 0.275
## 25 1 1 0.0000 NaN NA NA
##
## grupos=Grupo 3
## time n.risk n.event survival std.err lower 95% CI upper 95% CI
## 8 13 6 0.5385 0.1383 0.24766 0.760
## 9 7 1 0.4615 0.1383 0.19161 0.696
## 10 6 3 0.2308 0.1169 0.05584 0.475
## 11 3 1 0.1538 0.1001 0.02476 0.388
## 17 2 1 0.0769 0.0739 0.00477 0.292
## 19 1 1 0.0000 NaN NA NA
Graficamente, temos os comandos:
ggsurvplot(ekmg2_3,legend.title = " ",
legend = c(0.15, 0.4),
legend.labs = c("Grupo 2", "Grupo 3"))+
xlab("Tempo (semanas)")+
ylab("Sobrevivencia estimada")
O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:
survdiff(Surv(tempos,cens)~grupos, data=DadosG2_3)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG2_3)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 2 14 14 19.87 1.73 9.32
## grupos=Grupo 3 13 13 7.13 4.83 9.32
##
## Chisq= 9.3 on 1 degrees of freedom, p= 0.002
Considerando o nível de significância \(\alpha^*=0,017\), rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são diferentes.
Para o teste Peto, basta acrescentar o
comando rho=1 nos testes,
Inicialmente, o teste é conduzido da mesma forma como
no exemplo dos dados de hepatite:
survdiff(Surv(tempos,cens)~grupos, data=Dados2,rho=1)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = Dados2,
## rho = 1)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16 6.98 9.57 0.702 1.96
## grupos=Grupo 2 15 7.16 9.07 0.402 1.06
## grupos=Grupo 3 13 9.82 5.32 3.808 7.63
##
## Chisq= 7.7 on 2 degrees of freedom, p= 0.02
Com a rejeição da hipótese nula do teste principal, três subtestes devem ser realizados para detectar a diferença entre as curvas de sobrevivência.
O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:
survdiff(Surv(tempos,cens)~grupos, data=DadosG1_2, rho=1)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_2,
## rho = 1)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16 7.58 8.39 0.0775 0.247
## grupos=Grupo 2 15 8.45 7.65 0.0851 0.247
##
## Chisq= 0.2 on 1 degrees of freedom, p= 0.6
Considerando o nível de significância \(\alpha^*=0,017\), não rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são iguais.
O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:
survdiff(Surv(tempos,cens)~grupos, data=DadosG1_3,rho=1)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG1_3,
## rho = 1)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 1 16 6.69 9.76 0.965 4.22
## grupos=Grupo 3 13 9.31 6.24 1.509 4.22
##
## Chisq= 4.2 on 1 degrees of freedom, p= 0.04
Considerando o nível de significância \(\alpha^*=0,017\), não rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são iguais.
O teste de hipóteses é feito com os mesmos comandos de anteriormente, porém alterando a base de dados:
survdiff(Surv(tempos,cens)~grupos, data=DadosG2_3, rho=1)
## Call:
## survdiff(formula = Surv(tempos, cens) ~ grupos, data = DadosG2_3,
## rho = 1)
##
## N Observed Expected (O-E)^2/E (O-E)^2/V
## grupos=Grupo 2 14 5.48 9.78 1.89 8.73
## grupos=Grupo 3 13 9.81 5.52 3.34 8.73
##
## Chisq= 8.7 on 1 degrees of freedom, p= 0.003
Considerando o nível de significância \(\alpha^*=0,017\), rejeita-se a hipótese nula do subteste. Há evidências de que as duas curvas de sobrevivência são diferentes.
1- Dados de AIDS
Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência por sexo e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos dois grupos do item a) usando dois testes diferentes. Os resultados dos dois testes fornecem a mesma conclusão? Em caso negativo, reflita sobre a diferença dos resultados.
Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência por tipo de tratamento retroviral e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos quatro grupos do item c) usando algum teste de hipótese. Há diferenças entre os diferentes tipos de tratamento? Se necessário, faça comparações múltiplas
2- Dados de Fungo em Requeijão
Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência de ambos os grupos e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos dois grupos usando dois testes diferentes. Os resultados dos dois testes fornecem a mesma conclusão? Em caso negativo, reflita sobre a razão da diferença dos resultados.
3- Dados de Câncer de Ovário
Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência de ambos os grupos e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos dois grupos usando dois testes diferentes. Os resultados dos dois testes fornecem a mesma conclusão? Em caso negativo, reflita sobre a razão da diferença dos resultados.
4- Dados de Leishmaniose
Obtenha as estimativas de Kaplan-Meier para as funções de sobrevivência de ambos os grupos e apresente-as no mesmo gráfico.
Teste a hipótese de igualdade das funções de sobrevivência dos cinco grupos utilizando algum teste de hipótese. Há diferença entre os grupos?