Bastão de Asclépio & Distribuição Normal

Bastão de Asclépio & Distribuição Normal

invisible(Sys.setlocale("LC_CTYPE", "pt_BR.UTF-8"))
invisible(Sys.setlocale("LC_ALL", "pt_BR.UTF-8"))
options(warn=-1)
suppressMessages(library(dplyr, warn.conflicts=FALSE))
suppressMessages(library(knitr, warn.conflicts=FALSE))
suppressMessages(library(randomizeR, warn.conflicts=FALSE))
suppressMessages(library(readxl, warn.conflicts=FALSE))
suppressMessages(library(sampling, warn.conflicts=FALSE))

Livro-texto

Dancey, CP & Reidey, J (2019) Estatística sem Matemática para Psicologia, 7ª ed. Porto Alegre: Penso.

“Estatística sem Matemática para Psicologia apresenta, de forma clara e direta, todos os procedimentos estatísticos dos quais você necessita, sem usar fórmulas matemáticas intimidantes, bem como oferece um guia de utilização do SPSS. Com muitos exemplos e atividades ao longo do texto, este livro permitirá que você se entenda com a estatística e não se sinta como um peixe fora d’água.”

Os exemplos do livro são resolvidos em IBM SPSS Statistics. Neste texto, utilizamos a linguagem R.

Capítulos

  1. Variáveis e delineamento de pesquisa
  2. Introdução ao SPSS (substituído por Tutorial de R)
  3. Estatística descritiva
  4. Probabilidade, amostragem e distribuições
  5. Teste de hipótese e significância estatística
  6. Análise correlacional: r de Pearson
  7. Análises de diferenças entre duas condições: o teste t
  8. Questões de significância
  9. Medidas de associação
  10. Análise de diferenças entre três ou mais condições
  11. Análise de variância com mais de uma variável independente
  12. Análise de regressão
  13. Análise de três ou mais grupos controlando os efeitos de uma covariável
  14. Introdução à análise fatorial
  15. Introdução à análise multivariada de variância (MANOVA)
  16. Estatística não paramétrica

Os cinco primeiros capítulos apresentam os conceitos básicos de estatística e de planejamento de experimentos. Os capítulos seguintes apresentam os testes estatísticos:

  • Qui-quadrado
  • t
  • ANOVA
  • Correlação
  • Regressão
  • ANCOVA
  • MANOVA
  • Testes não-paramétricos

Objetivos do livro

Com base nos objetivos do livro, ao final desta disciplina o estudante deve ser capaz de:

  • Conceituar Estatística Aplicada;
  • Discorrer sobre a existência de desorientação provocada pelos cálculos e fórmulas matemáticas;
  • Defender a utilizade da análise estatística de dados;
  • Apresentar a Estatística para pesquisadores não-quantitativos;
  • Definir valor p, intervalo de confiança, tamanho de efeito e poder do teste;
  • Relatar os resultados da análise estatística dos dados
    Regras essenciais de estilo da APA (2012)
    Cap.4: Números, metrificação e informações estatísticas.
    Cap.5: Apresentação de resultados.
  • Exibir pensamento científico autônomo e crítico;
  • Usar a linguagem de programação R para a análise de dados em Ciências da Saúde de forma amigável;
  • Incorporar e analisar dados com técnicas paulatinamente mais avançadas até atingir o Modelo Linear Geral (GLM) e de efeitos aleatórios (GLMM).

Objetivos da aula

  • Descrever os níveis de mensuração da variável
  • Implementar os níveis de mensuração em R
  • Classificar os delineamentos dos estudos

Variável

A Estatística fornece essencialmente informações sobre variáveis:

  • Observáveis ou manifestas (e.g., ANOVA) e
  • Não-observáveis ou latentes (e.g., Análise Fatorial Exploratória (EFA))

Variável é algo que pode variar, i.e., pode assumir valores ou categorias diferentes com determinadas distribuições de probabilidade.

Estamos interessados em variáveis porque queremos entender o motivo de sua variação e como elas se relacionam.

São exemplos de variáveis:

  • Sexo
  • Velocidade de datilografia
  • Velocidade máxima de um carro
  • Número de sintomas de uma doença
  • Temperatura
  • Público em um festival de rock
  • Ansiedade
  • Gols em partidas de futebol
  • Inteligência
  • Número de encontros sociais
  • Tipos de animais de estimação
  • Violência na TV
  • Ocupação
  • Cor favorita
  • Escolaridade
  • Estadiamento tumoral
  • Glicemia

Classificação de variável

Simples

Nível de mensuração

Crítica

Uma classificação das variáveis que aparece em vários textos é a seguinte:

  • Variável contínua: pode assumir qualquer valor quantitativo em um dado intervalo

  • Variável discreta: pode assumir somente valores quantitativos discretos dentro de um dado intervalo ou contagem de eventos

  • Variável categórica: os seus valores são categorias qualitativas

Esta classificação é incompleta, não discriminando bem os tipos das variáveis.

integrando as classificações

STEVENS (1975)

Variável intervalar contínua

A variável intervalar contínua tem valores representados por números reais.

Abaixo apresentamos dez estaturas, em metro, de homens adultos brasileiros:

# para sortear os mesmos numeros do exemplo
set.seed(123)
estatura <- round(rnorm(n=10, mean=1.70, sd=0.10), 2)
print(estatura)
 [1] 1.64 1.68 1.86 1.71 1.71 1.87 1.75 1.57 1.63 1.66

Esta é uma variável razão contínua porque tem zero como limite inferior.

Portanto, é correto dizer que alguém com 2 metros tem o dobro da estatura de alguém que tem 1 metro.

Variável intervalar discreta

Variáveis intervalares contínuas (números reais) podem ser arredondadas para números inteiros (e.g., anotando-se as estaturas em centímetros, números inteiros). A variável subjacente (em seu maior nível de mensuração, permanece sendo intervalar contínua, mas recebendo o tratamento de uma intervalar discreta); por exemplo:

estatura <- round(estatura*100, 0)
print(estatura)
 [1] 164 168 186 171 171 187 175 157 163 166

Variável observada vs. variável subjacente

“Um problema que surge quando lidamos com variáveis discretas e contínuas é o perigo de confundir a variável subjacente com a forma como ela é mensurada. Em teoria, uma variável pode ser contínua, mas a forma de medi-la é sempre discreta, não importa o nosso grau de precisão. Poderíamos medir a ansiedade (uma variável teoricamente contínua) utilizando um questionário (p. ex., o Inventário de Ansiedade Traço-Estado de Spielberger, Spielberger et al., 1983), cujo escore total fornece uma indicação do nível de ansiedade de uma pessoa. O escore total nesse questionário pode aumentar somente em unidades inteiras, digamos de 38 para 39 ou de 61 para 62. Assim, a forma de mensuração da ansiedade é discreta, enquanto a variável subjacente é de fato contínua.” (Dancey & Reidy, 2019, p. 4)

Variável intervalar discreta por natureza

São, legitimamente, as variáveis oriundas de contagens (e.g., número de mortes de motociclistas).

Por exemplo, em 2019, na Cidade de São Paulo, SP:

Quantos motociclistas mortos esperamos ver em 12 meses simulados?

morte.mes <- 366/12
mortes <- rpois(n=12, lambda=morte.mes)
cat("Em doze meses, com taxa de ",morte.mes," morte/mês, podemos observar:\n", sep="")
Em doze meses, com taxa de 30.5 morte/mês, podemos observar:
print(mortes)
 [1] 37 32 32 31 27 37 35 30 26 24 28 26
plot(mortes, type="p")
lines(mortes, type="l", lty=2)

Para apreciar melhor a notícia: demo_PoissonMotos.R

Variável ordinal

A estatura pode ser classificada em três grupos: baixa, intermediária, alta.

estatura.cat <- cut(estatura, 
                    breaks=c(0, 160,180, +Inf), 
                    labels=c("baixa","intermediária","alta"))
print(estatura.cat)
 [1] intermediária intermediária alta          intermediária intermediária
 [6] alta          intermediária baixa         intermediária intermediária
Levels: baixa intermediária alta
print(str(estatura.cat))
 Factor w/ 3 levels "baixa","intermediária",..: 2 2 3 2 2 3 2 1 2 2
NULL
class(estatura.cat)
[1] "factor"
levels(estatura.cat)
[1] "baixa"         "intermediária" "alta"         

Para que estatura.cat seja rigorosamente tratada como ordinal, adicione:

estatura.cat <- ordered(estatura.cat)
print(estatura.cat)
 [1] intermediária intermediária alta          intermediária intermediária
 [6] alta          intermediária baixa         intermediária intermediária
Levels: baixa < intermediária < alta
print(str(estatura.cat))
 Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
NULL
class(estatura.cat)
[1] "ordered" "factor" 
levels(estatura.cat)
[1] "baixa"         "intermediária" "alta"         

E, então, classificamos as 10 estaturas do exemplo:

somatometria <- data.frame(estatura, estatura.cat)
print(somatometria)
   estatura  estatura.cat
1       164 intermediária
2       168 intermediária
3       186          alta
4       171 intermediária
5       171 intermediária
6       187          alta
7       175 intermediária
8       157         baixa
9       163 intermediária
10      166 intermediária
print(str(somatometria))
'data.frame':   10 obs. of  2 variables:
 $ estatura    : num  164 168 186 171 171 187 175 157 163 166
 $ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
NULL
class(somatometria)
[1] "data.frame"

Variável nominal

Há cinco estados civis oficiais no Brasil fonte: https://luisaportela.jusbrasil.com.br: solteiro, casado, divorciado, viúvo, separado judicialmente.

No exemplo, vamos adicionar uma coluna ao dataframe:

somatometria$estcivil <- c("casado","solteiro","solteiro",
                           "solteiro","divorciado","solteiro",
                           "casado","casado","viúvo","solteiro")
print(str(somatometria))
'data.frame':   10 obs. of  3 variables:
 $ estatura    : num  164 168 186 171 171 187 175 157 163 166
 $ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
 $ estcivil    : chr  "casado" "solteiro" "solteiro" "solteiro" ...
NULL
somatometria$estcivil <- factor(somatometria$estcivil)
print(str(somatometria))
'data.frame':   10 obs. of  3 variables:
 $ estatura    : num  164 168 186 171 171 187 175 157 163 166
 $ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
 $ estcivil    : Factor w/ 4 levels "casado","divorciado",..: 1 3 3 3 2 3 1 1 4 3
NULL
print(somatometria)
   estatura  estatura.cat   estcivil
1       164 intermediária     casado
2       168 intermediária   solteiro
3       186          alta   solteiro
4       171 intermediária   solteiro
5       171 intermediária divorciado
6       187          alta   solteiro
7       175 intermediária     casado
8       157         baixa     casado
9       163 intermediária      viúvo
10      166 intermediária   solteiro

Nível de mensuração em R

x <- as.integer(c(5,3,3,4,1,2,5,1,1,3)) # intervalar discreta
x
 [1] 5 3 3 4 1 2 5 1 1 3
class(x)
[1] "integer"
xc <- as.numeric(x) # intervalar discreta -> intervalar continua
xc
 [1] 5 3 3 4 1 2 5 1 1 3
class(xc)
[1] "numeric"
xi <- as.integer(xc) # intervalar continua -> intervalar discreta
xi
 [1] 5 3 3 4 1 2 5 1 1 3
class(xi)
[1] "integer"
xn <- factor(x) # intervalar discreta -> nominal 
xn
 [1] 5 3 3 4 1 2 5 1 1 3
Levels: 1 2 3 4 5
class(xn)
[1] "factor"
xo <- ordered(x) # nominal -> ordinal
xo
 [1] 5 3 3 4 1 2 5 1 1 3
Levels: 1 < 2 < 3 < 4 < 5
class(xo)
[1] "ordered" "factor" 
xf <- factor(x, ordered=FALSE) # ordinal -> nominal
xf
 [1] 5 3 3 4 1 2 5 1 1 3
Levels: 1 2 3 4 5
class(xf)
[1] "factor"
xoi <- factor(xf,
              levels=c("5","4","3","2","1"),
              ordered=TRUE) # nominal -> ordinal
xoi
 [1] 5 3 3 4 1 2 5 1 1 3
Levels: 5 < 4 < 3 < 2 < 1
class(xoi)
[1] "ordered" "factor" 

Categorização de variável

Existem casos em que os pesquisadores convertem variáveis quantitativas em variáveis categóricas, como o índice de massa corpórea (IMC), dado por:

\[ \text{IMC} = {{\text{massa (kg)}} \over {\text{estatura (m)} ^2}} \]

Usada pela Associação Brasileira para Estudo da Obesidade (ABESO) e pela Organização Mundial da Saúde (WHO) para classificar:

Podemos reproduzir estas classificações em R, retomando o dataframe somatometria. Criaremos, primeiro, as colunas de massa corporal total (mct, em kg) e calcularemos o índice de massa corpórea (imc):

set.seed(570) 
somatometria$mct <- round(rnorm(n=10, mean=75, sd=20), 0)
# massa em kg, estatura em metro
somatometria$imc <- round(somatometria$mct/((somatometria$estatura/100)^2), 1)
print(str(somatometria))
'data.frame':   10 obs. of  5 variables:
 $ estatura    : num  164 168 186 171 171 187 175 157 163 166
 $ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
 $ estcivil    : Factor w/ 4 levels "casado","divorciado",..: 1 3 3 3 2 3 1 1 4 3
 $ mct         : num  77 69 103 99 113 106 60 44 77 34
 $ imc         : num  28.6 24.4 29.8 33.9 38.6 30.3 19.6 17.9 29 12.3
NULL
print(somatometria)
   estatura  estatura.cat   estcivil mct  imc
1       164 intermediária     casado  77 28.6
2       168 intermediária   solteiro  69 24.4
3       186          alta   solteiro 103 29.8
4       171 intermediária   solteiro  99 33.9
5       171 intermediária divorciado 113 38.6
6       187          alta   solteiro 106 30.3
7       175 intermediária     casado  60 19.6
8       157         baixa     casado  44 17.9
9       163 intermediária      viúvo  77 29.0
10      166 intermediária   solteiro  34 12.3

A classificação da ABESO / WHO é feita assim:

classe <- c("Subpeso",
            "Normal",
            "Sobrepeso", "Obesidade I", "Obesidade II", "Obesidade III")
pc <- c(0, 18.5, 25, 30, 35, 40, +Inf)
somatometria$imc_classe <- cut(somatometria$imc, pc, classe)
print(str(somatometria))
'data.frame':   10 obs. of  6 variables:
 $ estatura    : num  164 168 186 171 171 187 175 157 163 166
 $ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
 $ estcivil    : Factor w/ 4 levels "casado","divorciado",..: 1 3 3 3 2 3 1 1 4 3
 $ mct         : num  77 69 103 99 113 106 60 44 77 34
 $ imc         : num  28.6 24.4 29.8 33.9 38.6 30.3 19.6 17.9 29 12.3
 $ imc_classe  : Factor w/ 6 levels "Subpeso","Normal",..: 3 2 3 4 5 4 2 1 3 1
NULL
print(somatometria)
   estatura  estatura.cat   estcivil mct  imc   imc_classe
1       164 intermediária     casado  77 28.6    Sobrepeso
2       168 intermediária   solteiro  69 24.4       Normal
3       186          alta   solteiro 103 29.8    Sobrepeso
4       171 intermediária   solteiro  99 33.9  Obesidade I
5       171 intermediária divorciado 113 38.6 Obesidade II
6       187          alta   solteiro 106 30.3  Obesidade I
7       175 intermediária     casado  60 19.6       Normal
8       157         baixa     casado  44 17.9      Subpeso
9       163 intermediária      viúvo  77 29.0    Sobrepeso
10      166 intermediária   solteiro  34 12.3      Subpeso

Outra possibilidade é dicotomizar uma variável (i.e., criar duas categorias). Neste exemplo, três maneiras de dicotomizar podem ser:

  • normal e não normal que inclui magreza e obesidade,
  • normal e não normal que inclui apenas magreza,
  • normal e não normal que inclui apenas obesidade.

Adotando-se dicotomizar em normal e não normal que inclui magreza e obesidade:

classe <- c("Anormal",
            "Normal",
            "Anormal")
pc <- c(0, 18.5, 25, +Inf)
somatometria$imc_dicot <- cut(somatometria$imc, pc, classe)
print(somatometria)
   estatura  estatura.cat   estcivil mct  imc   imc_classe imc_dicot
1       164 intermediária     casado  77 28.6    Sobrepeso   Anormal
2       168 intermediária   solteiro  69 24.4       Normal    Normal
3       186          alta   solteiro 103 29.8    Sobrepeso   Anormal
4       171 intermediária   solteiro  99 33.9  Obesidade I   Anormal
5       171 intermediária divorciado 113 38.6 Obesidade II   Anormal
6       187          alta   solteiro 106 30.3  Obesidade I   Anormal
7       175 intermediária     casado  60 19.6       Normal    Normal
8       157         baixa     casado  44 17.9      Subpeso   Anormal
9       163 intermediária      viúvo  77 29.0    Sobrepeso   Anormal
10      166 intermediária   solteiro  34 12.3      Subpeso   Anormal

Por que (não) dicotomizar variável?

“Streiner (2002) ressalta o fato de que muitas decisões em psicologia, psiquiatria e medicina são binárias. Nesse tipo de decisão têm-se apenas duas escolhas, como se a pessoa apresenta ou não problema mental, se tem ou não uma determinada doença, se precisa ou não ser hospitalizada ou se deve ou não receber alta do hospital. O argumento utilizado é que, se esses profissionais precisam tomar decisões binárias, então é legítimo investigar variáveis dessa forma. Tal raciocínio é utilizado para dar suporte à prática disseminada de dicotomizar variáveis contínuas.

Streiner argumenta que não precisamos ver as decisões que os médicos tomam como binárias. Ele sugere que seria melhor pensar em uma doença mental, por exemplo, como um contínuo: quanto mais sintomas uma pessoa apresenta, mais afetada estará. Deveríamos, então, medir tais construtos de forma contínua e não dicotomizá-los. Assim, em vez de utilizar questionários para categorizar pessoas, poderíamos usá-los para obter uma medida de onde elas estão em um contínuo. Tal informação pode ser utilizada na nossa decisão para tratar pessoas, entre outras situações. É interessante notar que a última versão do Manual diagnóstico e estatístico de transtornos mentais (DSM-5) vê as doenças mentais como um continuum em vez de categorias.

[…]

Streiner ainda ressalta pesquisas que mostram que análises utilizando variáveis dicotômicas apresentam aproximadamente 67% da eficiência das que utilizam medidas contínuas ou discretas originais. Trata-se uma grande perda de sensibilidade do estudo. Isso significa que você tem apenas dois terços da probabilidade de detectar relacionamentos entre variáveis se estiver utilizando variáveis contínuas ou discretas dicotomizadas. Essa é uma séria desvantagem na realização de uma pesquisa. Além disso, a perda de poder não é o único problema que surge quando variáveis são dicotomizadas. Maxwell e Delaney (1993) mostraram que essa prática pode levar a achados espúrios na análise estatística.”

Dancey & Reidy, 2019, p. 5-6

“Consequentemente, aconselhamos não dicotomizar [sic] variáveis contínuas [sic: intervalares]”.

Dancey & Reidy, 2019, p.6

Temos duas discordâncias:

  • Dicotomizar não pode ser proibido;
  • Variáveis razão, intervalar, ordinal e nominal politômicas podem ser dicotomizadas (não é exclusivo para razão e intervalar).

A perda de eficiência estatistica de 33% devido à dicotomização é erroneamente atribuída a Streiner (2002), pois ele cita outro artigo com este resultado.

A dicotomização é justificável para efeito de comparação entre estudos.

https://www.bmj.com/content/332/7549/1080.1

“Na ausência de um ponto de corte pré-determinado, a abordagem mais comum é usar a mediana da amostra. Contudo, o uso da mediana da amostra implicará distintos pontos de corte, um para cada estudo, de forma que seus resultados não serão comparáveis e prejudicarão severamente a metanálise (https://en.wikipedia.org/wiki/Meta-analysis). […] Em vez de categorizar variáveis quantitativas, nós preferimos mantê-las quantitativas […] Como um exemplo, em uma análise de regressão para desenvolver um modelo de prognóstico para pacientes com cirrose biliar primária, um modelo que tomou bilirrubina* como uma variável quantitativa explicou 31% a mais da variabilidade dos dados do que quando seu ponto de corte adotado foi sua mediana.”

* bilirubina é um produto da degradação da hemoglobina, processada no fígado que a torna hidrossolúvel para a eliminação pelos rins.

As perdas de 31% devido à dicotomização pela mediana, ou valor próximo aos 33% (atribuído erroneamente a Steiner, 2002), vieram de determinados estudos específicos, mas têm sido tomadas como regra geral na literatura.

https://journals.sagepub.com/doi/abs/10.3102/1076998614524597

“Neste artigo, nosso propósito não é defender nem condenar dicotomização, mas simplesmente estudar sua repercussão no valor de um tamanho de efeito. […] Observamos que a dicotomização pela mediana de uma distribuição normal faz a correlação decrescer por um fator de \(\sqrt{\pi / 2 } \approx 1.25\) e aumentar o logaritmo do odds ratio por um fator de \(\sqrt{ 2 } \approx 1.41\).”

Não é proibido dicotomizar pela mediana ou por qualquer outro critério, desde que devidamente justificado.

Estudos que adotaram a dicotomização não devem ser sumariamente condenados.

Relação entre variáveis

Variáveis independente e dependente

A variável independente (VI) é uma variável observável que pode ser controlada pelo pesquisador e supostamente tem efeito sobre a VD.

A variável dependente ou de desfecho (VD) é uma variável observável que supostamente é afetada pela VI.

Exemplo:

Um pesquisador da área da saúde está interessado em medir o número de comportamentos agressivos em adolescentes com depressão maior tendo, como controle, grupo de adolescentes não depressivos.

  • VI: adolescente com e sem depressão maior
  • VD: número de comportamentos agressivos

Variável de confusão

Considere o seguinte estudo (Dancey & Reidy, 2019):

Pesquisadores interessados em saber se os cães facilitam ou não as interações sociais entre os adultos realizaram quatro estudos diferentes em que pesquisadores do sexo masculino e feminino caminharam com e sem cachorros.

Em dois estudos, o pesquisador abordou pessoas e pediu algum dinheiro, em outro estudo o pesquisador deixou cair algumas moedas para ver se as pessoas ajudariam a pegá-las e, em um estudo final, um pesquisador do sexo masculino abordou mulheres na rua e pediu-lhes números de telefone. Em cada estudo, o pesquisador realizou as tarefas com e sem cães.

Em todos os quatro estudos descobriram que os comportamentos de ajuda eram mais frequentes quando o pesquisador tinha um cachorro.

Dancey & Reidy definem:

“Uma variável de confusão é um tipo específico de variável estranha que está relacionado a ambas as variáveis principais em que estamos interessados.”

Causalidade

“A explicação científica é uma explicação por meio de leis e não necessariamente por meio de causas.”

Rosenberg, 1976, p.27-8

Uma forma de estudar causas é iniciar pela correlação entre variáveis.

A correlação é condição necessária, mas não suficiente para estabelecer causalidade.

Exemplo:

Existe correlação entre ansiedade estatística e procrastinação acadêmica?

Procrastinação:

Atraso voluntário de um curso de ação pretendido (com ou sem prazo) com expectativa de punição (estresse, perda de produtividade, culpa, vergonha etc.)

Ansiedade estatística

Ansiedade estatística é um construto multidimensional definido por seis componentes:

  • Desvalorição da estatística;
  • Dificuldade de raciocínio matemático e computacional;
  • Medo da aula e prova de estatística: vergonha, sensação de humilhação intelectual;
  • Medo de interpretar e tomar decisão estatística;
  • Medo de solicitar ajuda estatística aos colegas e professores;
  • Medo do professor de estatística.

Onwuegbuzie (2004), Steel (2007)

Classificação da relação entre duas variáveis

Quando existe correlação entre variáveis, o que a explica?

Segundo Rosenberg (1976), a relação entre duas variáveis observáveis ou manifestas pode ser classificada como simétrica, assimétrica ou recíproca alternada.

Relação assimétrica

Apenas uma das variáveis causa a outra. A análise de relações assimétricas constitui o cerne da análise epidemiológica e etiológica. As características sociodemográficas de uma pessoa podem causar comportamentos e doenças, tais como tabagismo, depressão, câncer etc. Se a relação é assimétrica, tende-se a introduzir uma terceira variável (variável de teste) na relação com o objetivo de entendê-la melhor.

Neuroticismo ou Instabilidade emocional é um dos cinco fatores da escala de personalidade Big Five (https://en.wikipedia.org/wiki/Big_Five_personality_traits).

Relação recíproca alternada

Ambas as variáveis se causam em decorrência de um processo dinâmico de causação mútua. Nesse tipo de relação as duas variáveis são ao mesmo tempo causa e efeito uma da outra.

Relação simétrica

As duas variáveis podem estar associadas, mas uma variável não causa a outra. Pode haver associação entre transpiração palmar e batimento cardíaco, mas uma não é a causa da outra. A causa comum de ambas as variáveis pode ser a ansiedade. Nesse tipo de relação, em geral, as duas variáveis são consequências de uma variável comum.

Hipótese de pesquisa

Exemplos de hipótese de pesquisa:

\(H_a:\) há associação entre ansiedade estatística e procrastinação acadêmica entre estudantes de graduação de psicologia da USP.

\(H_b:\) há efeito da exposição ao cigarro no desenvolvimento do câncer de pulmão em homens adultos brasileiros.

\(H_c:\) há agravamento da colite induzida por DNBS (ácido dinitrobenzenossulfônico) em ratos expostos ao cigarro.

\(H_d:\) o uso de bloqueador ganglionar (hexametônio) impede o agravamento da colite induzida por DNBS (ácido dinitrobenzenossulfônico) em ratos expostos ao cigarro.

Galeazzi et al. (1999): https://doi.org/10.1016/S0016-5085(99)70346-X

Delineamento e causalidade

O delineamento experimental é o delineamento de referência para estudar causalidade. Cabe ressaltar que os experimentos são oriundos das Ciências Básicas, do ambiente laboratorial, onde o pesquisador procura ter o máximo de controle sobre os fatores que interagem na determinação da causalidade.

Por questões éticas, a maior parte dos estudos em seres humanos não podem ser do tipo de delineamento experimental. Por isso, desenvolveram-se delineamentos aproximativos ao experimental: delineamentos quase-experimentais e os observacionais.

Estudos experimentais e observacionais diferem também em relação ao tempo decorrido entre supostos agentes causais e suas consequências. Por exemplo, quando o cigarro começou a se popularizar no início do século XX, a abordagem experimental não ajudou muito, pois experimentos estabelecem relações mais imediatas entre um agente causal e seu desfecho. A observação em populações do tempo decorrido entre a adoção do cigarro e o aumento da incidência de doenças desencadeou o desenvolvimento da epidemiologia moderna, correlacionando possíveis fatores de exposição ou de proteção e desfechos que podem acontecer vários anos depois. Uma das coortes mais famosas, um estudo eminentemente observacional, é a de Framinghan.

Delineamento correlacional

Conforme Hulley et al. (2015, cap.9), a maioria dos estudos observacionais (correlacionais) têm como objetivo mostrar que uma variável de exposição (VE) é causa do desfecho (VD).

vs.

Dancey & Reidy, 2019, p.12

No delineamento correlacional não há intervenção planejada do pesquisador sobre os participantes do estudo.

Exemplo:

\(H_1:\) há associação entre ansiedade estatística e procrastinação acadêmica entre estudantes de graduação de psicologia da USP.

Seis estudantes de psicologia foram avaliados por itens Likert com cinco categorias agrupados em dois questionários, para ansiedade estatística e procrastinação acadêmica. O objetivo é verificar se há correlação entre estas duas variáveis.

  Participantes Ansiedade estatística Procrastinação acadêmica
1            P1                    55                      125
2            P2                    59                      132
3            P3                    48                       94
4            P4                    60                      110
5            P5                    62                      140
6            P6                    50                       96

Delineamento experimental


No delineamento experimental há intervenção planejada e randomizada do pesquisador sobre os participantes do estudo.

Exemplo:

“O tabagismo tem um efeito complexo na inflamação intestinal, sendo protetor na colite ulcerativa, ao passo que agrava a doença de Crohn. O efeito benéfico do tabagismo tem sido atribuído à nicotina, mas os mecanismos subjacentes ao efeito adverso ainda estão sob investigação. O objetivo deste estudo foi examinar o efeito do tabagismo de cigarro na colite experimental em ratos e investigar o mecanismo subjacente.”

Galeazzi et al. (1999): https://doi.org/10.1016/S0016-5085(99)70346-X

\(H_1:\) há agravamento da colite induzida por DNBS (ácido dinitrobenzenossulfônico) em ratos expostos ao cigarro.

Ratos foram alocados aleatoriamente em dois grupos (fumo e controle). Os ratos do grupo “fumo” foram expostos à fumaça de cigarro em câmeras especiais por 17 dias e os do grupo “controle” apenas colocados nas câmeras sem a inalação do fumo. No 15o dia todos os ratos tiveram indução de colite pela administração de DNBS e sacrificados após 3 dias para avaliação da inflamação. O escore microscópico considerou perda da arquitetura da mucosa, infiltrado celular, espessura da parede muscular, presença/ausência de criptas e de células Goblet (pontuação discreta de 0 para ausência de dano a 11 para o dano máximo).

Estes dados foram fabricados; não são os do artigo.

   Animal    Grupo Escore microscopico
1       1     Fumo                   5
2       2     Fumo                   7
3       3     Fumo                   9
4       4     Fumo                   6
5       5     Fumo                  10
6       6     Fumo                   8
7       7 Controle                   3
8       8 Controle                   4
9       9 Controle                   5
10     10 Controle                   6
11     11 Controle                   4

Randomização

Esquema aleatório, em geral, de atribuição das condições experimentais às unidades experimentais do estudo (condições independentes) ou da ordem de aplicação das condições às mesmas unidades experimentais (condições dependentes).

A randomização, ao distribuir aleatoriamente os participantes entre os grupos de intervenção, tende a equilibrar em média tanto as variáveis de confusão conhecidas quanto as desconhecidas. Isso reduz o viés de confusão e aumenta a validade interna do estudo.

Na prática, randomização não garante equilíbrio perfeito em cada amostra, mas é a melhor forma de neutralizar confundidores sem precisar conhecê-los ou medi-los.

Vídeo: https://www.youtube.com/watch?v=sbOBlHcdYg0

Uma maneira de garantir alocação aleatória balanceada dos participantes em grupos do mesmo tamanho é usar a função randomizr::complete_ra.

Por exemplo, duas drogas em estudo com 10 participantes:

set.seed(123)
Grupos <- c("A", "B")
Participantes <- 10
randomizacao <- randomizr::complete_ra(N=Participantes, 
                                       prob_each=c(0.5, 0.5), 
                                       conditions=Grupos)
print(table(randomizacao))
randomizacao
A B 
5 5 
df <- data.frame(1:Participantes, randomizacao)
names(df) <- c("Participante", "Droga")
print(df)
   Participante Droga
1             1     A
2             2     B
3             3     A
4             4     B
5             5     B
6             6     B
7             7     A
8             8     B
9             9     A
10           10     A

Este pacote tem várias outras funções, como randomizr::simple_ra que não obriga o balanceamento.

É comum existirem resumos de vários pacotes do R, conhecidas como cheat sheets, para ajudar a lembrar das sintaxes das funções. Para o pacote randomizr achamos https://ugoproto.github.io/ugo_r_doc/pdf/randomizr.pdf:

Além dos estudos que são feitos em laboratório com animais, também os ensaios clínicos randomizados (RCT) com humanos são delineamentos experimentais.

Para estes estudos, existe outro pacote do R, randomizeR, descrito em Ushner (2018).

Dempster & Hanna (2016)

Nesta figura, oito participantes são alocados aleatoriamente de maneira balanceada a duas condições independentes (e.g., grupos controle e tratamento). Em seguida, os participantes são submetidos à avaliação da variável de desfecho antes a após uma intervenção planejada pelo pesquisador. A randomização controla (em média) o efeito das variáveis de confusão conhecidas e desconhecidas pelo pesquisador. O delineamento pré-pós controla os efeitos idiossincráticos dos participantes criando uma linha de base para teste do efeito da intervenção na variável de desfecho nos grupos controle e tratamento.

Delineamento quase-experimental


No delineamento quase-experimental há intervenção planejada do pesquisador sobre os participantes do estudo, mas não há randomização. Isto ocorre porque o participante é auto-alocado em um grupo devido às suas características (e.g., sexo, idade, profissão, naturalidade etc.)

Exemplo:

Retomando o exemplo da somatometria de homens adultos, um pesquisador pretende estudar a influência de dois tratamentos sobre a glicemia de jejum em pacientes internados em dois hospitais de São Paulo. O primeiro hospital continuará com o tratamento tradicional (grupo controle), e um novo tratamento será oferecido no segundo hospital.

\(H_1:\) o novo tratamento é mais eficiente em reduzir glicemia do que o tratamento tradicional.

Portanto, sem ser possível buscar participantes na população geral, os que estão disponíveis para o estudo serão autoalocados em dois grupos, provenientes de cada um dos hospitais, impedindo a randomização.

Os dois grupos (condições independentes) serão formados:

Somatometria
estatura estatura.cat estcivil mct imc imc_classe imc_dicot hospital
164 intermediária casado 77 28.6 Sobrepeso Anormal A
168 intermediária solteiro 69 24.4 Normal Normal A
186 alta solteiro 103 29.8 Sobrepeso Anormal A
171 intermediária solteiro 99 33.9 Obesidade I Anormal A
171 intermediária divorciado 113 38.6 Obesidade II Anormal A
187 alta solteiro 106 30.3 Obesidade I Anormal B
175 intermediária casado 60 19.6 Normal Normal B
157 baixa casado 44 17.9 Subpeso Anormal B
163 intermediária viúvo 77 29.0 Sobrepeso Anormal B
166 intermediária solteiro 34 12.3 Subpeso Anormal B

Validade interna

Devemos atribuir com segurança os resultados da VD do estudo aos efeitos das VI:

  • As VI são as únicas causas dos resultados da VD.
  • Fala-se em variáveis de confusão quando os efeitos de duas VI estão entrelaçados e não se consegue determinar qual delas é responsável pelo efeito observado na VD.

Há dois tipos de controle que contribuem para a validade interna por meio da equalização dos grupos controle e experimental (Cozby, 2003 e Townsend, 1953).

Controle experimental direto

  • Método da remoção: as variáveis de confusão devem ser removidas do experimento.
Exemplo: sabe-se que luz e ruído influenciam a VD sob investigação, então o experimentador deve remover essas condições por meio do uso de um recinto à prova de som e de luz.
  • Método da constância das condições: os efeitos de certas variáveis de confusão não podem ser completamente ou ainda parcialmente eliminadas.
Exemplo: a idade é uma variável de confusão que afeta o comportamento da maioria das VD. Evidentemente todos os participantes têm uma idade e, por isso, a eliminação dessa variável é impossível. Controlar a variável idade significa mantê-la constante para todos os participantes do experimento. Dessa maneira, se todos os participantes têm a mesma idade, o efeito da idade é o mesmo nos grupos controle e experimental.

Controle experimental indireto

  • Método do pareamento de grupos (matched-group): as médias (ou outras medidas de tendência central ou variabilidade) das variáveis de confusão (e.g., QI) entre os grupos controle e experimental são iguais.
  • Randomização (método da constância das condições): designação das unidades experimentais/observacionais às condições. Quando o experimentador conclui que não é possível usar o método do pareamento de grupos, ou porque não são conhecidas as variáveis de confusão mais importantes para equalizá-los ou porque não se pode medi-los, então sugere-se que se faça uso do processo de randomização para equalizá-los ao formar os grupos controle e experimental. Esse método, no entanto, também demanda uma grande quantidade de participantes, pois o experimentador deve atribuir aleatoriamente os participantes aos grupos controle e experimental, sendo que quanto maior o número de participantes, mais equalizados são os grupos.

Causalidade em delineamento correlacional

Hulley et al., 2006, p. 128


Exemplo:

um estudo observacional mostra que tomar café (TC) está associado ao infarto do miocárdio (IM), com razão de riscos (RR) igual a 2, i.e., a probabilidade de ter IM dobra devido a TC relativamente a não-TC. Além da relação de causa-efeito (e.g., relação existente na população tal que TC causa IM), há outras quatro possíveis explicações alternativas para a relação assimétrica entre duas variáveis (VI causa VD).

[1] Acaso (erro aleatório) e [2] viés (erro sistemático)

Produzem efeito de TC em IM na amostra, sendo que ele não existe na população.

[3] Efeito-causa

Produz o efeito entre TC e IM na amostra que também existe na população, mas não é causal na direção de interesse (IM causa TC).

[4] Confusão

A terceira variável Tabagismo é a causa real do IM, sendo que TC é uma variável espectadora dessa causação. Para estabelecer que a relação causa-efeito é a explicação mais provável é necessário descartar as outras quatro explicações.

Relação espúria ou interpretação espúria?

Conforme Rosenberg (1976), estritamente falando, não existem relações espúrias; existem interpretações espúrias.

É, contudo, habitual usar a expressão “relação espúria” para aludir ao caso em que não há ligação significativa ou inerente entre as duas variáveis.

A relação se deve, apenas, ao fato de cada uma das variáveis estar acidentalmente associada à alguma outra variável.

Trata-se de uma relação que, à primeira vista, parece assimétrica, mas que, uma análise mais profunda, revela-se simétrica (e.g., dois indicadores do mesmo conceito, duas consequências da mesma causa, dois elementos de uma unidade funcional, duas manifestações de um complexo ou dois fatores fortuitamente associados).

Exemplos:

  1. Na Suécia existe a relação entre o número de cegonhas numa área e o número de crianças nascidas na mesma área. A maioria das cegonhas encontram-se em área rurais da Suécia e o índice de nascimento, nessas áreas, é superior ao das áreas urbanas.

  2. Se existe uma relação positiva entre o número de bombeiros que atendem a um incêndio e a extensão do dano produzido, não se pode concluir que os bombeiros causem o dano. O motivo da relação entre o número de bombeiros e a extensão dos danos é a extensão do incêndio: grandes incêndios exigem maior número de bombeiros e também causa maiores danos.

Validade externa

Dempster & Hanna, 2016

Validade externa é uma maneira de garantir a generalização das relações encontradas em amostra para a população. Para tanto, a amostra precisa ser representativa da população de onde foi obtida.

Vídeo: Types of Sampling Methods

Amostragem sem reposição de dataframe

Em R, há algumas alternativas para obter amostras aleatórias sem reposição de dataframe.

sample

Existem dataframes com dados disponíveis para uso no R. Aqui usaremos iris que contém dados sobre medidas em flores. Digite ?iris na Console se quiser saber mais.

O conteúdo deste dataframe começa com

data(iris)
str(iris)
'data.frame':   150 obs. of  5 variables:
 $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
 $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
 $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
 $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
 $ Species     : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
print(summary(iris))
  Sepal.Length    Sepal.Width     Petal.Length    Petal.Width   
 Min.   :4.300   Min.   :2.000   Min.   :1.000   Min.   :0.100  
 1st Qu.:5.100   1st Qu.:2.800   1st Qu.:1.600   1st Qu.:0.300  
 Median :5.800   Median :3.000   Median :4.350   Median :1.300  
 Mean   :5.843   Mean   :3.057   Mean   :3.758   Mean   :1.199  
 3rd Qu.:6.400   3rd Qu.:3.300   3rd Qu.:5.100   3rd Qu.:1.800  
 Max.   :7.900   Max.   :4.400   Max.   :6.900   Max.   :2.500  
       Species  
 setosa    :50  
 versicolor:50  
 virginica :50  
                
                
                
print(head(iris))
  Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1          5.1         3.5          1.4         0.2  setosa
2          4.9         3.0          1.4         0.2  setosa
3          4.7         3.2          1.3         0.2  setosa
4          4.6         3.1          1.5         0.2  setosa
5          5.0         3.6          1.4         0.2  setosa
6          5.4         3.9          1.7         0.4  setosa
print(tail(iris))
    Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
145          6.7         3.3          5.7         2.5 virginica
146          6.7         3.0          5.2         2.3 virginica
147          6.3         2.5          5.0         1.9 virginica
148          6.5         3.0          5.2         2.0 virginica
149          6.2         3.4          5.4         2.3 virginica
150          5.9         3.0          5.1         1.8 virginica

O número total de linhas do dataframe iris é

print(nrow(iris))
[1] 150

Para obter uma amostra de 5 linhas aleatoriamente escolhidas, sem reposição, experimente:

set.seed(123)
index <- sample(x = 1:nrow(iris), 
                size = 5,
                replace = FALSE)
print(iris[index,])
    Sepal.Length Sepal.Width Petal.Length Petal.Width   Species
14           4.3         3.0          1.1         0.1    setosa
50           5.0         3.3          1.4         0.2    setosa
118          7.7         3.8          6.7         2.2 virginica
43           4.4         3.2          1.3         0.2    setosa
150          5.9         3.0          5.1         1.8 virginica

Neste exemplo, as linhas 14, 50, 118, 43 e 150 foram selecionadas para a amostra.

sampling::srswor

Este é outro pacote do R, dedicado às técnicas de amostragem.

Por exemplo, a amostragem aleatória simples sem reposição com este pacote é obtida com:

set.seed(456)
index <- sampling::srswor(n=5, 
                          N=nrow(iris))
print(iris[which(index!=0),])
    Sepal.Length Sepal.Width Petal.Length Petal.Width    Species
25           4.8         3.4          1.9         0.2     setosa
27           5.0         3.4          1.6         0.4     setosa
38           4.9         3.6          1.4         0.1     setosa
79           6.0         2.9          4.5         1.5 versicolor
122          5.6         2.8          4.9         2.0  virginica

sendo que os dois parâmetros são n para o tamanho da amostra e N para o tamanho do arquivo de onde a amostra será extraída.

Delineamentos entre participantes e intraparticipantes

Dempster & Hanna (2016)

Dancey & Reidy, 2019, cap. 1

Dempster & Hanna (2016)

Dancey & Reidy, 2019, cap. 1

Dempster & Hanna (2016)

Consulte Alferes (1997) e o pacote agricolae para estudar e aplicar contrabalanceamento.

VD e fator de exposição

Pharoah, 2016


Porta (2014)
Exposição
A variável cujo efeito causal deve ser estimado. Exemplos de exposições avaliadas por estudos epidemiológicos são fatores ambientais e de estilo de vida, condições socioeconômicas e de trabalho, tratamentos médicos e características genéticas. As exposições podem ser prejudiciais ou benéficas - ou mesmo ambas (por exemplo, se uma doença imunizável estiver circulando, a exposição a agentes imunizantes ajuda a maioria dos receptores, mas pode prejudicar aqueles com reações adversas à vacina).
Proximidade e/ou contato com uma fonte de um agente de doença de tal maneira que a transmissão efetiva do agente ou efeitos prejudiciais do agente possam ocorrer.
A quantidade de um fator a que um grupo ou indivíduo foi exposto; às vezes contrastada com a dose, a quantidade que entra ou interage com o organismo.
O processo pelo qual um agente entra em contato com uma pessoa ou animal de tal forma que a pessoa ou animal pode desenvolver o resultado relevante, como uma doença.

Desfecho
Todos os resultados possíveis que podem decorrer da exposição a um fator causal ou de intervenções preventivas ou terapêuticas.
Todas as mudanças identificadas no estado de saúde decorrentes do manejo de um problema de saúde.

Ward (2012)
Um aspecto importante da epidemiologia é identificar, descrever e quantificar os fatores que aumentam ou diminuem o risco de doença ou morte. Se descobrirmos que um determinado fator ou exposição, por exemplo, fumar ou tomar um medicamento está associado ao risco de um determinado resultado de saúde, podemos então avaliar se a associação é provável ou não causal e postular mecanismos causais. Mesmo na ausência de mecanismos causais estabelecidos, a evidência de associação pode orientar as políticas e ações de saúde pública, e a prática clínica, para reduzir o risco de doença ou morte e proteger, restaurar e promover a saúde.

Exposição
Descreve algo que pode afetar um resultado. Na análise estatística, as exposições são variáveis explicativas ou independentes. Pode referir-se a um perigo ambiental ou agente infeccioso, mas também é usado em epidemiologia para descrever outros fatores, tais como um fator genético, e. tipo de antígeno leucocitário humano (HLA) ou característica demográfica, como etnia. A exposição de interesse primário é aquela que está incluída na hipótese sob investigação, e se a hipótese é que a aflatoxina causa câncer de fígado, então a aflatoxina é a exposição primária de interesse. Em contraste, se a hipótese é que a capacidade do indivíduo de metabolizar aflatoxina determina seu risco de câncer de fígado, então o fenótipo ou genótipo da enzima metabólica é a exposição.

Desfecho
É usado em sentido amplo; pode ser doença, morte ou recuperação. Alguns estudos, principalmente coortes, podem observar vários resultados em relação a uma ou mais exposições. Na análise estatística, os resultados são respostas ou variáveis dependentes.

Fatores de risco e proteção

  • Fator de proteção [estudo etiológico de eficácia]

Fator de proteção [estudo etiológico de eficácia] é um comportamento claramente definido ou constitucional (por exemplo, genético), psicológico, ambiental ou outra característica que está associado a uma probabilidade reduzida de que uma doença ou distúrbio específico se desenvolva em um indivíduo, que reduz a gravidade de um patológico existente doença ou que atenua os efeitos do estresse em geral. Por exemplo, praticar exercícios regularmente pode servir como um fator de proteção ao diminuir a probabilidade ou gravidade de doenças coronárias, hipertensão e depressão. Da mesma forma, redes sociais de apoio e habilidades positivas de enfrentamento são exemplos de fatores de proteção que reduzem os efeitos de eventos de vida estressantes e melhoram a saúde mental.

  • Fator de risco [estudo etiológico de maleficência]

Fator de risco [estudo etiológico de maleficência] é um comportamento claramente definido ou característica constitucional (por exemplo, genética), psicológica, ambiental ou outra que está associada a uma maior possibilidade ou probabilidade de que uma doença ou distúrbio se desenvolva subsequentemente em um indivíduo.

Dicionário da APA: https://dictionary.apa.org/protective-factor

Fatores de risco fixo e modificável

Fator de risco modificável (ou modifiable risk factor) é qualquer característica, condição ou comportamento que aumenta o risco de uma doença ou agravo, mas que pode ser alterado por intervenção — clínica, comportamental ou ambiental.

Exemplos clássicos:

  • Tabagismo
  • Sedentarismo
  • Hipertensão arterial
  • Dislipidemia
  • Obesidade
  • Alimentação inadequada
  • Consumo excessivo de álcool
  • Estresse crônico

São contrapostos aos fatores de risco não modificáveis ou fixos, como idade, sexo biológico e histórico familiar.

Em epidemiologia, distinguir esses tipos é essencial para planejar ações preventivas e políticas públicas de saúde.

Exemplos

Ward (2012)

Delineamento e força da evidência [sic] em Medicina Baseada em Evidências

A força da evidência no quadro anterior não está relacionado com o nível de qualidade do estudo, pois, por exemplo, o estudo de desfecho câncer de pulmão em humanos necessita de período de observação longo (décadas). Desfecho com latência curta pode ser estudo por meio de delineamento experimental, mas se a latência é longa, é necessário o delineamento observacional (e.g., coorte).

Quatro critérios para classificar delineamento

  1. Unidade observacional: individuada ou agregada (espacial e/ou temporal);

  2. Temporalidade do estudo: transversal/cross-sectional (delineamento entre participantes) ou longitudinal (com ou sem medidas repetidas);

  3. Participação do pesquisador: não-intervencional ou intervencional, sendo que a intervenção deve ser planejada pelo pesquisador;

  4. Seleção: em estudo observacional, a seleção das unidades observacionais é realizada por exposição ou desfecho; em estudo experimental, há o critério de atribuição de condição experimental à unidade observacional (e.g., randomização).

Estudo intervencional × observacional

Estudos intervencionais em humanos envolvem maiores desafios éticos, financeiros e logísticos. A principal diretriz ética é o princípio da não maleficência.

Os delineamentos intervencionais em epidemiologia incluem:

  • Experimentos laboratoriais
  • Ensaios clínicos randomizados (ECR)
  • Intervenções comunitárias randomizadas

O experimento laboratorial em humanos visa avaliar efeitos terapêuticos ou preventivos, com intervenção controlada e de curta duração.

Quando estudos intervencionais são inviáveis — por razões éticas, financeiras ou logísticas — recorremos a estudos observacionais como alternativa metodológica.

Esses delineamentos permitem investigar associações entre exposições e desfechos sem manipular variáveis, respeitando o princípio da não intervenção. São úteis especialmente em:

  • Doenças raras ou de longa latência
  • Exposições potencialmente nocivas (e.g.: tabagismo, radiação)
  • Situações em que a randomização seria antiética

Apesar de mais suscetíveis a viés de confusão, os estudos observacionais — coorte, caso-controle e transversal — são fundamentais para gerar hipóteses, estimar riscos e embasar políticas públicas.

Temporalidade do estudo

Estudo transversal (cross-sectional)

Um estudo transversal mede a prevalência de desfechos de saúde ou determinantes de saúde, ou ambos, em uma população em um determinado momento ou durante um curto período.

Essas informações podem ser usadas para explorar a etiologia.

E.g.: A relação entre a catarata e o status das vitaminas foi examinada em surveys transversais.

Coggon et al. Chapter 8. Case-control and cross-sectional studies

https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/

Estudo longitudinal

Em um estudo longitudinal, os indivíduos são acompanhados ao longo do tempo com monitoramento contínuo ou repetido de fatores de risco ou resultados de saúde, ou ambos. Essas investigações variam enormemente em tamanho e complexidade.

Em um extremo, uma grande população pode ser estudada ao longo de décadas.

Por exemplo, o estudo longitudinal do Office of Population Censuses and Surveys (OPCS) segue prospectivamente uma amostra de 1% da população britânica que foi inicialmente identificada no censo de 1971.

Desfechos como mortalidade e incidência de câncer foram relacionados à situação de emprego, moradia e outras variáveis medidas em censos sucessivos.

No outro extremo, alguns estudos longitudinais acompanham grupos relativamente pequenos por alguns dias ou semanas.

Assim, os bombeiros expostos de forma aguda a vapores nocivos podem ser monitorados para identificar quaisquer efeitos imediatos.

Nem todos os estudos longitudinais envolvem medidas repetidas da variável de desfecho. Um estudo longitudinal envolve o acompanhamento de um grupo de indivíduos ao longo do tempo para observar mudanças, desenvolvimentos ou eventos que ocorrem ao longo de suas vidas. Isso pode incluir medidas repetidas da variável de desfecho, mas nem sempre é o caso.

Um estudo de coorte é uma forma específica de estudo longitudinal em que os participantes são selecionados com base em sua exposição a um determinado fator e são acompanhados ao longo do tempo para observar o desenvolvimento de desfechos de interesse. Isso geralmente envolve medidas repetidas da variável de desfecho para avaliar como a exposição afeta o desfecho ao longo do tempo.

Portanto, embora muitos estudos longitudinais incluam medidas repetidas da variável de desfecho, nem todos são necessariamente delineados dessa maneira. Alguns estudos longitudinais podem se concentrar apenas na observação e acompanhamento ao longo do tempo, sem necessariamente envolver medidas repetidas da variável de desfecho.

Estudo de coorte é um tipo de estudo longitudinal. Os estudos longitudinais são projetados para acompanhar um grupo de indivíduos ao longo do tempo para observar mudanças, desenvolvimentos ou eventos que ocorrem ao longo de suas vidas.

No contexto de um estudo de coorte, os participantes são selecionados com base em sua exposição a um determinado fator e, em seguida, são acompanhados ao longo do tempo para observar o desenvolvimento de desfechos de interesse. Isso permite aos pesquisadores analisar a relação entre a exposição e os desfechos ao longo do tempo, o que é particularmente útil para identificar relações causais.

Em resumo, um estudo de coorte é uma forma específica de estudo longitudinal, onde os participantes são agrupados com base em sua exposição e acompanhados para avaliar os efeitos dessa exposição ao longo do tempo.

Coggon et al. Chapter 7. Longitudinal studies

Série temporal

  • Unidade observacional: individuada ou agregada

  • Participação do pesquisador: não intervencional ou intervencional

  • Temporalidade: longitudinal com medidas periódicas

“A essência do delineamento de série temporal é a presença de um processo periódico de medida em algum grupo ou indivíduo e a introdução de uma mudança experimental nessa série temporal de medidas, cujos resultados são indicados por uma descontinuidade nas medidas registradas na série temporal.”

Campbell & Stanley, 1969, p. 67

Os delineamentos de séries temporais, em que uma mesma área ou população (unidade observacional agregada), é estudada em momentos distintos e periódicos de tempo (e.g., anualmente), são classificados como um subtipo de estudo ecológico (ecológico temporal), sendo que cada unidade de tempo consiste numa unidade ecológica completa.

O estudo com delineamento ecológico tem a capacidade de gerar hipótese temporal.

O estudo ecológico temporal consiste em analisar o tabagismo numa localidade em épocas distintas, e.g., consumo de cigarro per capita e taxa de mortalidade por câncer de pulmão nos anos 1970 e nos anos 2000 no estado de São Paulo. Se for verificado, por exemplo, que em 2000 morre mais gente que consumiu mais, pode-se levantar a hipótese de que o câncer está associado ao tabagismo. É uma hipótese, porque o estudo não foi realizado no nível individual.

Delineamentos clássicos

Ensaio clínico ou Ensaio controlado randomizado (RCT)

O ensaio clínico ou ensaio controlado randomizado (RCT) é um delineamento experimental em condições controladas no qual os participantes individuais são alocados aleatoriamente aos tratamentos controle e de interesse do pesquisador e uma intervenção é realizada nos dois tratamentos com avaliação da variável de desfecho pré e pós-intervenção.

O objetivo desse delineamento é gerar dois grupos equivalentes com o intuito de testar o efeito específico do tratamento de interesse relativamente ao controle.

O ensaio clínico comunitário é ensaio randomizado no qual a unidade observacional é um agregado de participantes individuais.

https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/

Ensaio clínico comunitário

A maioria dos estudos experimentais aloca e compara tratamentos entre sujeitos individuais, mas também é possível realizar intervenções experimentais no nível das populações. Já citamos um projeto de prevenção de doenças coronárias em que as unidades de estudo eram a força de trabalho de diferentes fábricas.

Como em estudos de indivíduos, as intervenções em populações podem ser alocadas aleatoriamente.

No entanto, se o número de populações em comparação for pequeno, a randomização pode não ter muito valor.

Em vez disso, pode ser melhor atribuir intervenções de uma forma deliberadamente planejada para garantir a máxima comparabilidade entre os diferentes grupos de intervenção.

O controle da confusão residual pode ser fortalecido pela comparação das populações de estudo e controle antes e depois da introdução da intervenção.

Coggon et al. Chapter 9. Experimental studies

Inquérito (survey)

O inquérito/ levantamento (survey) é o delineamento no qual cada indivíduo é avaliado simultaneamente para o fator de exposição e o desfecho (doença) em determinado momento. O inquérito pode ser comparado ou de determinação de prevalência.

No levantamento comparado, pelo menos dois estratos da mesma população têm o mesmo desfecho avaliado, e.g., mil indivíduos entre 18 e 35 anos foram selecionados aleatoriamente da população do município de São Paulo em 2017 e, em suas residências, responderam a um questionário sobre hábitos alimentares e tiveram a pressão arterial medida; 850 participaram efetivamente da pesquisa e foram classificados como consumidores de excesso de sal ou não e em hipertensos e não.

No inquérito de determinação de prevalência, o objetivo é estimar a porcentagem de casos novos e antigos da doença numa população numa época, e.g., identificar a prevalência de soropositividade para as hepatite B e C em gestantes atendidas em uma maternidade pública do município de Catalão-GO no período de 2005 a 2009, sendo que a prevalência de VHB foi de 5,64% e a de VHC, 0,098%, predominantemente em gestantes jovens, com idade entre 20 e 30 anos, solteiras e primigestas (Fernandes et al., 2014).

O fato de exposição e doença serem avaliados simultaneamente apresenta as seguintes dificuldades:

  1. impossibilidade de determinar ordem de causação entre exposição e doença,
  2. dificuldade de separar casos novos de casos já presentes e
  3. desconhecimento da ação dos fatores de exposição antes do período de análise.

Os fatores de exposição podem variar ou não no tempo para o indivíduo. Alguns fatores de exposição fixos são o tipo sanguíneo, sexo, sistema antígeno leucocitário humano (HLA) etc. Outros fatores de exposição podem ser mutáveis, tais como etilismo, tabagismo, hábito alimentar, atividade física, estado civil etc.

O inquérito consiste numa boa fonte de hipóteses com maior força de evidência que o ecológico, mas persiste a dificuldade de determinação do liame causal entre a exposição e a doença.

Os inquéritos oferecem informações úteis ao chamar atenção para características ligadas com a frequência de uma determinada doença na comunidade ou em determinado serviço assistencial. Estes estudos, portanto, podem influenciar o raciocínio clínico e a tomada de decisões na prática médica.

Ao escolher o delineamento do estudo epidemiológico, deve ser considerado que os inquéritos, habitualmente, exigem menos recursos financeiros e podem ser realizados mais rapidamente do que os estudos de caso-controle ou coorte.

Coorte

A coorte consiste numa população sadia definida por características geográficas e/ou temporais comuns na qual são observados, nas subpopulações de expostos e não-expostos aos fatores de risco, o surgimento de doenças de interesse mediante exames repetidos por um determinado período de tempo do passado (retrospectivo) ou futuro (prospectivo).

O delineamento de coorte pode ser comparado ou de análise de sobrevivência.

Coorte comparada: dois mil residentes de um bairro do município de São Paulo foram previamente classificados como diabéticos e não-diabéticos, e as taxas de mortalidade dos dois grupos foram acompanhadas por cinco anos.

Coorte de análise de sobrevivência: duzentos casos de febre amarela identificados em Jundiaí foram seguidos ao longo de cinquenta anos para análise de sobrevivência.

Os estudos de coorte podem ser usados para estimar a incidência, i.e., a quantidade de casos novos de uma doença registrados num período de tempo. O delineamento de estudo de coorte é um método de pesquisa utilizado na epidemiologia e em outras áreas da ciência para investigar relações de causa e efeito entre fatores de exposição e desfechos de interesse em uma população ao longo do tempo.

Nesse tipo de estudo, os participantes são selecionados com base na sua exposição a um determinado fator, como um tratamento médico, um comportamento de risco ou uma condição de saúde específica. Existem dois principais tipos de coortes:

  1. Coorte Prospectiva: Nesse tipo de coorte, os participantes são identificados no início do estudo e são acompanhados ao longo do tempo para observar o desenvolvimento dos desfechos de interesse. A exposição dos participantes é medida antes do surgimento do desfecho. Esse tipo de estudo é útil para investigar a relação temporal entre a exposição e o desfecho.

  2. Coorte Retrospectiva (ou Histórica): Nesse caso, os pesquisadores selecionam uma população com base na exposição ao fator de interesse e então analisam dados passados para identificar a ocorrência de desfechos. A exposição já ocorreu antes do início do estudo e os desfechos já podem ter ocorrido no momento em que a pesquisa começa.

O principal objetivo de um estudo de coorte é avaliar se a exposição a um fator está associada ao desenvolvimento de um desfecho específico. Isso permite aos pesquisadores avaliar a relação entre a exposição e o desfecho ao longo do tempo, controlando possíveis fatores de confusão (outros fatores que poderiam influenciar o desfecho) e calcular medidas de associação, como risco relativo ou taxa de incidência.

O delineamento de estudo de coorte é uma ferramenta poderosa para a investigação de relações causais em situações em que experimentos controlados não são éticos ou viáveis. No entanto, também apresenta desafios, como o acompanhamento adequado dos participantes ao longo do tempo e o controle de fatores de confusão que podem afetar os resultados.

https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/

Rivas-Ruiz et al., 2012

Coortes com dados públicos acessíveis
Coorte País População-alvo Ondas Variáveis principais Acesso
UK Biobank Reino Unido Adultos (40–69 anos) 2006–presente Genômica, imagens, exames clínicos Proposta online
NHANES EUA População geral Contínuo desde 1999 Nutrição, exames laboratoriais, saúde Livre
Framingham Heart Study EUA Adultos e descendentes 1948–presente Fatores CV, mortalidade, ECG Proposta via site
HRS EUA Idosos (50+) 1992–presente Trabalho, saúde, cognição, renda Cadastro online
Add Health EUA Adolescentes (seguimento) 1994–presente Comportamento, saúde, escolaridade Registro obrigatório
CHARLS China Idosos (45+) 2011–presente Saúde, cognição, família, renda Livre (registro)
ELSA-Brasil Brasil Servidores públicos (35–74) 2008–presente CV, diabetes, saúde mental Comitê de Acesso
Coorte de Pelotas Brasil Recém-nascidos e mães 1982, 1993, 2004, 2015 Desenvolvimento infantil, escolaridade Solicitação à equipe
SABE Brasil Idosos (60+) 2000, 2006, 2010, 2015 Funcionalidade, saúde, mortalidade Solicitação por e-mail
PNS (IBGE) Brasil População geral 2013, 2019 Autopercepção, doenças, uso de serviços Microdados IBGE

Caso-controle

O delineamento de caso-controle é um delineamento comparado no qual os indivíduos são previamente classificados nos grupos comparáveis de doentes (casos) e sadios (controles), sendo que em cada grupo são investigadas as durações e intensidades da exposição, e.g., selecionar 50 casos de câncer de pulmão (casos) e 50 casos sem câncer de pulmão (controles) e questionar sobre a duração (anos) e intensidade (cigarros/dia) do tabagismo (exposição).

Esse tipo de delineamento facilita o estudo de doenças raras.

O estudo de caso-controle não é equivalente ao estudo de coorte retrospectiva e, portanto, não pode ser usado para determinar a incidência da doença.

https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/

Estudo ecológico

O estudo ecológico espacial consiste em analisar diferentes localidades na mesma época, e.g., consumo de bebida alcoólica per capita e taxa de mortalidade por câncer hepático em 2015 nos estados de São Paulo e Paraná.

O estudo com delineamento ecológico tem a capacidade de gerar hipótese temporal ou espacial.

O estudo ecológico temporal consiste em analisar o tabagismo numa localidade em épocas distintas, e.g., consumo de cigarro per capita e taxa de mortalidade por câncer de pulmão nos anos 1970 e nos anos 2000 no estado de São Paulo. Se for verificado, por exemplo, que em 2000 morre mais gente que consumiu mais, pode-se levantar a hipótese de que o câncer está associado ao tabagismo. É uma hipótese, porque o estudo não foi realizado no nível individual.

A falácia ecológica consiste em afirmar que a associação entre uma exposição e um desfecho em nível populacional acarreta sua presença no nível individual.

Estudos com delineamentos ecológicos ajudam a identificar fatores de exposição que merecem pesquisa mais detalhada por meio de estudos individuados.

E.g., a verificação de uma relação entre venda de cigarros per capita e mortalidade de doença cardiovascular (DCV) em estudos ecológicos pode motivar o planejamento de estudos caso-controle e coorte que possam mostrar de forma bem mais convincente que o tabagismo é um dos fatores determinantes de DCV, particularmente doença coronariana e acidente vascular cerebral.

Os delineamentos de séries temporais, em que uma mesma área ou população (unidade observacional agregada), é estudada em momentos distintos e periódicos de tempo (e.g., anualmente), são classificados como um subtipo de estudo ecológico (ecológico temporal), sendo que cada unidade de tempo consiste numa unidade ecológica completa.

Exemplos:

  • Uso de cinto de segurança

https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/

  • Mortes por doença coronária × cigarro

Friedman, 1967

  • Suicídio e proporção de protestantes

Morgenstern, 1995

Delineamento e teste estatístico

Existe uma conexão natural entre o delineamento do estudo e os métodos estatísticos mais adequados para testar as hipóteses de pesquisa. O delineamento restringe os testes que podem ser utilizados. Reversamente, escolher um método estatístico pode definir quais os tipos de variáveis e como serão medidas, o que impõe o delineamento.

Quanto mais experimental for o delineamento (controles experimentais), mais simples pode ser o método estatístico. Em delineamentos mais observacionais, os controles terão que ser estatísticos, exigindo métodos mais elaborados, necessitando de mais variáveis de confusão conhecidas.

Dancey & Reidy, 2019, p. 17

Os testes estatísticos elencados nesta tabela (testes paramétricos z, t, ANOVA unifatorial, ANCOVA pré-pós, de correlação de Pearson e testes não-paramétricos de correlação de Spearman, U de Mann-Whitney, W de Wilcoxon, H de Kruskal-Wallis, Q de Friedman) verificam a relação direta entre VI e VD, sem controles estatísticos.

Discordamos, portanto, da tabela deste livro. Embora não seja proibido usar os testes simples em delineamentos mais complexos, o pesquisador corre o risco de detectar efeitos devidos às variáveis de confusão não controladas e interpretar os resultados obtidos como se o efeito viesse do que supõe ser a VI ligada à sua hipótese de pesquisa.

Não recomendamos os testes não-paramétricos mesmo para delineamento experimental.

Modelo Linear Geral (GLM: https://en.wikipedia.org/wiki/General_linear_model) é mais adequado para analisar o efeito da VI sobre a VD com o uso de variáveis de confusão diretamente, sendo, portanto, mais adequado para delineamento correlacional ou quase-experimental.

Unidades observacional e experimental

Unidade observacional (UO) é o elemento no qual se observam ou medem variáveis, sem intervenção do pesquisador.

Exemplo: pacientes em um estudo transversal.

Unidade experimental (UE) é o elemento que recebe uma intervenção (tratamento, estímulo etc.).

Exemplo: pacientes em um experimento com fármaco.

Às vezes coincidem, mas não necessariamente.

Exemplo: em um ensaio clínico com intervenção por hospital, a unidade experimental é o hospital, mas a unidade observacional pode ser o paciente.

Unidade observacional e unidade experimental não são sinônimos, embora possam coincidir em alguns delineamentos.

Diferença essencial:

  • Unidade experimental: recebe a atribuição do tratamento (intervenção).
  • Unidade observacional: é o objeto de medição (onde as variáveis são medidas).

Exemplo:

Em um estudo de vacinação escolar:

  • Unidade experimental: a escola (nível de randomização da intervenção).
  • Unidade observacional: o aluno (quem tem os dados coletados, como presença, sintomas etc.).

Se a vacina fosse randomizada por aluno, então aluno = unidade experimental = unidade observacional.

Portanto, nem sempre são iguais, e confundir os dois compromete o delineamento estatístico e a análise.

Níveis de unidade observacional e experimental

Num estudo do efeito de uma droga no fígado humano, posso analisar os dados do paciente, do fígado inteiro, do lóbulo, da lâmina do lóbulo e da célula (e.g.: diâmetro). Há então níveis de unidade observacional e experimental.

Neste caso, há múltiplos níveis hierárquicos de unidades observacionais — e possivelmente também de unidades experimentais, dependendo de como o tratamento (droga) é aplicado.

  1. Unidades observacionais hierárquicas:

A descreveu um modelo de dados aninhado (nested):

  • Paciente

    • Fígado
    • Lóbulo
    • Lâmina histológica
    • Célula

Se você mede, por exemplo, diâmetro celular, cada medida é uma unidade observacional de célula, mas está dependente hierarquicamente do paciente.

  1. Unidade experimental:

Depende de quem recebe a droga:

  • Se a droga é administrada ao paciente, então a unidade experimental é o paciente.
  • Se for ex vivo (e.g.: aplicar diferentes doses em biópsias de fígado no laboratório), a unidade experimental pode ser o lóbulo ou lâmina.
  1. Consequência estatística:

Ignorar a hierarquia viola independência e superestima tamanho amostral.

Soluções:

  • Modelo linear misto (GLMM): efeitos aleatórios para paciente, fígado etc.
  • Análise de variância hierárquica

Planejamento amostral: unidade experimental

O cálculo do tamanho da amostra deve ser feito com base no número de unidades experimentais, não nas observacionais, pois a unidade experimental é aquela que recebe a intervenção (ou tratamento) de forma independente. O número de graus de liberdade da inferência estatística depende disso.

Exemplo:

O pesquisador mede o diâmetro de 1000 células hepáticas de 5 pacientes tratados com uma droga.

  • Unidade experimental: paciente (tratamento foi aplicado no paciente).
  • Unidade observacional: célula hepática (onde você faz as medidas).

Tamanho da amostra = 5, não 1000.

Portanto, você tem \(n=5\) unidades experimentais e não pode fazer inferência estatística válida sobre o efeito da droga com base nas 1000 medidas, pois estão dependentes.

Conclusão:

Sempre calcule o tamanho da amostra com base nas unidades experimentais. Se usar as observacionais, incorre em pseudorrepetição e inflaciona artificialmente o poder do teste.

População-alvo: critérios de inclusão e exclusão

A população-alvo das unidades experimentais é definida diretamente pelos critérios de inclusão e exclusão do estudo.

Ou seja:

  • Critérios de inclusão/exclusão delimitam quem pode receber a intervenção
  • Isso define o universo estatístico sobre o qual se deseja inferir os efeitos do tratamento

Exemplo:

Se a droga for administrada ao paciente, então:

  • Unidade experimental = paciente
  • População-alvo = todos os indivíduos que atendem aos critérios de inclusão/exclusão (e.g.: adultos com hepatite crônica, sem comorbidades hepáticas graves)

Implicação:

Inferência causal ou generalização dos resultados só é válida para a população definida pelas unidades experimentais elegíveis, não pelas unidades observacionais (como células, biópsias, imagens etc.).

Critérios de inclusão

São condições necessárias para que um indivíduo possa participar do estudo como unidade experimental. Definem a população-alvo.

Exemplos:

  • Idade entre 18 e 65 anos
  • Diagnóstico confirmado de hepatite C
  • Função hepática estável

Esses critérios devem delimitar quem pertence ao universo de interesse da pesquisa.

Critérios de exclusão

São restrições adicionais que removem participantes da população elegível, mesmo que cumpram os critérios de inclusão. Evitam viés, riscos ou confundimento.

Exemplos:

  • Uso atual de outras drogas hepatotóxicas
  • Doença hepática autoimune concomitante
  • Gestantes ou lactantes

Não definem a população-alvo, mas refinam a amostra por razões metodológicas ou éticas.

Erros comuns

  • Confundir critérios de exclusão como parte da definição da população-alvo (eles são filtros ex post)
  • Usar critérios subjetivos (“pacientes cooperativos”) sem operacionalização clara
  • Excluir com base em variáveis que serão desfecho (introduz viés)

Exemplo: Assinar TCLE é critério de inclusão ou exclusão?

Assinar o TCLE (Termo de Consentimento Livre e Esclarecido) não é critério de inclusão nem de exclusão técnico, no sentido metodológico. É uma exigência ética e legal prévia à participação em qualquer estudo com seres humanos.

No entanto, na prática regulatória, considera-se:

Critério de inclusão operacional:

Só participa quem assina o TCLE. Logo, muitas vezes ele aparece como o primeiro item da lista de inclusão:

“Assinar voluntariamente o Termo de Consentimento Livre e Esclarecido.”

Mas isso é apenas uma condição formal de elegibilidade ética, não um critério científico.

No estudo do mundo real (RWE)/ observacional/ correlacional, UE = UO?

Na área médica, o termo “estudo do mundo real” (real-world study) é usado para enfatizar que os dados refletem a prática clínica habitual, fora das condições controladas de ensaios clínicos randomizados (RCT).

Diferença conceitual

  • Estudo observacional: termo epidemiológico/metodológico. Foca na ausência de intervenção controlada (e.g.: coorte, caso-controle, inquérito).
  • Estudo do mundo real: termo regulatório e aplicado. Foca na origem dos dados: registros médicos, prontuários, bases administrativas, saúde digital.

Por que usar “mundo real”?

Porque muitos estudos observacionais são feitos em contextos acadêmicos ou artificiais, com seleção rigorosa, monitoramento intensivo etc.

Já os estudos de “real-world evidence” (RWE):

  • Usam dados clínicos rotineiros, com todos os viéses e variações reais
  • São úteis para farmacovigilância, efetividade comparativa, custo-efetividade, e decisões regulatórias

Exemplo:

  • Coorte retrospectiva com base em prontuários de hospital = observacional + mundo real
  • Estudo observacional com coleta prospectiva padronizada, sem randomização = observacional, mas talvez não mundo real

Conclusão:

Todo estudo de mundo real é observacional, mas nem todo observacional é “mundo real”. A distinção é menos sobre o delineamento e mais sobre o contexto e a fonte dos dados.

Na maioria dos estudos observacionais, correlacionais ou de mundo real, sim: unidade experimental = unidade observacional, porque não há intervenção controlada pelo pesquisador.

Ou seja:

  • Não há aleatorização nem tratamento imposto
  • A “unidade experimental” se torna irrelevante ou se confunde com a unidade observacional

Portanto:

  • Em estudos sem intervenção, usamos apenas o conceito de unidade observacional.
  • A unidade onde as variáveis são medidas (e.g.: paciente, prontuário, consulta) é a UO — e ela também é a unidade para inferência.

Exceções:

Se o estudo observacional for hierárquico (e.g.: dados de alunos dentro de escolas), ainda assim pode haver unidades observacionais aninhadas, mas sem unidade experimental no sentido clássico.

Conclusão:

Sim, em estudos de mundo real (sem intervenção), UE = UO por default, pois só há observação. Mas o termo unidade experimental perde o sentido nesses delineamentos.

Exemplos concretos e comparativos para deixar clara a diferença entre estudo observacional e estudo do mundo real (RWE):

  1. Estudo de coorte com coleta primária padronizada
  • Tipo: Observacional tradicional
  • Descrição: Pacientes com diabetes tipo 2 são recrutados em ambulatório universitário e seguidos prospectivamente. Medidas são feitas com calendário fixo e exames centralizados.
  • É RWE? Não
  • Motivo: Embora observacional, o ambiente é controlado e padronizado, não refletindo o “mundo real”.
  1. Estudo com base em prontuários eletrônicos (EHR)
  • Tipo: Observacional + Mundo real
  • Descrição: Dados retrospectivos de 10 mil pacientes com insuficiência cardíaca coletados de sistemas eletrônicos hospitalares. Análise da sobrevida e uso de medicamentos.
  • É RWE? Sim
  • Motivo: Dados vêm de prática clínica real, com variação de condutas e sem padronização rígida.
  1. Ensaio clínico randomizado pragmático
  • Tipo: Experimental + Mundo real
  • Descrição: Pacientes são randomizados a dois tratamentos anti-hipertensivos em seus próprios postos de saúde, sem exigência de visitas extras ou exames fora da rotina.
  • É RWE? Sim
  • Motivo: Apesar de ser um RCT, o contexto é o cuidado habitual, tornando-o um estudo do mundo real experimental.
  1. Estudo caso-controle com coleta em centros de pesquisa
  • Tipo: Observacional
  • Descrição: Pacientes com câncer de pulmão e controles são entrevistados por equipe treinada com formulário padronizado.
  • É RWE? Não
  • Motivo: A coleta é intervencionista e padronizada, diferente da prática clínica.
  1. Análise de banco de dados público (DATASUS, SIVEP-Gripe)
  • Tipo: Observacional + Mundo real
  • Descrição: Avaliação da mortalidade por COVID-19 segundo comorbidades usando registros do SIVEP.
  • É RWE? Sim
  • Motivo: Os dados são administrativos, gerados em ambiente real, com qualidade imperfeita, mas ampla representatividade.

Referências

RCT pragmático (Randomized Controlled Trial Pragmático)

Um RCT pragmático (Randomized Controlled Trial Pragmático) é um ensaio clínico randomizado desenhado para avaliar a efetividade de uma intervenção na prática clínica real, e não apenas sua eficácia em condições ideais.

Diferença central:

  • RCT explicativo (tradicional): testa eficácia → ambiente controlado, critérios rígidos, alta aderência.
  • RCT pragmático: testa efetividade → ambiente realista, critérios amplos, mínima interferência.

Características do RCT pragmático:

  • Critérios de inclusão/exclusão amplos
  • Intervenção aplicada por profissionais comuns no dia a dia
  • Seguimento com dados clínicos de rotina (e.g.: prontuário)
  • Desfechos clinicamente relevantes e facilmente mensuráveis
  • Pouca interferência do pesquisador na condução clínica

Exemplo:

Um estudo pragmático pode comparar dois anti-hipertensivos em pacientes de UBSs, com randomização simples, sem exames extras nem visitas específicas — tudo acompanhado via prontuário eletrônico.

Ferramenta para avaliar: PRECIS-2

Permite pontuar o grau de “pragmatismo” de um ensaio em 9 domínios (elegibilidade, aderência, flexibilidade, desfecho etc.).

Conclusão:

RCT pragmático ≠ estudo observacional.

É randomizado, mas reflete o mundo real. Tem alta validade externa, sem sacrificar a validade interna. Ideal para orientar decisões em políticas públicas e medicina baseada em evidência do cotidiano.

9 domínios do PRECIS-2 (Pragmatic-Explanatory Continuum Indicator Summary 2)

Os 9 domínios do PRECIS-2 (Pragmatic-Explanatory Continuum Indicator Summary 2) servem para classificar um ensaio clínico randomizado ao longo do espectro pragmático–explicativo, ou seja, o quanto ele reflete a prática clínica real.

Aqui estão os domínios:

  1. Elegibilidade

    Quão restritivos são os critérios de inclusão/exclusão?

    (Mais restrito → mais explicativo)

  2. Recrutamento

    Como os participantes são convidados?

    (Convite especial, fora da rotina → explicativo)

  3. Configuração

    Onde o estudo é conduzido?

    (Ambiente clínico comum = pragmático; centro de excelência = explicativo)

  4. Organização

    Recursos e infraestrutura necessários para executar a intervenção.

    (Requer estrutura extra = explicativo)

  5. Flexibilidade na entrega da intervenção

    O tratamento é dado de forma rígida ou conforme o dia a dia?

    (Protocolos rígidos = explicativo)

  6. Flexibilidade no comportamento do participante Participantes precisam seguir instruções estritas? (Se sim, é mais explicativo)

  7. Acompanhamento (Follow-up)

    Feito conforme a rotina clínica ou exige exames/visitas extras?

    (Exames adicionais = explicativo)

  8. Desfechos primários

    São clinicamente relevantes e fáceis de obter?

    (Desfecho laboratorial ou surrogate = explicativo)

  9. Análise primária

    Intenção de tratar (ITT) ou por protocolo?

    (ITT = mais pragmático; por protocolo = mais explicativo)

Cada domínio é avaliado numa escala de 1 (muito explicativo) a 5 (muito pragmático).

Aqui está uma aplicação dos 9 domínios do PRECIS‑2 a um estudo pragmático de hipertensão como o LIGHT trial, conduzido na atenção primária na China, que implementou um sistema de suporte à decisão clínica (CDSS) para prescrição de antihipertensivos ([BioMed Central][1]):

  • Estudo: LIGHT trial (China, atenção primária, cluster‑RCT pragmático)

Pacientes ≥ 18 anos com hipertensão são atendidos em unidades básicas de saúde; unidades (clusters) foram randomizadas para usar o CDSS ou cuidado usual. Dentro do sistema, um subestudo randomizou pacientes a diferentes regimes antihipertensivos (LIGHT‑ACD) (Song et al., 2022).

  • Song, J et al. (2022) Effectiveness of a clinical decision support system for hypertension management in primary care: study protocol for a pragmatic cluster-randomized controlled trial. Trials 23(412). https://doi.org/10.1186/s13063-022-06374-x

Avaliação PRECIS‑2 nos 9 domínios:

Domínio Avaliação (1=explicativo → 5=pragmático) Justificativa
1. Elegibilidade 5 Critérios amplos: adultos com HTA, sem cardiopatia ou DRC grave; poucas exclusões clínicas
2. Recrutamento 5 Entrada via consulta rotineira na UBS; sem convite externo ou seleção especial
3. Ambiente de estudo 5 Atendido e recrutado no setting clínico habitual (UBS) )
4. Organização ~4 CDSS integrado ao EHR existente; exige infraestrutura mínima, mas baseada na rotina
5. Flexibilidade na entrega 5 Médicos e pacientes seguem prática usual, com suporte discreto do CDSS
6. Flex. no comportamento ~4–5 Atenção consultório usual, pouca exigência adicional de adesão rigorosa
7. Acompanhamento 5 Merece mínimo impacto: coleta via EHR, visitas de rotina; sem exames extras
8. Desfecho primário 5 Proporção de consultas com prescrição conforme diretrizes: desfecho clínico rotineiro
9. Análise primária 5 Análise por intenção de tratar em cluster (cupom usual) – retém pragmatismo

Conclusão:

O LIGHT trial é altamente pragmático (escore médio entre 4 e 5) em todos os domínios do PRECIS‑2, estando bem alinhado com a prática clínica real. Exemplifica um ensaio randomizado moderno que combina randomização, dados de rotina e validade externa forte, sem perder rigor interno.

ITT (Intention-to-Treat)

ITT (Intention-to-Treat, ou “intenção de tratar”) é o princípio de análise segundo o qual todos os participantes randomizados devem ser analisados nos grupos aos quais foram originalmente atribuídos, independentemente do que ocorreu depois (aderência, desvio, perda, troca de grupo etc.).

Por que é importante?

  • Mantém os benefícios da randomização (controle de confundimento)
  • Reflete a efetividade na prática clínica real (nem todo paciente segue o plano ideal)
  • Reduz viés de seleção pós-randomização

Exemplo:

Em um RCT, 100 pacientes são randomizados para receber a droga A. Mas 10 abandonam, 5 trocam de grupo e 85 completam.

Na análise ITT, todos os 100 continuam no grupo A para fins de análise, mesmo os que não tomaram o tratamento.

Comparações:

  • ITT: análise mais pragmática, favorece validade externa
  • Per protocol: inclui só quem seguiu o protocolo rigidamente (mais explicativo, mas com risco de viés)

Conclusão:

ITT é o padrão-ouro para análise primária em RCT, especialmente em ensaios pragmáticos, pois preserva a randomização e reflete melhor a realidade clínica.

Como aplicar ITT na prática com abandono e troca de grupo?

Cenário:

  • 100 pacientes randomizados para Grupo A
  • 100 pacientes randomizados para Grupo B
  • No Grupo A: 10 abandonam, 5 trocam para tratamento B

Princípio ITT:

Na análise ITT, você ignora o que o paciente fez depois da randomização. Você analisa com base no grupo sorteado, não no tratamento realmente recebido.

Como fazer na prática:

  1. Monte a tabela ou modelo com todos os 200 pacientes (n = 100 por grupo).
  2. Atribua a variável grupo = A ou grupo = B com base na randomização original.
  3. Mesmo os que abandonaram ou trocaram de grupo, mantêm o rótulo do grupo original.
  4. Use técnicas para dados ausentes se não há desfecho medido (ver abaixo).

E se não houver desfecho?

  • Abandono sem desfecho → use imputação múltipla, última observação carregada (LOCF), modelos de efeitos mistos, ou censure no tempo (se for tempo até evento).
  • Troca de grupo → mantém no grupo original; a troca não muda nada na análise ITT.

Exemplo com regressão:

modelo_itt <- lm(desfecho ~ grupo, data = dados)  # grupo = randomização original

Você não cria variável “tratamento real recebido”. ITT desconsidera isso.

Conclusão:

Na análise ITT, os 10 abandonos e 5 trocas continuam no grupo A. Você analisa o efeito da atribuição ao tratamento, não da adesão. É como perguntar: “Se eu prescrevesse isso a todos, qual o impacto esperado no mundo real?”

Análise ITT sem imputação

Se você rejeita imputação, está adotando uma postura mais conservadora e realista, especialmente coerente com o espírito do RCT pragmático.

Então, o que fazer com os abandonos no ITT?

Opções viáveis sem imputação:

  1. Censura por ausência de desfecho (em desfechos de tempo): Ex: análise de Kaplan-Meier, Cox – pacientes que abandonam são censurados na última visita conhecida.

  2. Última medição disponível (LOCF) → não recomendado (técnica antiga, viés alto).

  3. Modelo com dados ausentes ignorados sob MAR (missing at random): Em modelos lineares ou GLM, o R ignora linhas com NA. Se a perda for <10% e balanceada entre os grupos, o viés é mínimo.

lm(desfecho ~ grupo, data = dados_completos)  # onde `desfecho` não é NA
  1. Análise de sensibilidade: Faça duas análises:

    • ITT “pura” com dados disponíveis
    • Per protocol (excluindo abandonos e trocas)

Compare os resultados. Se forem similares, robustez confirmada.

Sobre as trocas de grupo:

No ITT, ignora-se a troca. O paciente é analisado no grupo originalmente sorteado, e ponto final.

Conclusão:

Você pode manter a análise ITT sem imputar nada, desde que:

  • A perda de dados seja pequena e não diferencial
  • Assuma-se que os dados ausentes são ignorable (MAR)
  • Use análise de sensibilidade para transparência

Isso preserva o realismo e a integridade estatística, sem recorrer a suposições artificiais como na imputação.

Referências

Plano de Análise Estatística (PSA)

Plano de Análise Estatística (PSA): é um documento técnico que descreve detalhadamente os métodos estatísticos a serem utilizados em um estudo, geralmente clínico ou epidemiológico, antes da análise dos dados. Deve incluir:

  • Objetivos primários e secundários
  • Populações de análise (por exemplo, ITT, PP, SAF)
  • Definição de desfechos e métricas
  • Métodos estatísticos (testes, modelos, correções para múltiplas comparações)
  • Estratégias para dados ausentes (ex: imputação múltipla)
  • Análises de sensibilidade e de subgrupos
  • Níveis de significância e intervalos de confiança
  • Softwares a serem utilizados

O PSA deve ser finalizado antes do banco ser destravado e segue boas práticas da Good Clinical Practice (GCP) e recomendações do ICH E9.

ITT, PP e SAF

ITT, PP e SAF são definições de populações analíticas em estudos clínicos:

  • ITT (Intention-to-Treat): inclui todos os participantes randomizados, independentemente de adesão ao protocolo ou desfecho. Preserva a aleatorização e evita viés, sendo padrão para análise primária.

  • PP (Per-Protocol): inclui apenas os participantes que seguiram rigorosamente o protocolo. Útil para verificar a eficácia em condições ideais.

  • SAF (Safety Population): inclui todos os participantes que receberam pelo menos uma dose do produto em estudo, usada para análise de segurança.

Essas populações podem produzir resultados distintos; o ITT é mais conservador, enquanto o PP pode superestimar efeitos.

Good Clinical Practice (GCP) e recomendações do ICH E9

Good Clinical Practice (GCP) é um padrão internacional ético e científico para o desenho, condução, registro e relato de estudos clínicos com seres humanos. Visa garantir:

  • Direitos, segurança e bem-estar dos participantes
  • Qualidade e integridade dos dados

É exigida por agências regulatórias como ANVISA, FDA e EMA.

ICH E9 é uma diretriz do International Council for Harmonisation focada na metodologia estatística para estudos clínicos. Define princípios para:

  • Planejamento estatístico (incluindo o PSA)
  • Definição de estimando (estimand)
  • Manejo de dados ausentes
  • Controle de erro tipo I
  • Populações de análise (ITT, PP, etc.)

Ambos são essenciais para garantir validade científica e aceitação regulatória dos resultados.

Lei 14.687/24 sobre pesquisa com animal humano

Lei nº 14.687, de 21 de maio de 2024:

“Capítulo I - Disposições Gerais

Art. 3º A pesquisa deverá atender às exigências éticas e científicas aplicáveis às pesquisas com seres humanos, especialmente:

[…]

III - embasamento científico sólido e descrição em protocolo;

[…]

IX - adoção de procedimentos que assegurem a qualidade dos aspectos técnicos envolvidos e a validade científica da pesquisa;”

  • O que significa embasamento científico?

O termo “embasamento científico” refere-se à fundamentação e justificativa de uma pesquisa baseada em conhecimento científico prévio, métodos rigorosos e dados empíricos. Para uma pesquisa atender aos padrões éticos e científicos, é necessário que ela se apoie em evidências sólidas e esteja alinhada com o conhecimento existente na área, o que garante que os procedimentos, hipóteses e objetivos sejam plausíveis, seguros e relevantes.

No contexto de um protocolo de pesquisa envolvendo seres humanos, o embasamento científico inclui a revisão da literatura, a justificativa da escolha dos métodos, e a definição clara dos objetivos, com o intuito de assegurar que o estudo tenha valor científico e possa contribuir de forma válida e segura para o conhecimento na área da saúde.

  • Qual é a relação com testes estatísticos?

O embasamento científico de uma pesquisa está diretamente relacionado com a escolha e aplicação adequada de testes estatísticos. Essa relação é fundamental para:

  1. Validação de Hipóteses: Testes estatísticos são utilizados para verificar se os dados obtidos suportam ou refutam as hipóteses da pesquisa. A escolha de testes apropriados fortalece o embasamento científico ao garantir que as conclusões derivadas dos dados são estatisticamente válidas.

  2. Controle de Erros: O uso de testes estatísticos adequados minimiza o risco de erros tipo I (falso positivo) e tipo II (falso negativo), contribuindo para a confiabilidade e a precisão dos resultados.

  3. Generalização dos Resultados: Os testes estatísticos permitem extrapolar os resultados da amostra para a população-alvo da pesquisa, respeitando as condições de validade e significância. Isso é essencial para que as conclusões sejam cientificamente sustentadas.

  4. Análise de Relações e Efeitos: Em pesquisas biomédicas, por exemplo, é comum investigar associações entre variáveis ou o efeito de uma intervenção. Testes estatísticos fornecem o ferramental para avaliar essas relações, quantificar efeitos e determinar sua relevância estatística e prática.

  5. Reprodutibilidade e Comparabilidade: O embasamento científico também exige que os métodos sejam reprodutíveis e comparáveis. Testes estatísticos padronizados permitem que outros pesquisadores validem os resultados, promovendo a transparência e a confiança na pesquisa.

Portanto, o embasamento científico depende da escolha rigorosa de testes estatísticos que sejam apropriados para os dados e os objetivos do estudo, o que fortalece a legitimidade e a aplicabilidade dos resultados.

  • Qual é a relação disso tudo com a validade científica da pesquisa?

A validade científica de uma pesquisa refere-se ao grau em que suas conclusões são corretas, confiáveis e aplicáveis ao contexto que se propõe estudar. O embasamento científico, o uso adequado de testes estatísticos e a adesão a métodos rigorosos são pilares fundamentais para garantir essa validade. A relação entre esses elementos e a validade científica pode ser entendida da seguinte forma:

  1. Validade Interna: A validade interna refere-se à capacidade da pesquisa de estabelecer uma relação causal entre as variáveis estudadas sem interferências de fatores externos. O embasamento científico, aliado ao uso de testes estatísticos apropriados, ajuda a controlar vieses e a reduzir erros, garantindo que as conclusões são realmente atribuíveis aos fenômenos investigados e não a outras variáveis não controladas.

  2. Validade Externa: Essa validade trata da generalização dos resultados para outras populações, contextos e tempos. Uma pesquisa com bom embasamento científico e com análise estatística robusta tende a produzir resultados mais representativos, aumentando a confiabilidade na extrapolação dos achados para a população-alvo.

  3. Confiabilidade e Reprodutibilidade: A validade científica também exige que os resultados sejam reprodutíveis por outros pesquisadores em condições semelhantes. O uso de metodologias padronizadas e testes estatísticos adequados promove a reprodutibilidade, pois facilita a replicação dos métodos e dos achados, reforçando a credibilidade do estudo.

  4. Precisão nas Conclusões: Testes estatísticos bem escolhidos e embasamento científico adequado garantem que as conclusões da pesquisa são precisas e refletem corretamente a realidade estudada. Isso evita interpretações equivocadas e reforça a confiança dos resultados para a comunidade científica.

  5. Relação com o Risco-Benefício: Em estudos envolvendo seres humanos, a validade científica está intimamente ligada à justificativa ética do estudo. Se a pesquisa é cientificamente válida, seus potenciais benefícios podem superar os riscos para os participantes. Sem validade científica, não há justificativa ética para submeter participantes aos riscos de um estudo que não contribui com conhecimento relevante.

Assim, a validade científica da pesquisa depende de um embasamento científico sólido e da aplicação rigorosa de métodos estatísticos e de análise, pois esses fatores garantem que as conclusões sejam válidas, confiáveis e relevantes para o avanço do conhecimento na área.

Referências

  • BREAKWELL, G et al. (2010) Métodos de Pesquisa em Psicologia. 3ª ed. Porto Alegre: Penso. Capítulo 4: O método experimental em Psicologia.
  • CAMPBELL DT, STANLEY JC (1969) Delineamentos experimentais e quase-experimentais de pesquisa. São Paulo: EPU/EDUSP.
  • COGGON D, ROSE G, BARKER DJP Epidemiology for the uninitiated. 4th ed. BMJ.
  • COZBY, P (2003, p.172) Métodos de pesquisa em ciências do comportamento. SP: Atlas.
  • DANCEY, CP & REIDY, J (2019) Estatística sem Matemática para Psicologia 7ª ed. Porto Alegre: Penso.
  • de VET, HC et al. (2011) Measurement in medicine: A practical guide. NY: Cambridge.
  • DEMPSTER, M & HANNA, D (2016) Research Methods in Psychology for Dummies. NJ: Wiley.
  • FRIEDMAN GD (1967) Cigarette smoking and geographic variation in coronary heart disease mortality in the United States. J Chronic Dis 20(10):769-79. https://doi.org/10.1016/0021-9681(67)90089-6.
  • GIOLO (2012) Introdução à análise de dados categóricos. RBRAS.
  • HENEKENS, CH & BURING, JE (1987) Epidemiology in Medicine. Boston: Little, Brown and Company.
  • HOCHMAN, B (2005) Desenhos de pesquisa. Acta Cirúrgica Brasileira, 2: 2-9.
  • HULLEY, SB et al. (2015) Delineando a Pesquisa Clínica. 5ª ed. Porto Alegre: Artmed. Capítulo 9: Fortalecendo a inferência causal em estudos observacionais.
  • KIRKWOOD, BR & STERNE, AC (2003) Essential medical statistics. 2nd ed. Oxford: Blackwell.
  • MORGENSTERN H (1995) Ecologic studies in epidemiology: concepts, principles, and methods. Annu Rev Public Health 16:61-81. doi:10.1146/annurev.pu.16.050195.000425
  • ONWUEGBUZIE, AJ (2004). Academic procrastination and statistics anxiety. Assessment & Evaluation in Higher Education, 29(1), 3–19. https://doi.org/10.1080/0260293042000160384
  • PHAROAH P (2016) Epidemiological study design. e-Disciplinas USP https://edisciplinas.usp.br/pluginfile.php/2066043/mod_resource/content/1/2016-09-21-StudyDesign.pdf
  • PORTA M, editor. A dictionary of epidemiology. 6th Ed. New York: Oxford University Press; 2014.
  • RIVAS-RUIZ, F et al (2012) Research designs in clinical epidemiology, Allergologia et Immunopathologia, 40(2):117-124.
  • RIVAS-RUIZ, F et al. (2012) Research designs in clinical epidemiology. Allergologia et Immunopathologia 40(2):117-24.
  • ROSENBERG, M (1976) A Lógica da Análise do Levantamento de Dados. Cultrix/EDUSP.
  • SELWYN, M. (1996) Principles of experimental design for the life sciences. NY: CRC.
  • SIQUEIRA, AL & TIBÚRCIO, JD (2011) Estatística na área da saúde. Belo Horizonte: Coopemed.
  • SILVEIRA, PSP & SIQUEIRA, JO. Better to be in agreement than in bad company. Behavior Research Methods 55, 3326–3347 (2023). https://doi.org/10.3758/s13428-022-01950-0
  • STEEL, P (2007) The Nature of Procrastination: A Meta-Analytic and Theoretical Review of Quintessential Self-Regulatory Failure. Psychological Bulletin 133(1):65–94.
  • STEVENS SS (1975) Psycho-Physics: Introduction to its perceptual, neural and social prospects. USA: Transactions Publishers.
  • SURESH, KP (2011) An overview of randomization techniques: An unbiesed assessment of outcome in clinical research. Journal of Human Reprodutive Sciences 4(1).
  • TOWNSEND, J (1953, cap.7) Introduction to Experimental Method for Psychology and Social Sciences. NY: McGraw-Hill.
  • TU, Y-K & GILTHORPE, MS (2012) Statistical thinking in Epidemiology. NY: CRC.
  • USHNER, D et al. (2018) randomizeR: an R package for the assessment and implementation of randomization in clinical trial. Journal of Statistical Software 85(8) doi:10.18637/jss.v085.i08.
  • van BELLE, G (2008) Statistical rules of thumb. 2nd ed. NJ: Wiley.
  • WARD H et al. (2012) Oxford handbook of epidemiology for Clinicians. UK: Oxford.