Bastão de Asclépio & Distribuição Normal
invisible(Sys.setlocale("LC_CTYPE", "pt_BR.UTF-8"))
invisible(Sys.setlocale("LC_ALL", "pt_BR.UTF-8"))
options(warn=-1)
suppressMessages(library(dplyr, warn.conflicts=FALSE))
suppressMessages(library(knitr, warn.conflicts=FALSE))
suppressMessages(library(randomizeR, warn.conflicts=FALSE))
suppressMessages(library(readxl, warn.conflicts=FALSE))
suppressMessages(library(sampling, warn.conflicts=FALSE))
RPubs
Dancey, CP & Reidey, J (2019) Estatística sem Matemática para Psicologia, 7ª ed. Porto Alegre: Penso.
“Estatística sem Matemática para Psicologia apresenta, de forma clara e direta, todos os procedimentos estatísticos dos quais você necessita, sem usar fórmulas matemáticas intimidantes, bem como oferece um guia de utilização do SPSS. Com muitos exemplos e atividades ao longo do texto, este livro permitirá que você se entenda com a estatística e não se sinta como um peixe fora d’água.”
Os exemplos do livro são resolvidos em IBM SPSS Statistics. Neste texto, utilizamos a linguagem R.
Os cinco primeiros capítulos apresentam os conceitos básicos de estatística e de planejamento de experimentos. Os capítulos seguintes apresentam os testes estatísticos:
Com base nos objetivos do livro, ao final desta disciplina o estudante deve ser capaz de:
A Estatística fornece essencialmente informações sobre variáveis:
Variável é algo que pode variar, i.e., pode assumir valores ou categorias diferentes com determinadas distribuições de probabilidade.
Estamos interessados em variáveis porque queremos entender o motivo de sua variação e como elas se relacionam.
São exemplos de variáveis:
Uma classificação das variáveis que aparece em vários textos é a seguinte:
Variável contínua: pode assumir qualquer valor quantitativo em um dado intervalo
Variável discreta: pode assumir somente valores quantitativos discretos dentro de um dado intervalo ou contagem de eventos
Variável categórica: os seus valores são categorias qualitativas
Esta classificação é incompleta, não discriminando bem os tipos das variáveis.
A variável intervalar contínua tem valores representados por números reais.
Abaixo apresentamos dez estaturas, em metro, de homens adultos brasileiros:
# para sortear os mesmos numeros do exemplo
set.seed(123)
estatura <- round(rnorm(n=10, mean=1.70, sd=0.10), 2)
print(estatura)
[1] 1.64 1.68 1.86 1.71 1.71 1.87 1.75 1.57 1.63 1.66
Esta é uma variável razão contínua porque tem zero como limite inferior. Portanto, é correto dizer que alguém com 2 metros tem o dobro da estatura de alguém que tem 1 metro. |
Variáveis intervalares contínuas (números reais) podem ser arredondadas para números inteiros (e.g., anotando-se as estaturas em centímetros, números inteiros). A variável subjacente (em seu maior nível de mensuração, permanece sendo intervalar contínua, mas recebendo o tratamento de uma intervalar discreta); por exemplo:
[1] 164 168 186 171 171 187 175 157 163 166
Variável observada vs. variável subjacente “Um problema que surge quando lidamos com variáveis discretas e contínuas é o perigo de confundir a variável subjacente com a forma como ela é mensurada. Em teoria, uma variável pode ser contínua, mas a forma de medi-la é sempre discreta, não importa o nosso grau de precisão. Poderíamos medir a ansiedade (uma variável teoricamente contínua) utilizando um questionário (p. ex., o Inventário de Ansiedade Traço-Estado de Spielberger, Spielberger et al., 1983), cujo escore total fornece uma indicação do nível de ansiedade de uma pessoa. O escore total nesse questionário pode aumentar somente em unidades inteiras, digamos de 38 para 39 ou de 61 para 62. Assim, a forma de mensuração da ansiedade é discreta, enquanto a variável subjacente é de fato contínua.” (Dancey & Reidy, 2019, p. 4) |
São, legitimamente, as variáveis oriundas de contagens (e.g., número de mortes de motociclistas).
Por exemplo, em 2019, na Cidade de São Paulo, SP:
Quantos motociclistas mortos esperamos ver em 12 meses simulados?
morte.mes <- 366/12
mortes <- rpois(n=12, lambda=morte.mes)
cat("Em doze meses, com taxa de ",morte.mes," morte/mês, podemos observar:\n", sep="")
Em doze meses, com taxa de 30.5 morte/mês, podemos observar:
[1] 37 32 32 31 27 37 35 30 26 24 28 26
Para apreciar melhor a notícia: demo_PoissonMotos.R
A estatura pode ser classificada em três grupos: baixa, intermediária, alta.
estatura.cat <- cut(estatura,
breaks=c(0, 160,180, +Inf),
labels=c("baixa","intermediária","alta"))
print(estatura.cat)
[1] intermediária intermediária alta intermediária intermediária
[6] alta intermediária baixa intermediária intermediária
Levels: baixa intermediária alta
Factor w/ 3 levels "baixa","intermediária",..: 2 2 3 2 2 3 2 1 2 2
NULL
[1] "factor"
[1] "baixa" "intermediária" "alta"
Para que estatura.cat
seja rigorosamente tratada como
ordinal, adicione:
[1] intermediária intermediária alta intermediária intermediária
[6] alta intermediária baixa intermediária intermediária
Levels: baixa < intermediária < alta
Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
NULL
[1] "ordered" "factor"
[1] "baixa" "intermediária" "alta"
E, então, classificamos as 10 estaturas do exemplo:
estatura estatura.cat
1 164 intermediária
2 168 intermediária
3 186 alta
4 171 intermediária
5 171 intermediária
6 187 alta
7 175 intermediária
8 157 baixa
9 163 intermediária
10 166 intermediária
'data.frame': 10 obs. of 2 variables:
$ estatura : num 164 168 186 171 171 187 175 157 163 166
$ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
NULL
[1] "data.frame"
Há cinco estados civis oficiais no Brasil fonte: https://luisaportela.jusbrasil.com.br: solteiro, casado, divorciado, viúvo, separado judicialmente.
No exemplo, vamos adicionar uma coluna ao dataframe:
somatometria$estcivil <- c("casado","solteiro","solteiro",
"solteiro","divorciado","solteiro",
"casado","casado","viúvo","solteiro")
print(str(somatometria))
'data.frame': 10 obs. of 3 variables:
$ estatura : num 164 168 186 171 171 187 175 157 163 166
$ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
$ estcivil : chr "casado" "solteiro" "solteiro" "solteiro" ...
NULL
'data.frame': 10 obs. of 3 variables:
$ estatura : num 164 168 186 171 171 187 175 157 163 166
$ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
$ estcivil : Factor w/ 4 levels "casado","divorciado",..: 1 3 3 3 2 3 1 1 4 3
NULL
estatura estatura.cat estcivil
1 164 intermediária casado
2 168 intermediária solteiro
3 186 alta solteiro
4 171 intermediária solteiro
5 171 intermediária divorciado
6 187 alta solteiro
7 175 intermediária casado
8 157 baixa casado
9 163 intermediária viúvo
10 166 intermediária solteiro
[1] 5 3 3 4 1 2 5 1 1 3
[1] "integer"
[1] 5 3 3 4 1 2 5 1 1 3
[1] "numeric"
[1] 5 3 3 4 1 2 5 1 1 3
[1] "integer"
[1] 5 3 3 4 1 2 5 1 1 3
Levels: 1 2 3 4 5
[1] "factor"
[1] 5 3 3 4 1 2 5 1 1 3
Levels: 1 < 2 < 3 < 4 < 5
[1] "ordered" "factor"
[1] 5 3 3 4 1 2 5 1 1 3
Levels: 1 2 3 4 5
[1] "factor"
[1] 5 3 3 4 1 2 5 1 1 3
Levels: 5 < 4 < 3 < 2 < 1
[1] "ordered" "factor"
Existem casos em que os pesquisadores convertem variáveis quantitativas em variáveis categóricas, como o índice de massa corpórea (IMC), dado por:
\[ \text{IMC} = {{\text{massa (kg)}} \over {\text{estatura (m)} ^2}} \]
Usada pela Associação Brasileira para Estudo da Obesidade (ABESO) e pela Organização Mundial da Saúde (WHO) para classificar:
Podemos reproduzir estas classificações em R, retomando o
dataframe somatometria
. Criaremos, primeiro, as
colunas de massa corporal total (mct
, em kg) e calcularemos
o índice de massa corpórea (imc
):
set.seed(570)
somatometria$mct <- round(rnorm(n=10, mean=75, sd=20), 0)
# massa em kg, estatura em metro
somatometria$imc <- round(somatometria$mct/((somatometria$estatura/100)^2), 1)
print(str(somatometria))
'data.frame': 10 obs. of 5 variables:
$ estatura : num 164 168 186 171 171 187 175 157 163 166
$ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
$ estcivil : Factor w/ 4 levels "casado","divorciado",..: 1 3 3 3 2 3 1 1 4 3
$ mct : num 77 69 103 99 113 106 60 44 77 34
$ imc : num 28.6 24.4 29.8 33.9 38.6 30.3 19.6 17.9 29 12.3
NULL
estatura estatura.cat estcivil mct imc
1 164 intermediária casado 77 28.6
2 168 intermediária solteiro 69 24.4
3 186 alta solteiro 103 29.8
4 171 intermediária solteiro 99 33.9
5 171 intermediária divorciado 113 38.6
6 187 alta solteiro 106 30.3
7 175 intermediária casado 60 19.6
8 157 baixa casado 44 17.9
9 163 intermediária viúvo 77 29.0
10 166 intermediária solteiro 34 12.3
A classificação da ABESO / WHO é feita assim:
classe <- c("Subpeso",
"Normal",
"Sobrepeso", "Obesidade I", "Obesidade II", "Obesidade III")
pc <- c(0, 18.5, 25, 30, 35, 40, +Inf)
somatometria$imc_classe <- cut(somatometria$imc, pc, classe)
print(str(somatometria))
'data.frame': 10 obs. of 6 variables:
$ estatura : num 164 168 186 171 171 187 175 157 163 166
$ estatura.cat: Ord.factor w/ 3 levels "baixa"<"intermediária"<..: 2 2 3 2 2 3 2 1 2 2
$ estcivil : Factor w/ 4 levels "casado","divorciado",..: 1 3 3 3 2 3 1 1 4 3
$ mct : num 77 69 103 99 113 106 60 44 77 34
$ imc : num 28.6 24.4 29.8 33.9 38.6 30.3 19.6 17.9 29 12.3
$ imc_classe : Factor w/ 6 levels "Subpeso","Normal",..: 3 2 3 4 5 4 2 1 3 1
NULL
estatura estatura.cat estcivil mct imc imc_classe
1 164 intermediária casado 77 28.6 Sobrepeso
2 168 intermediária solteiro 69 24.4 Normal
3 186 alta solteiro 103 29.8 Sobrepeso
4 171 intermediária solteiro 99 33.9 Obesidade I
5 171 intermediária divorciado 113 38.6 Obesidade II
6 187 alta solteiro 106 30.3 Obesidade I
7 175 intermediária casado 60 19.6 Normal
8 157 baixa casado 44 17.9 Subpeso
9 163 intermediária viúvo 77 29.0 Sobrepeso
10 166 intermediária solteiro 34 12.3 Subpeso
Outra possibilidade é dicotomizar uma variável (i.e., criar duas categorias). Neste exemplo, três maneiras de dicotomizar podem ser:
Adotando-se dicotomizar em normal e não normal que inclui magreza e obesidade:
classe <- c("Anormal",
"Normal",
"Anormal")
pc <- c(0, 18.5, 25, +Inf)
somatometria$imc_dicot <- cut(somatometria$imc, pc, classe)
print(somatometria)
estatura estatura.cat estcivil mct imc imc_classe imc_dicot
1 164 intermediária casado 77 28.6 Sobrepeso Anormal
2 168 intermediária solteiro 69 24.4 Normal Normal
3 186 alta solteiro 103 29.8 Sobrepeso Anormal
4 171 intermediária solteiro 99 33.9 Obesidade I Anormal
5 171 intermediária divorciado 113 38.6 Obesidade II Anormal
6 187 alta solteiro 106 30.3 Obesidade I Anormal
7 175 intermediária casado 60 19.6 Normal Normal
8 157 baixa casado 44 17.9 Subpeso Anormal
9 163 intermediária viúvo 77 29.0 Sobrepeso Anormal
10 166 intermediária solteiro 34 12.3 Subpeso Anormal
“Streiner (2002) ressalta o fato de que muitas decisões em psicologia, psiquiatria e medicina são binárias. Nesse tipo de decisão têm-se apenas duas escolhas, como se a pessoa apresenta ou não problema mental, se tem ou não uma determinada doença, se precisa ou não ser hospitalizada ou se deve ou não receber alta do hospital. O argumento utilizado é que, se esses profissionais precisam tomar decisões binárias, então é legítimo investigar variáveis dessa forma. Tal raciocínio é utilizado para dar suporte à prática disseminada de dicotomizar variáveis contínuas.
Streiner argumenta que não precisamos ver as decisões que os médicos tomam como binárias. Ele sugere que seria melhor pensar em uma doença mental, por exemplo, como um contínuo: quanto mais sintomas uma pessoa apresenta, mais afetada estará. Deveríamos, então, medir tais construtos de forma contínua e não dicotomizá-los. Assim, em vez de utilizar questionários para categorizar pessoas, poderíamos usá-los para obter uma medida de onde elas estão em um contínuo. Tal informação pode ser utilizada na nossa decisão para tratar pessoas, entre outras situações. É interessante notar que a última versão do Manual diagnóstico e estatístico de transtornos mentais (DSM-5) vê as doenças mentais como um continuum em vez de categorias.
[…]
Streiner ainda ressalta pesquisas que mostram que análises utilizando variáveis dicotômicas apresentam aproximadamente 67% da eficiência das que utilizam medidas contínuas ou discretas originais. Trata-se uma grande perda de sensibilidade do estudo. Isso significa que você tem apenas dois terços da probabilidade de detectar relacionamentos entre variáveis se estiver utilizando variáveis contínuas ou discretas dicotomizadas. Essa é uma séria desvantagem na realização de uma pesquisa. Além disso, a perda de poder não é o único problema que surge quando variáveis são dicotomizadas. Maxwell e Delaney (1993) mostraram que essa prática pode levar a achados espúrios na análise estatística.”
Dancey & Reidy, 2019, p. 5-6
“Consequentemente, aconselhamos não dicotomizar [sic] variáveis contínuas [sic: intervalares]”.
Dancey & Reidy, 2019, p.6
Temos duas discordâncias:
A perda de eficiência estatistica de 33% devido à dicotomização é erroneamente atribuída a Streiner (2002), pois ele cita outro artigo com este resultado.
A dicotomização é justificável para efeito de comparação entre estudos.
“Na ausência de um ponto de corte pré-determinado, a abordagem mais comum é usar a mediana da amostra. Contudo, o uso da mediana da amostra implicará distintos pontos de corte, um para cada estudo, de forma que seus resultados não serão comparáveis e prejudicarão severamente a metanálise (https://en.wikipedia.org/wiki/Meta-analysis). […] Em vez de categorizar variáveis quantitativas, nós preferimos mantê-las quantitativas […] Como um exemplo, em uma análise de regressão para desenvolver um modelo de prognóstico para pacientes com cirrose biliar primária, um modelo que tomou bilirrubina* como uma variável quantitativa explicou 31% a mais da variabilidade dos dados do que quando seu ponto de corte adotado foi sua mediana.”
* bilirubina é um produto da degradação da hemoglobina, processada no fígado que a torna hidrossolúvel para a eliminação pelos rins.
As perdas de 31% devido à dicotomização pela mediana, ou valor próximo aos 33% (atribuído erroneamente a Steiner, 2002), vieram de determinados estudos específicos, mas têm sido tomadas como regra geral na literatura.
https://journals.sagepub.com/doi/abs/10.3102/1076998614524597
“Neste artigo, nosso propósito não é defender nem condenar dicotomização, mas simplesmente estudar sua repercussão no valor de um tamanho de efeito. […] Observamos que a dicotomização pela mediana de uma distribuição normal faz a correlação decrescer por um fator de \(\sqrt{\pi / 2 } \approx 1.25\) e aumentar o logaritmo do odds ratio por um fator de \(\sqrt{ 2 } \approx 1.41\).”
Não é proibido dicotomizar pela mediana ou por qualquer outro critério, desde que devidamente justificado.
Estudos que adotaram a dicotomização não devem ser sumariamente condenados.
A variável independente (VI) é uma variável observável que pode ser controlada pelo pesquisador e supostamente tem efeito sobre a VD.
A variável dependente ou de desfecho (VD) é uma variável observável que supostamente é afetada pela VI.
Exemplo:
Um pesquisador da área da saúde está interessado em medir o número de comportamentos agressivos em adolescentes com depressão maior tendo, como controle, grupo de adolescentes não depressivos.
Considere o seguinte estudo (Dancey & Reidy, 2019):
Pesquisadores interessados em saber se os cães facilitam ou não as interações sociais entre os adultos realizaram quatro estudos diferentes em que pesquisadores do sexo masculino e feminino caminharam com e sem cachorros.
Em dois estudos, o pesquisador abordou pessoas e pediu algum dinheiro, em outro estudo o pesquisador deixou cair algumas moedas para ver se as pessoas ajudariam a pegá-las e, em um estudo final, um pesquisador do sexo masculino abordou mulheres na rua e pediu-lhes números de telefone. Em cada estudo, o pesquisador realizou as tarefas com e sem cães.
Em todos os quatro estudos descobriram que os comportamentos de ajuda eram mais frequentes quando o pesquisador tinha um cachorro.
Dancey & Reidy definem:
“Uma variável de confusão é um tipo específico de variável estranha que está relacionado a ambas as variáveis principais em que estamos interessados.”
“A explicação científica é uma explicação por meio de leis e não necessariamente por meio de causas.”
Rosenberg, 1976, p.27-8
Uma forma de estudar causas é iniciar pela correlação entre variáveis.
A correlação é condição necessária, mas não suficiente para estabelecer causalidade.
Exemplo:
Existe correlação entre ansiedade estatística e procrastinação acadêmica?
Procrastinação: Atraso voluntário de um curso de ação pretendido (com ou sem prazo) com expectativa de punição (estresse, perda de produtividade, culpa, vergonha etc.) |
Ansiedade estatística é um construto multidimensional definido por seis componentes:
Onwuegbuzie (2004), Steel (2007)
Quando existe correlação entre variáveis, o que a explica?
Segundo Rosenberg (1976), a relação entre duas variáveis observáveis ou manifestas pode ser classificada como simétrica, assimétrica ou recíproca alternada.
Apenas uma das variáveis causa a outra. A análise de relações assimétricas constitui o cerne da análise epidemiológica e etiológica. As características sociodemográficas de uma pessoa podem causar comportamentos e doenças, tais como tabagismo, depressão, câncer etc. Se a relação é assimétrica, tende-se a introduzir uma terceira variável (variável de teste) na relação com o objetivo de entendê-la melhor.
Neuroticismo ou Instabilidade emocional é um dos cinco fatores da escala de personalidade Big Five (https://en.wikipedia.org/wiki/Big_Five_personality_traits). |
Ambas as variáveis se causam em decorrência de um processo dinâmico de causação mútua. Nesse tipo de relação as duas variáveis são ao mesmo tempo causa e efeito uma da outra.
As duas variáveis podem estar associadas, mas uma variável não causa a outra. Pode haver associação entre transpiração palmar e batimento cardíaco, mas uma não é a causa da outra. A causa comum de ambas as variáveis pode ser a ansiedade. Nesse tipo de relação, em geral, as duas variáveis são consequências de uma variável comum.
Exemplos de hipótese de pesquisa:
\(H_a:\) há associação entre ansiedade estatística e procrastinação acadêmica entre estudantes de graduação de psicologia da USP.
\(H_b:\) há efeito da exposição ao cigarro no desenvolvimento do câncer de pulmão em homens adultos brasileiros.
\(H_c:\) há agravamento da colite induzida por DNBS (ácido dinitrobenzenossulfônico) em ratos expostos ao cigarro.
\(H_d:\) o uso de bloqueador ganglionar (hexametônio) impede o agravamento da colite induzida por DNBS (ácido dinitrobenzenossulfônico) em ratos expostos ao cigarro.
Galeazzi et al. (1999): https://doi.org/10.1016/S0016-5085(99)70346-X
O delineamento experimental é o delineamento de referência para estudar causalidade. Cabe ressaltar que os experimentos são oriundos das Ciências Básicas, do ambiente laboratorial, onde o pesquisador procura ter o máximo de controle sobre os fatores que interagem na determinação da causalidade.
Por questões éticas, a maior parte dos estudos em seres humanos não podem ser do tipo de delineamento experimental. Por isso, desenvolveram-se delineamentos aproximativos ao experimental: delineamentos quase-experimentais e os observacionais.
Estudos experimentais e observacionais diferem também em relação ao tempo decorrido entre supostos agentes causais e suas consequências. Por exemplo, quando o cigarro começou a se popularizar no início do século XX, a abordagem experimental não ajudou muito, pois experimentos estabelecem relações mais imediatas entre um agente causal e seu desfecho. A observação em populações do tempo decorrido entre a adoção do cigarro e o aumento da incidência de doenças desencadeou o desenvolvimento da epidemiologia moderna, correlacionando possíveis fatores de exposição ou de proteção e desfechos que podem acontecer vários anos depois. Uma das coortes mais famosas, um estudo eminentemente observacional, é a de Framinghan.
Conforme Hulley et al. (2015, cap.9), a maioria dos estudos observacionais (correlacionais) têm como objetivo mostrar que uma variável de exposição (VE) é causa do desfecho (VD).
Dancey & Reidy, 2019, p.12
No delineamento correlacional não há intervenção planejada do pesquisador sobre os participantes do estudo.
Exemplo:
\(H_1:\) há associação entre ansiedade estatística e procrastinação acadêmica entre estudantes de graduação de psicologia da USP.
Seis estudantes de psicologia foram avaliados por itens Likert com cinco categorias agrupados em dois questionários, para ansiedade estatística e procrastinação acadêmica. O objetivo é verificar se há correlação entre estas duas variáveis.
Participantes Ansiedade estatística Procrastinação acadêmica
1 P1 55 125
2 P2 59 132
3 P3 48 94
4 P4 60 110
5 P5 62 140
6 P6 50 96
No delineamento experimental há intervenção planejada e randomizada do pesquisador sobre os participantes do estudo.
Exemplo:
“O tabagismo tem um efeito complexo na inflamação intestinal, sendo protetor na colite ulcerativa, ao passo que agrava a doença de Crohn. O efeito benéfico do tabagismo tem sido atribuído à nicotina, mas os mecanismos subjacentes ao efeito adverso ainda estão sob investigação. O objetivo deste estudo foi examinar o efeito do tabagismo de cigarro na colite experimental em ratos e investigar o mecanismo subjacente.”
Galeazzi et al. (1999): https://doi.org/10.1016/S0016-5085(99)70346-X
\(H_1:\) há agravamento da colite induzida por DNBS (ácido dinitrobenzenossulfônico) em ratos expostos ao cigarro.
Ratos foram alocados aleatoriamente em dois grupos (fumo e controle). Os ratos do grupo “fumo” foram expostos à fumaça de cigarro em câmeras especiais por 17 dias e os do grupo “controle” apenas colocados nas câmeras sem a inalação do fumo. No 15o dia todos os ratos tiveram indução de colite pela administração de DNBS e sacrificados após 3 dias para avaliação da inflamação. O escore microscópico considerou perda da arquitetura da mucosa, infiltrado celular, espessura da parede muscular, presença/ausência de criptas e de células Goblet (pontuação discreta de 0 para ausência de dano a 11 para o dano máximo).
Estes dados foram fabricados; não são os do artigo.
Animal Grupo Escore microscopico
1 1 Fumo 5
2 2 Fumo 7
3 3 Fumo 9
4 4 Fumo 6
5 5 Fumo 10
6 6 Fumo 8
7 7 Controle 3
8 8 Controle 4
9 9 Controle 5
10 10 Controle 6
11 11 Controle 4
Esquema aleatório, em geral, de atribuição das condições experimentais às unidades experimentais do estudo (condições independentes) ou da ordem de aplicação das condições às mesmas unidades experimentais (condições dependentes). A randomização, ao distribuir aleatoriamente os participantes entre os grupos de intervenção, tende a equilibrar em média tanto as variáveis de confusão conhecidas quanto as desconhecidas. Isso reduz o viés de confusão e aumenta a validade interna do estudo. Na prática, randomização não garante equilíbrio perfeito em cada amostra, mas é a melhor forma de neutralizar confundidores sem precisar conhecê-los ou medi-los. Vídeo: https://www.youtube.com/watch?v=sbOBlHcdYg0 Uma maneira de garantir alocação aleatória balanceada dos
participantes em grupos do mesmo tamanho é usar a função
Por exemplo, duas drogas em estudo com 10 participantes:
Este pacote tem várias outras funções, como
É comum existirem resumos de vários pacotes do R, conhecidas como
cheat sheets, para ajudar a lembrar das sintaxes das funções.
Para o pacote Além dos estudos que são feitos em laboratório com animais, também os ensaios clínicos randomizados (RCT) com humanos são delineamentos experimentais. Para estes estudos, existe outro pacote do R,
Nesta figura, oito participantes são alocados aleatoriamente de maneira balanceada a duas condições independentes (e.g., grupos controle e tratamento). Em seguida, os participantes são submetidos à avaliação da variável de desfecho antes a após uma intervenção planejada pelo pesquisador. A randomização controla (em média) o efeito das variáveis de confusão conhecidas e desconhecidas pelo pesquisador. O delineamento pré-pós controla os efeitos idiossincráticos dos participantes criando uma linha de base para teste do efeito da intervenção na variável de desfecho nos grupos controle e tratamento. |
No delineamento quase-experimental há intervenção planejada do pesquisador sobre os participantes do estudo, mas não há randomização. Isto ocorre porque o participante é auto-alocado em um grupo devido às suas características (e.g., sexo, idade, profissão, naturalidade etc.)
Exemplo:
Retomando o exemplo da somatometria de homens adultos, um pesquisador pretende estudar a influência de dois tratamentos sobre a glicemia de jejum em pacientes internados em dois hospitais de São Paulo. O primeiro hospital continuará com o tratamento tradicional (grupo controle), e um novo tratamento será oferecido no segundo hospital.
\(H_1:\) o novo tratamento é mais eficiente em reduzir glicemia do que o tratamento tradicional.
Portanto, sem ser possível buscar participantes na população geral, os que estão disponíveis para o estudo serão autoalocados em dois grupos, provenientes de cada um dos hospitais, impedindo a randomização.
Os dois grupos (condições independentes) serão formados:
estatura | estatura.cat | estcivil | mct | imc | imc_classe | imc_dicot | hospital |
---|---|---|---|---|---|---|---|
164 | intermediária | casado | 77 | 28.6 | Sobrepeso | Anormal | A |
168 | intermediária | solteiro | 69 | 24.4 | Normal | Normal | A |
186 | alta | solteiro | 103 | 29.8 | Sobrepeso | Anormal | A |
171 | intermediária | solteiro | 99 | 33.9 | Obesidade I | Anormal | A |
171 | intermediária | divorciado | 113 | 38.6 | Obesidade II | Anormal | A |
187 | alta | solteiro | 106 | 30.3 | Obesidade I | Anormal | B |
175 | intermediária | casado | 60 | 19.6 | Normal | Normal | B |
157 | baixa | casado | 44 | 17.9 | Subpeso | Anormal | B |
163 | intermediária | viúvo | 77 | 29.0 | Sobrepeso | Anormal | B |
166 | intermediária | solteiro | 34 | 12.3 | Subpeso | Anormal | B |
Devemos atribuir com segurança os resultados da VD do estudo aos efeitos das VI:
Há dois tipos de controle que contribuem para a validade interna por meio da equalização dos grupos controle e experimental (Cozby, 2003 e Townsend, 1953).
Hulley et al., 2006, p. 128
Exemplo:
um estudo observacional mostra que tomar café (TC) está associado ao infarto do miocárdio (IM), com razão de riscos (RR) igual a 2, i.e., a probabilidade de ter IM dobra devido a TC relativamente a não-TC. Além da relação de causa-efeito (e.g., relação existente na população tal que TC causa IM), há outras quatro possíveis explicações alternativas para a relação assimétrica entre duas variáveis (VI causa VD).
[1] Acaso (erro aleatório) e [2] viés (erro sistemático)
Produzem efeito de TC em IM na amostra, sendo que ele não existe na população.
[3] Efeito-causa
Produz o efeito entre TC e IM na amostra que também existe na população, mas não é causal na direção de interesse (IM causa TC).
[4] Confusão
A terceira variável Tabagismo é a causa real do IM, sendo que TC é uma variável espectadora dessa causação. Para estabelecer que a relação causa-efeito é a explicação mais provável é necessário descartar as outras quatro explicações.
Conforme Rosenberg (1976), estritamente falando, não existem relações espúrias; existem interpretações espúrias.
É, contudo, habitual usar a expressão “relação espúria” para aludir ao caso em que não há ligação significativa ou inerente entre as duas variáveis.
A relação se deve, apenas, ao fato de cada uma das variáveis estar acidentalmente associada à alguma outra variável.
Trata-se de uma relação que, à primeira vista, parece assimétrica, mas que, uma análise mais profunda, revela-se simétrica (e.g., dois indicadores do mesmo conceito, duas consequências da mesma causa, dois elementos de uma unidade funcional, duas manifestações de um complexo ou dois fatores fortuitamente associados).
Exemplos:
Na Suécia existe a relação entre o número de cegonhas numa área e o número de crianças nascidas na mesma área. A maioria das cegonhas encontram-se em área rurais da Suécia e o índice de nascimento, nessas áreas, é superior ao das áreas urbanas.
Se existe uma relação positiva entre o número de bombeiros que atendem a um incêndio e a extensão do dano produzido, não se pode concluir que os bombeiros causem o dano. O motivo da relação entre o número de bombeiros e a extensão dos danos é a extensão do incêndio: grandes incêndios exigem maior número de bombeiros e também causa maiores danos.
Dempster & Hanna, 2016
Validade externa é uma maneira de garantir a generalização das relações encontradas em amostra para a população. Para tanto, a amostra precisa ser representativa da população de onde foi obtida.
Vídeo: Types of Sampling Methods
Em R, há algumas alternativas para obter amostras aleatórias sem reposição de dataframe.
sample
Existem dataframes com dados disponíveis para uso no R. Aqui
usaremos iris
que contém dados sobre medidas em flores.
Digite ?iris
na Console se quiser saber mais.
O conteúdo deste dataframe começa com
'data.frame': 150 obs. of 5 variables:
$ Sepal.Length: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...
$ Sepal.Width : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
$ Petal.Length: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
$ Petal.Width : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
$ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...
Sepal.Length Sepal.Width Petal.Length Petal.Width
Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100
1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300
Median :5.800 Median :3.000 Median :4.350 Median :1.300
Mean :5.843 Mean :3.057 Mean :3.758 Mean :1.199
3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800
Max. :7.900 Max. :4.400 Max. :6.900 Max. :2.500
Species
setosa :50
versicolor:50
virginica :50
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
1 5.1 3.5 1.4 0.2 setosa
2 4.9 3.0 1.4 0.2 setosa
3 4.7 3.2 1.3 0.2 setosa
4 4.6 3.1 1.5 0.2 setosa
5 5.0 3.6 1.4 0.2 setosa
6 5.4 3.9 1.7 0.4 setosa
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
145 6.7 3.3 5.7 2.5 virginica
146 6.7 3.0 5.2 2.3 virginica
147 6.3 2.5 5.0 1.9 virginica
148 6.5 3.0 5.2 2.0 virginica
149 6.2 3.4 5.4 2.3 virginica
150 5.9 3.0 5.1 1.8 virginica
O número total de linhas do dataframe iris
é
[1] 150
Para obter uma amostra de 5 linhas aleatoriamente escolhidas, sem reposição, experimente:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
14 4.3 3.0 1.1 0.1 setosa
50 5.0 3.3 1.4 0.2 setosa
118 7.7 3.8 6.7 2.2 virginica
43 4.4 3.2 1.3 0.2 setosa
150 5.9 3.0 5.1 1.8 virginica
Neste exemplo, as linhas 14, 50, 118, 43 e 150 foram selecionadas para a amostra.
sampling::srswor
Este é outro pacote do R, dedicado às técnicas de amostragem.
Por exemplo, a amostragem aleatória simples sem reposição com este pacote é obtida com:
Sepal.Length Sepal.Width Petal.Length Petal.Width Species
25 4.8 3.4 1.9 0.2 setosa
27 5.0 3.4 1.6 0.4 setosa
38 4.9 3.6 1.4 0.1 setosa
79 6.0 2.9 4.5 1.5 versicolor
122 5.6 2.8 4.9 2.0 virginica
sendo que os dois parâmetros são n
para o tamanho da
amostra e N
para o tamanho do arquivo de onde a amostra
será extraída.
Dempster & Hanna (2016)
Dancey & Reidy, 2019, cap. 1
Dempster & Hanna (2016)
Dancey & Reidy, 2019, cap. 1
Dempster & Hanna (2016)
Consulte Alferes
(1997) e o pacote agricolae
para estudar e aplicar
contrabalanceamento.
Pharoah, 2016
Porta (2014) |
Exposição A variável cujo efeito causal deve ser estimado. Exemplos de exposições avaliadas por estudos epidemiológicos são fatores ambientais e de estilo de vida, condições socioeconômicas e de trabalho, tratamentos médicos e características genéticas. As exposições podem ser prejudiciais ou benéficas - ou mesmo ambas (por exemplo, se uma doença imunizável estiver circulando, a exposição a agentes imunizantes ajuda a maioria dos receptores, mas pode prejudicar aqueles com reações adversas à vacina). Proximidade e/ou contato com uma fonte de um agente de doença de tal maneira que a transmissão efetiva do agente ou efeitos prejudiciais do agente possam ocorrer. A quantidade de um fator a que um grupo ou indivíduo foi exposto; às vezes contrastada com a dose, a quantidade que entra ou interage com o organismo. O processo pelo qual um agente entra em contato com uma pessoa ou animal de tal forma que a pessoa ou animal pode desenvolver o resultado relevante, como uma doença. Desfecho Todos os resultados possíveis que podem decorrer da exposição a um fator causal ou de intervenções preventivas ou terapêuticas. Todas as mudanças identificadas no estado de saúde decorrentes do manejo de um problema de saúde. |
Ward (2012) |
Um aspecto importante da epidemiologia é identificar, descrever e
quantificar os fatores que aumentam ou diminuem o risco de doença ou
morte. Se descobrirmos que um determinado fator ou exposição, por
exemplo, fumar ou tomar um medicamento está associado ao risco de um
determinado resultado de saúde, podemos então avaliar se a associação é
provável ou não causal e postular mecanismos causais. Mesmo na ausência
de mecanismos causais estabelecidos, a evidência de associação pode
orientar as políticas e ações de saúde pública, e a prática clínica,
para reduzir o risco de doença ou morte e proteger, restaurar e promover
a saúde. Exposição Descreve algo que pode afetar um resultado. Na análise estatística, as exposições são variáveis explicativas ou independentes. Pode referir-se a um perigo ambiental ou agente infeccioso, mas também é usado em epidemiologia para descrever outros fatores, tais como um fator genético, e. tipo de antígeno leucocitário humano (HLA) ou característica demográfica, como etnia. A exposição de interesse primário é aquela que está incluída na hipótese sob investigação, e se a hipótese é que a aflatoxina causa câncer de fígado, então a aflatoxina é a exposição primária de interesse. Em contraste, se a hipótese é que a capacidade do indivíduo de metabolizar aflatoxina determina seu risco de câncer de fígado, então o fenótipo ou genótipo da enzima metabólica é a exposição. Desfecho É usado em sentido amplo; pode ser doença, morte ou recuperação. Alguns estudos, principalmente coortes, podem observar vários resultados em relação a uma ou mais exposições. Na análise estatística, os resultados são respostas ou variáveis dependentes. |
Fator de proteção [estudo etiológico de eficácia] é um comportamento claramente definido ou constitucional (por exemplo, genético), psicológico, ambiental ou outra característica que está associado a uma probabilidade reduzida de que uma doença ou distúrbio específico se desenvolva em um indivíduo, que reduz a gravidade de um patológico existente doença ou que atenua os efeitos do estresse em geral. Por exemplo, praticar exercícios regularmente pode servir como um fator de proteção ao diminuir a probabilidade ou gravidade de doenças coronárias, hipertensão e depressão. Da mesma forma, redes sociais de apoio e habilidades positivas de enfrentamento são exemplos de fatores de proteção que reduzem os efeitos de eventos de vida estressantes e melhoram a saúde mental.
Fator de risco [estudo etiológico de maleficência] é um comportamento claramente definido ou característica constitucional (por exemplo, genética), psicológica, ambiental ou outra que está associada a uma maior possibilidade ou probabilidade de que uma doença ou distúrbio se desenvolva subsequentemente em um indivíduo.
Dicionário da APA: https://dictionary.apa.org/protective-factor
Fator de risco modificável (ou modifiable risk factor) é qualquer característica, condição ou comportamento que aumenta o risco de uma doença ou agravo, mas que pode ser alterado por intervenção — clínica, comportamental ou ambiental.
Exemplos clássicos:
São contrapostos aos fatores de risco não modificáveis ou fixos, como idade, sexo biológico e histórico familiar.
Em epidemiologia, distinguir esses tipos é essencial para planejar ações preventivas e políticas públicas de saúde.
Ward (2012)
A força da evidência no quadro anterior não está relacionado com o nível de qualidade do estudo, pois, por exemplo, o estudo de desfecho câncer de pulmão em humanos necessita de período de observação longo (décadas). Desfecho com latência curta pode ser estudo por meio de delineamento experimental, mas se a latência é longa, é necessário o delineamento observacional (e.g., coorte).
Unidade observacional: individuada ou agregada (espacial e/ou temporal);
Temporalidade do estudo: transversal/cross-sectional (delineamento entre participantes) ou longitudinal (com ou sem medidas repetidas);
Participação do pesquisador: não-intervencional ou intervencional, sendo que a intervenção deve ser planejada pelo pesquisador;
Seleção: em estudo observacional, a seleção das unidades observacionais é realizada por exposição ou desfecho; em estudo experimental, há o critério de atribuição de condição experimental à unidade observacional (e.g., randomização).
Estudos intervencionais em humanos envolvem maiores desafios éticos, financeiros e logísticos. A principal diretriz ética é o princípio da não maleficência.
Os delineamentos intervencionais em epidemiologia incluem:
O experimento laboratorial em humanos visa avaliar efeitos terapêuticos ou preventivos, com intervenção controlada e de curta duração.
Quando estudos intervencionais são inviáveis — por razões éticas, financeiras ou logísticas — recorremos a estudos observacionais como alternativa metodológica.
Esses delineamentos permitem investigar associações entre exposições e desfechos sem manipular variáveis, respeitando o princípio da não intervenção. São úteis especialmente em:
Apesar de mais suscetíveis a viés de confusão, os estudos observacionais — coorte, caso-controle e transversal — são fundamentais para gerar hipóteses, estimar riscos e embasar políticas públicas.
Um estudo transversal mede a prevalência de desfechos de saúde ou determinantes de saúde, ou ambos, em uma população em um determinado momento ou durante um curto período.
Essas informações podem ser usadas para explorar a etiologia.
E.g.: A relação entre a catarata e o status das vitaminas foi examinada em surveys transversais.
Coggon et al. Chapter 8. Case-control and cross-sectional studies
https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/
Em um estudo longitudinal, os indivíduos são acompanhados ao longo do tempo com monitoramento contínuo ou repetido de fatores de risco ou resultados de saúde, ou ambos. Essas investigações variam enormemente em tamanho e complexidade.
Em um extremo, uma grande população pode ser estudada ao longo de décadas.
Por exemplo, o estudo longitudinal do Office of Population Censuses and Surveys (OPCS) segue prospectivamente uma amostra de 1% da população britânica que foi inicialmente identificada no censo de 1971.
Desfechos como mortalidade e incidência de câncer foram relacionados à situação de emprego, moradia e outras variáveis medidas em censos sucessivos.
No outro extremo, alguns estudos longitudinais acompanham grupos relativamente pequenos por alguns dias ou semanas.
Assim, os bombeiros expostos de forma aguda a vapores nocivos podem ser monitorados para identificar quaisquer efeitos imediatos.
Nem todos os estudos longitudinais envolvem medidas repetidas da variável de desfecho. Um estudo longitudinal envolve o acompanhamento de um grupo de indivíduos ao longo do tempo para observar mudanças, desenvolvimentos ou eventos que ocorrem ao longo de suas vidas. Isso pode incluir medidas repetidas da variável de desfecho, mas nem sempre é o caso.
Um estudo de coorte é uma forma específica de estudo longitudinal em que os participantes são selecionados com base em sua exposição a um determinado fator e são acompanhados ao longo do tempo para observar o desenvolvimento de desfechos de interesse. Isso geralmente envolve medidas repetidas da variável de desfecho para avaliar como a exposição afeta o desfecho ao longo do tempo.
Portanto, embora muitos estudos longitudinais incluam medidas repetidas da variável de desfecho, nem todos são necessariamente delineados dessa maneira. Alguns estudos longitudinais podem se concentrar apenas na observação e acompanhamento ao longo do tempo, sem necessariamente envolver medidas repetidas da variável de desfecho.
Estudo de coorte é um tipo de estudo longitudinal. Os estudos longitudinais são projetados para acompanhar um grupo de indivíduos ao longo do tempo para observar mudanças, desenvolvimentos ou eventos que ocorrem ao longo de suas vidas.
No contexto de um estudo de coorte, os participantes são selecionados com base em sua exposição a um determinado fator e, em seguida, são acompanhados ao longo do tempo para observar o desenvolvimento de desfechos de interesse. Isso permite aos pesquisadores analisar a relação entre a exposição e os desfechos ao longo do tempo, o que é particularmente útil para identificar relações causais.
Em resumo, um estudo de coorte é uma forma específica de estudo longitudinal, onde os participantes são agrupados com base em sua exposição e acompanhados para avaliar os efeitos dessa exposição ao longo do tempo.
Coggon et al. Chapter 7. Longitudinal studies
Unidade observacional: individuada ou agregada
Participação do pesquisador: não intervencional ou intervencional
Temporalidade: longitudinal com medidas periódicas
“A essência do delineamento de série temporal é a presença de um processo periódico de medida em algum grupo ou indivíduo e a introdução de uma mudança experimental nessa série temporal de medidas, cujos resultados são indicados por uma descontinuidade nas medidas registradas na série temporal.”
Campbell & Stanley, 1969, p. 67
Os delineamentos de séries temporais, em que uma mesma área ou população (unidade observacional agregada), é estudada em momentos distintos e periódicos de tempo (e.g., anualmente), são classificados como um subtipo de estudo ecológico (ecológico temporal), sendo que cada unidade de tempo consiste numa unidade ecológica completa.
O estudo com delineamento ecológico tem a capacidade de gerar hipótese temporal.
O estudo ecológico temporal consiste em analisar o tabagismo numa localidade em épocas distintas, e.g., consumo de cigarro per capita e taxa de mortalidade por câncer de pulmão nos anos 1970 e nos anos 2000 no estado de São Paulo. Se for verificado, por exemplo, que em 2000 morre mais gente que consumiu mais, pode-se levantar a hipótese de que o câncer está associado ao tabagismo. É uma hipótese, porque o estudo não foi realizado no nível individual.
O ensaio clínico ou ensaio controlado randomizado (RCT) é um delineamento experimental em condições controladas no qual os participantes individuais são alocados aleatoriamente aos tratamentos controle e de interesse do pesquisador e uma intervenção é realizada nos dois tratamentos com avaliação da variável de desfecho pré e pós-intervenção.
O objetivo desse delineamento é gerar dois grupos equivalentes com o intuito de testar o efeito específico do tratamento de interesse relativamente ao controle.
O ensaio clínico comunitário é ensaio randomizado no qual a unidade observacional é um agregado de participantes individuais.
https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/
A maioria dos estudos experimentais aloca e compara tratamentos entre sujeitos individuais, mas também é possível realizar intervenções experimentais no nível das populações. Já citamos um projeto de prevenção de doenças coronárias em que as unidades de estudo eram a força de trabalho de diferentes fábricas.
Como em estudos de indivíduos, as intervenções em populações podem ser alocadas aleatoriamente.
No entanto, se o número de populações em comparação for pequeno, a randomização pode não ter muito valor.
Em vez disso, pode ser melhor atribuir intervenções de uma forma deliberadamente planejada para garantir a máxima comparabilidade entre os diferentes grupos de intervenção.
O controle da confusão residual pode ser fortalecido pela comparação das populações de estudo e controle antes e depois da introdução da intervenção.
Coggon et al. Chapter 9. Experimental studies
O inquérito/ levantamento (survey) é o delineamento no qual cada indivíduo é avaliado simultaneamente para o fator de exposição e o desfecho (doença) em determinado momento. O inquérito pode ser comparado ou de determinação de prevalência.
No levantamento comparado, pelo menos dois estratos da mesma população têm o mesmo desfecho avaliado, e.g., mil indivíduos entre 18 e 35 anos foram selecionados aleatoriamente da população do município de São Paulo em 2017 e, em suas residências, responderam a um questionário sobre hábitos alimentares e tiveram a pressão arterial medida; 850 participaram efetivamente da pesquisa e foram classificados como consumidores de excesso de sal ou não e em hipertensos e não.
No inquérito de determinação de prevalência, o objetivo é estimar a porcentagem de casos novos e antigos da doença numa população numa época, e.g., identificar a prevalência de soropositividade para as hepatite B e C em gestantes atendidas em uma maternidade pública do município de Catalão-GO no período de 2005 a 2009, sendo que a prevalência de VHB foi de 5,64% e a de VHC, 0,098%, predominantemente em gestantes jovens, com idade entre 20 e 30 anos, solteiras e primigestas (Fernandes et al., 2014).
O fato de exposição e doença serem avaliados simultaneamente apresenta as seguintes dificuldades:
Os fatores de exposição podem variar ou não no tempo para o indivíduo. Alguns fatores de exposição fixos são o tipo sanguíneo, sexo, sistema antígeno leucocitário humano (HLA) etc. Outros fatores de exposição podem ser mutáveis, tais como etilismo, tabagismo, hábito alimentar, atividade física, estado civil etc.
O inquérito consiste numa boa fonte de hipóteses com maior força de evidência que o ecológico, mas persiste a dificuldade de determinação do liame causal entre a exposição e a doença.
Os inquéritos oferecem informações úteis ao chamar atenção para características ligadas com a frequência de uma determinada doença na comunidade ou em determinado serviço assistencial. Estes estudos, portanto, podem influenciar o raciocínio clínico e a tomada de decisões na prática médica.
Ao escolher o delineamento do estudo epidemiológico, deve ser considerado que os inquéritos, habitualmente, exigem menos recursos financeiros e podem ser realizados mais rapidamente do que os estudos de caso-controle ou coorte.
A coorte consiste numa população sadia definida por características geográficas e/ou temporais comuns na qual são observados, nas subpopulações de expostos e não-expostos aos fatores de risco, o surgimento de doenças de interesse mediante exames repetidos por um determinado período de tempo do passado (retrospectivo) ou futuro (prospectivo).
O delineamento de coorte pode ser comparado ou de análise de sobrevivência.
Coorte comparada: dois mil residentes de um bairro do município de São Paulo foram previamente classificados como diabéticos e não-diabéticos, e as taxas de mortalidade dos dois grupos foram acompanhadas por cinco anos.
Coorte de análise de sobrevivência: duzentos casos de febre amarela identificados em Jundiaí foram seguidos ao longo de cinquenta anos para análise de sobrevivência.
Os estudos de coorte podem ser usados para estimar a incidência, i.e., a quantidade de casos novos de uma doença registrados num período de tempo. O delineamento de estudo de coorte é um método de pesquisa utilizado na epidemiologia e em outras áreas da ciência para investigar relações de causa e efeito entre fatores de exposição e desfechos de interesse em uma população ao longo do tempo.
Nesse tipo de estudo, os participantes são selecionados com base na sua exposição a um determinado fator, como um tratamento médico, um comportamento de risco ou uma condição de saúde específica. Existem dois principais tipos de coortes:
Coorte Prospectiva: Nesse tipo de coorte, os participantes são identificados no início do estudo e são acompanhados ao longo do tempo para observar o desenvolvimento dos desfechos de interesse. A exposição dos participantes é medida antes do surgimento do desfecho. Esse tipo de estudo é útil para investigar a relação temporal entre a exposição e o desfecho.
Coorte Retrospectiva (ou Histórica): Nesse caso, os pesquisadores selecionam uma população com base na exposição ao fator de interesse e então analisam dados passados para identificar a ocorrência de desfechos. A exposição já ocorreu antes do início do estudo e os desfechos já podem ter ocorrido no momento em que a pesquisa começa.
O principal objetivo de um estudo de coorte é avaliar se a exposição a um fator está associada ao desenvolvimento de um desfecho específico. Isso permite aos pesquisadores avaliar a relação entre a exposição e o desfecho ao longo do tempo, controlando possíveis fatores de confusão (outros fatores que poderiam influenciar o desfecho) e calcular medidas de associação, como risco relativo ou taxa de incidência.
O delineamento de estudo de coorte é uma ferramenta poderosa para a investigação de relações causais em situações em que experimentos controlados não são éticos ou viáveis. No entanto, também apresenta desafios, como o acompanhamento adequado dos participantes ao longo do tempo e o controle de fatores de confusão que podem afetar os resultados.
https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/
Rivas-Ruiz et al., 2012
Coorte | País | População-alvo | Ondas | Variáveis principais | Acesso |
---|---|---|---|---|---|
UK Biobank | Reino Unido | Adultos (40–69 anos) | 2006–presente | Genômica, imagens, exames clínicos | Proposta online |
NHANES | EUA | População geral | Contínuo desde 1999 | Nutrição, exames laboratoriais, saúde | Livre |
Framingham Heart Study | EUA | Adultos e descendentes | 1948–presente | Fatores CV, mortalidade, ECG | Proposta via site |
HRS | EUA | Idosos (50+) | 1992–presente | Trabalho, saúde, cognição, renda | Cadastro online |
Add Health | EUA | Adolescentes (seguimento) | 1994–presente | Comportamento, saúde, escolaridade | Registro obrigatório |
CHARLS | China | Idosos (45+) | 2011–presente | Saúde, cognição, família, renda | Livre (registro) |
ELSA-Brasil | Brasil | Servidores públicos (35–74) | 2008–presente | CV, diabetes, saúde mental | Comitê de Acesso |
Coorte de Pelotas | Brasil | Recém-nascidos e mães | 1982, 1993, 2004, 2015 | Desenvolvimento infantil, escolaridade | Solicitação à equipe |
SABE | Brasil | Idosos (60+) | 2000, 2006, 2010, 2015 | Funcionalidade, saúde, mortalidade | Solicitação por e-mail |
PNS (IBGE) | Brasil | População geral | 2013, 2019 | Autopercepção, doenças, uso de serviços | Microdados IBGE |
O delineamento de caso-controle é um delineamento comparado no qual os indivíduos são previamente classificados nos grupos comparáveis de doentes (casos) e sadios (controles), sendo que em cada grupo são investigadas as durações e intensidades da exposição, e.g., selecionar 50 casos de câncer de pulmão (casos) e 50 casos sem câncer de pulmão (controles) e questionar sobre a duração (anos) e intensidade (cigarros/dia) do tabagismo (exposição).
Esse tipo de delineamento facilita o estudo de doenças raras.
O estudo de caso-controle não é equivalente ao estudo de coorte retrospectiva e, portanto, não pode ser usado para determinar a incidência da doença.
https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/
O estudo ecológico espacial consiste em analisar diferentes localidades na mesma época, e.g., consumo de bebida alcoólica per capita e taxa de mortalidade por câncer hepático em 2015 nos estados de São Paulo e Paraná.
O estudo com delineamento ecológico tem a capacidade de gerar hipótese temporal ou espacial.
O estudo ecológico temporal consiste em analisar o tabagismo numa localidade em épocas distintas, e.g., consumo de cigarro per capita e taxa de mortalidade por câncer de pulmão nos anos 1970 e nos anos 2000 no estado de São Paulo. Se for verificado, por exemplo, que em 2000 morre mais gente que consumiu mais, pode-se levantar a hipótese de que o câncer está associado ao tabagismo. É uma hipótese, porque o estudo não foi realizado no nível individual.
A falácia ecológica consiste em afirmar que a associação entre uma exposição e um desfecho em nível populacional acarreta sua presença no nível individual.
Estudos com delineamentos ecológicos ajudam a identificar fatores de exposição que merecem pesquisa mais detalhada por meio de estudos individuados.
E.g., a verificação de uma relação entre venda de cigarros per capita e mortalidade de doença cardiovascular (DCV) em estudos ecológicos pode motivar o planejamento de estudos caso-controle e coorte que possam mostrar de forma bem mais convincente que o tabagismo é um dos fatores determinantes de DCV, particularmente doença coronariana e acidente vascular cerebral.
Os delineamentos de séries temporais, em que uma mesma área ou população (unidade observacional agregada), é estudada em momentos distintos e periódicos de tempo (e.g., anualmente), são classificados como um subtipo de estudo ecológico (ecológico temporal), sendo que cada unidade de tempo consiste numa unidade ecológica completa.
Exemplos:
https://open.oregonstate.education/epidemiology/chapter/study-designs-revisited/
Friedman, 1967
Morgenstern, 1995
Existe uma conexão natural entre o delineamento do estudo e os métodos estatísticos mais adequados para testar as hipóteses de pesquisa. O delineamento restringe os testes que podem ser utilizados. Reversamente, escolher um método estatístico pode definir quais os tipos de variáveis e como serão medidas, o que impõe o delineamento.
Quanto mais experimental for o delineamento (controles experimentais), mais simples pode ser o método estatístico. Em delineamentos mais observacionais, os controles terão que ser estatísticos, exigindo métodos mais elaborados, necessitando de mais variáveis de confusão conhecidas.
Dancey & Reidy, 2019, p. 17
Os testes estatísticos elencados nesta tabela (testes paramétricos z, t, ANOVA unifatorial, ANCOVA pré-pós, de correlação de Pearson e testes não-paramétricos de correlação de Spearman, U de Mann-Whitney, W de Wilcoxon, H de Kruskal-Wallis, Q de Friedman) verificam a relação direta entre VI e VD, sem controles estatísticos.
Discordamos, portanto, da tabela deste livro. Embora não seja proibido usar os testes simples em delineamentos mais complexos, o pesquisador corre o risco de detectar efeitos devidos às variáveis de confusão não controladas e interpretar os resultados obtidos como se o efeito viesse do que supõe ser a VI ligada à sua hipótese de pesquisa.
Não recomendamos os testes não-paramétricos mesmo para delineamento experimental.
Modelo Linear Geral (GLM: https://en.wikipedia.org/wiki/General_linear_model) é mais adequado para analisar o efeito da VI sobre a VD com o uso de variáveis de confusão diretamente, sendo, portanto, mais adequado para delineamento correlacional ou quase-experimental.
Unidade observacional (UO) é o elemento no qual se observam ou medem variáveis, sem intervenção do pesquisador.
Exemplo: pacientes em um estudo transversal.
Unidade experimental (UE) é o elemento que recebe uma intervenção (tratamento, estímulo etc.).
Exemplo: pacientes em um experimento com fármaco.
Às vezes coincidem, mas não necessariamente.
Exemplo: em um ensaio clínico com intervenção por hospital, a unidade experimental é o hospital, mas a unidade observacional pode ser o paciente.
Unidade observacional e unidade experimental não são sinônimos, embora possam coincidir em alguns delineamentos.
Diferença essencial:
Exemplo:
Em um estudo de vacinação escolar:
Se a vacina fosse randomizada por aluno, então aluno = unidade experimental = unidade observacional.
Portanto, nem sempre são iguais, e confundir os dois compromete o delineamento estatístico e a análise.
Num estudo do efeito de uma droga no fígado humano, posso analisar os dados do paciente, do fígado inteiro, do lóbulo, da lâmina do lóbulo e da célula (e.g.: diâmetro). Há então níveis de unidade observacional e experimental.
Neste caso, há múltiplos níveis hierárquicos de unidades observacionais — e possivelmente também de unidades experimentais, dependendo de como o tratamento (droga) é aplicado.
A descreveu um modelo de dados aninhado (nested):
Paciente
Se você mede, por exemplo, diâmetro celular, cada medida é uma unidade observacional de célula, mas está dependente hierarquicamente do paciente.
Depende de quem recebe a droga:
Ignorar a hierarquia viola independência e superestima tamanho amostral.
Soluções:
O cálculo do tamanho da amostra deve ser feito com base no número de unidades experimentais, não nas observacionais, pois a unidade experimental é aquela que recebe a intervenção (ou tratamento) de forma independente. O número de graus de liberdade da inferência estatística depende disso.
Exemplo:
O pesquisador mede o diâmetro de 1000 células hepáticas de 5 pacientes tratados com uma droga.
Tamanho da amostra = 5, não 1000.
Portanto, você tem \(n=5\) unidades experimentais e não pode fazer inferência estatística válida sobre o efeito da droga com base nas 1000 medidas, pois estão dependentes.
Conclusão:
Sempre calcule o tamanho da amostra com base nas unidades experimentais. Se usar as observacionais, incorre em pseudorrepetição e inflaciona artificialmente o poder do teste.
A população-alvo das unidades experimentais é definida diretamente pelos critérios de inclusão e exclusão do estudo.
Ou seja:
Exemplo:
Se a droga for administrada ao paciente, então:
Implicação:
Inferência causal ou generalização dos resultados só é válida para a população definida pelas unidades experimentais elegíveis, não pelas unidades observacionais (como células, biópsias, imagens etc.).
São condições necessárias para que um indivíduo possa participar do estudo como unidade experimental. Definem a população-alvo.
Exemplos:
Esses critérios devem delimitar quem pertence ao universo de interesse da pesquisa.
São restrições adicionais que removem participantes da população elegível, mesmo que cumpram os critérios de inclusão. Evitam viés, riscos ou confundimento.
Exemplos:
Não definem a população-alvo, mas refinam a amostra por razões metodológicas ou éticas.
Exemplo: Assinar TCLE é critério de inclusão ou exclusão?
Assinar o TCLE (Termo de Consentimento Livre e Esclarecido) não é critério de inclusão nem de exclusão técnico, no sentido metodológico. É uma exigência ética e legal prévia à participação em qualquer estudo com seres humanos.
No entanto, na prática regulatória, considera-se:
Critério de inclusão operacional:
Só participa quem assina o TCLE. Logo, muitas vezes ele aparece como o primeiro item da lista de inclusão:
“Assinar voluntariamente o Termo de Consentimento Livre e Esclarecido.”
Mas isso é apenas uma condição formal de elegibilidade ética, não um critério científico.
Na área médica, o termo “estudo do mundo real” (real-world study) é usado para enfatizar que os dados refletem a prática clínica habitual, fora das condições controladas de ensaios clínicos randomizados (RCT).
Porque muitos estudos observacionais são feitos em contextos acadêmicos ou artificiais, com seleção rigorosa, monitoramento intensivo etc.
Já os estudos de “real-world evidence” (RWE):
Exemplo:
Conclusão:
Todo estudo de mundo real é observacional, mas nem todo observacional é “mundo real”. A distinção é menos sobre o delineamento e mais sobre o contexto e a fonte dos dados.
Na maioria dos estudos observacionais, correlacionais ou de mundo real, sim: unidade experimental = unidade observacional, porque não há intervenção controlada pelo pesquisador.
Ou seja:
Portanto:
Exceções:
Se o estudo observacional for hierárquico (e.g.: dados de alunos dentro de escolas), ainda assim pode haver unidades observacionais aninhadas, mas sem unidade experimental no sentido clássico.
Conclusão:
Sim, em estudos de mundo real (sem intervenção), UE = UO por default, pois só há observação. Mas o termo unidade experimental perde o sentido nesses delineamentos.
Exemplos concretos e comparativos para deixar clara a diferença entre estudo observacional e estudo do mundo real (RWE):
Um RCT pragmático (Randomized Controlled Trial Pragmático) é um ensaio clínico randomizado desenhado para avaliar a efetividade de uma intervenção na prática clínica real, e não apenas sua eficácia em condições ideais.
Diferença central:
Características do RCT pragmático:
Exemplo:
Um estudo pragmático pode comparar dois anti-hipertensivos em pacientes de UBSs, com randomização simples, sem exames extras nem visitas específicas — tudo acompanhado via prontuário eletrônico.
Ferramenta para avaliar: PRECIS-2
Permite pontuar o grau de “pragmatismo” de um ensaio em 9 domínios (elegibilidade, aderência, flexibilidade, desfecho etc.).
Conclusão:
RCT pragmático ≠ estudo observacional.
É randomizado, mas reflete o mundo real. Tem alta validade externa, sem sacrificar a validade interna. Ideal para orientar decisões em políticas públicas e medicina baseada em evidência do cotidiano.
Os 9 domínios do PRECIS-2 (Pragmatic-Explanatory Continuum Indicator Summary 2) servem para classificar um ensaio clínico randomizado ao longo do espectro pragmático–explicativo, ou seja, o quanto ele reflete a prática clínica real.
Aqui estão os domínios:
Elegibilidade
Quão restritivos são os critérios de inclusão/exclusão?
(Mais restrito → mais explicativo)
Recrutamento
Como os participantes são convidados?
(Convite especial, fora da rotina → explicativo)
Configuração
Onde o estudo é conduzido?
(Ambiente clínico comum = pragmático; centro de excelência = explicativo)
Organização
Recursos e infraestrutura necessários para executar a intervenção.
(Requer estrutura extra = explicativo)
Flexibilidade na entrega da intervenção
O tratamento é dado de forma rígida ou conforme o dia a dia?
(Protocolos rígidos = explicativo)
Flexibilidade no comportamento do participante Participantes precisam seguir instruções estritas? (Se sim, é mais explicativo)
Acompanhamento (Follow-up)
Feito conforme a rotina clínica ou exige exames/visitas extras?
(Exames adicionais = explicativo)
Desfechos primários
São clinicamente relevantes e fáceis de obter?
(Desfecho laboratorial ou surrogate = explicativo)
Análise primária
Intenção de tratar (ITT) ou por protocolo?
(ITT = mais pragmático; por protocolo = mais explicativo)
Cada domínio é avaliado numa escala de 1 (muito explicativo) a 5 (muito pragmático).
Aqui está uma aplicação dos 9 domínios do PRECIS‑2 a um estudo pragmático de hipertensão como o LIGHT trial, conduzido na atenção primária na China, que implementou um sistema de suporte à decisão clínica (CDSS) para prescrição de antihipertensivos ([BioMed Central][1]):
Pacientes ≥ 18 anos com hipertensão são atendidos em unidades básicas de saúde; unidades (clusters) foram randomizadas para usar o CDSS ou cuidado usual. Dentro do sistema, um subestudo randomizou pacientes a diferentes regimes antihipertensivos (LIGHT‑ACD) (Song et al., 2022).
Avaliação PRECIS‑2 nos 9 domínios:
Domínio | Avaliação (1=explicativo → 5=pragmático) | Justificativa |
---|---|---|
1. Elegibilidade | 5 | Critérios amplos: adultos com HTA, sem cardiopatia ou DRC grave; poucas exclusões clínicas |
2. Recrutamento | 5 | Entrada via consulta rotineira na UBS; sem convite externo ou seleção especial |
3. Ambiente de estudo | 5 | Atendido e recrutado no setting clínico habitual (UBS) ) |
4. Organização | ~4 | CDSS integrado ao EHR existente; exige infraestrutura mínima, mas baseada na rotina |
5. Flexibilidade na entrega | 5 | Médicos e pacientes seguem prática usual, com suporte discreto do CDSS |
6. Flex. no comportamento | ~4–5 | Atenção consultório usual, pouca exigência adicional de adesão rigorosa |
7. Acompanhamento | 5 | Merece mínimo impacto: coleta via EHR, visitas de rotina; sem exames extras |
8. Desfecho primário | 5 | Proporção de consultas com prescrição conforme diretrizes: desfecho clínico rotineiro |
9. Análise primária | 5 | Análise por intenção de tratar em cluster (cupom usual) – retém pragmatismo |
Conclusão:
O LIGHT trial é altamente pragmático (escore médio entre 4 e 5) em todos os domínios do PRECIS‑2, estando bem alinhado com a prática clínica real. Exemplifica um ensaio randomizado moderno que combina randomização, dados de rotina e validade externa forte, sem perder rigor interno.
ITT (Intention-to-Treat, ou “intenção de tratar”) é o princípio de análise segundo o qual todos os participantes randomizados devem ser analisados nos grupos aos quais foram originalmente atribuídos, independentemente do que ocorreu depois (aderência, desvio, perda, troca de grupo etc.).
Por que é importante?
Exemplo:
Em um RCT, 100 pacientes são randomizados para receber a droga A. Mas 10 abandonam, 5 trocam de grupo e 85 completam.
Na análise ITT, todos os 100 continuam no grupo A para fins de análise, mesmo os que não tomaram o tratamento.
Comparações:
Conclusão:
ITT é o padrão-ouro para análise primária em RCT, especialmente em ensaios pragmáticos, pois preserva a randomização e reflete melhor a realidade clínica.
Cenário:
Princípio ITT:
Na análise ITT, você ignora o que o paciente fez depois da randomização. Você analisa com base no grupo sorteado, não no tratamento realmente recebido.
Como fazer na prática:
grupo = A
ou grupo = B
com base na randomização original.E se não houver desfecho?
Exemplo com regressão:
modelo_itt <- lm(desfecho ~ grupo, data = dados) # grupo = randomização original
Você não cria variável “tratamento real recebido”. ITT desconsidera isso.
Conclusão:
Na análise ITT, os 10 abandonos e 5 trocas continuam no grupo A. Você analisa o efeito da atribuição ao tratamento, não da adesão. É como perguntar: “Se eu prescrevesse isso a todos, qual o impacto esperado no mundo real?”
Se você rejeita imputação, está adotando uma postura mais conservadora e realista, especialmente coerente com o espírito do RCT pragmático.
Então, o que fazer com os abandonos no ITT?
Opções viáveis sem imputação:
Censura por ausência de desfecho (em desfechos de tempo): Ex: análise de Kaplan-Meier, Cox – pacientes que abandonam são censurados na última visita conhecida.
Última medição disponível (LOCF) → não recomendado (técnica antiga, viés alto).
Modelo com dados ausentes ignorados sob MAR (missing at random): Em modelos lineares ou GLM, o R ignora linhas com NA. Se a perda for <10% e balanceada entre os grupos, o viés é mínimo.
lm(desfecho ~ grupo, data = dados_completos) # onde `desfecho` não é NA
Análise de sensibilidade: Faça duas análises:
Compare os resultados. Se forem similares, robustez confirmada.
Sobre as trocas de grupo:
No ITT, ignora-se a troca. O paciente é analisado no grupo originalmente sorteado, e ponto final.
Conclusão:
Você pode manter a análise ITT sem imputar nada, desde que:
Isso preserva o realismo e a integridade estatística, sem recorrer a suposições artificiais como na imputação.
Plano de Análise Estatística (PSA): é um documento técnico que descreve detalhadamente os métodos estatísticos a serem utilizados em um estudo, geralmente clínico ou epidemiológico, antes da análise dos dados. Deve incluir:
O PSA deve ser finalizado antes do banco ser destravado e segue boas práticas da Good Clinical Practice (GCP) e recomendações do ICH E9.
ITT, PP e SAF são definições de populações analíticas em estudos clínicos:
ITT (Intention-to-Treat): inclui todos os participantes randomizados, independentemente de adesão ao protocolo ou desfecho. Preserva a aleatorização e evita viés, sendo padrão para análise primária.
PP (Per-Protocol): inclui apenas os participantes que seguiram rigorosamente o protocolo. Útil para verificar a eficácia em condições ideais.
SAF (Safety Population): inclui todos os participantes que receberam pelo menos uma dose do produto em estudo, usada para análise de segurança.
Essas populações podem produzir resultados distintos; o ITT é mais conservador, enquanto o PP pode superestimar efeitos.
Good Clinical Practice (GCP) é um padrão internacional ético e científico para o desenho, condução, registro e relato de estudos clínicos com seres humanos. Visa garantir:
É exigida por agências regulatórias como ANVISA, FDA e EMA.
ICH E9 é uma diretriz do International Council for Harmonisation focada na metodologia estatística para estudos clínicos. Define princípios para:
Ambos são essenciais para garantir validade científica e aceitação regulatória dos resultados.
Lei nº 14.687, de 21 de maio de 2024:
“Capítulo I - Disposições Gerais
Art. 3º A pesquisa deverá atender às exigências éticas e científicas aplicáveis às pesquisas com seres humanos, especialmente:
[…]
III - embasamento científico sólido e descrição em protocolo;
[…]
IX - adoção de procedimentos que assegurem a qualidade dos aspectos técnicos envolvidos e a validade científica da pesquisa;”
O termo “embasamento científico” refere-se à fundamentação e justificativa de uma pesquisa baseada em conhecimento científico prévio, métodos rigorosos e dados empíricos. Para uma pesquisa atender aos padrões éticos e científicos, é necessário que ela se apoie em evidências sólidas e esteja alinhada com o conhecimento existente na área, o que garante que os procedimentos, hipóteses e objetivos sejam plausíveis, seguros e relevantes.
No contexto de um protocolo de pesquisa envolvendo seres humanos, o embasamento científico inclui a revisão da literatura, a justificativa da escolha dos métodos, e a definição clara dos objetivos, com o intuito de assegurar que o estudo tenha valor científico e possa contribuir de forma válida e segura para o conhecimento na área da saúde.
O embasamento científico de uma pesquisa está diretamente relacionado com a escolha e aplicação adequada de testes estatísticos. Essa relação é fundamental para:
Validação de Hipóteses: Testes estatísticos são utilizados para verificar se os dados obtidos suportam ou refutam as hipóteses da pesquisa. A escolha de testes apropriados fortalece o embasamento científico ao garantir que as conclusões derivadas dos dados são estatisticamente válidas.
Controle de Erros: O uso de testes estatísticos adequados minimiza o risco de erros tipo I (falso positivo) e tipo II (falso negativo), contribuindo para a confiabilidade e a precisão dos resultados.
Generalização dos Resultados: Os testes estatísticos permitem extrapolar os resultados da amostra para a população-alvo da pesquisa, respeitando as condições de validade e significância. Isso é essencial para que as conclusões sejam cientificamente sustentadas.
Análise de Relações e Efeitos: Em pesquisas biomédicas, por exemplo, é comum investigar associações entre variáveis ou o efeito de uma intervenção. Testes estatísticos fornecem o ferramental para avaliar essas relações, quantificar efeitos e determinar sua relevância estatística e prática.
Reprodutibilidade e Comparabilidade: O embasamento científico também exige que os métodos sejam reprodutíveis e comparáveis. Testes estatísticos padronizados permitem que outros pesquisadores validem os resultados, promovendo a transparência e a confiança na pesquisa.
Portanto, o embasamento científico depende da escolha rigorosa de testes estatísticos que sejam apropriados para os dados e os objetivos do estudo, o que fortalece a legitimidade e a aplicabilidade dos resultados.
A validade científica de uma pesquisa refere-se ao grau em que suas conclusões são corretas, confiáveis e aplicáveis ao contexto que se propõe estudar. O embasamento científico, o uso adequado de testes estatísticos e a adesão a métodos rigorosos são pilares fundamentais para garantir essa validade. A relação entre esses elementos e a validade científica pode ser entendida da seguinte forma:
Validade Interna: A validade interna refere-se à capacidade da pesquisa de estabelecer uma relação causal entre as variáveis estudadas sem interferências de fatores externos. O embasamento científico, aliado ao uso de testes estatísticos apropriados, ajuda a controlar vieses e a reduzir erros, garantindo que as conclusões são realmente atribuíveis aos fenômenos investigados e não a outras variáveis não controladas.
Validade Externa: Essa validade trata da generalização dos resultados para outras populações, contextos e tempos. Uma pesquisa com bom embasamento científico e com análise estatística robusta tende a produzir resultados mais representativos, aumentando a confiabilidade na extrapolação dos achados para a população-alvo.
Confiabilidade e Reprodutibilidade: A validade científica também exige que os resultados sejam reprodutíveis por outros pesquisadores em condições semelhantes. O uso de metodologias padronizadas e testes estatísticos adequados promove a reprodutibilidade, pois facilita a replicação dos métodos e dos achados, reforçando a credibilidade do estudo.
Precisão nas Conclusões: Testes estatísticos bem escolhidos e embasamento científico adequado garantem que as conclusões da pesquisa são precisas e refletem corretamente a realidade estudada. Isso evita interpretações equivocadas e reforça a confiança dos resultados para a comunidade científica.
Relação com o Risco-Benefício: Em estudos envolvendo seres humanos, a validade científica está intimamente ligada à justificativa ética do estudo. Se a pesquisa é cientificamente válida, seus potenciais benefícios podem superar os riscos para os participantes. Sem validade científica, não há justificativa ética para submeter participantes aos riscos de um estudo que não contribui com conhecimento relevante.
Assim, a validade científica da pesquisa depende de um embasamento científico sólido e da aplicação rigorosa de métodos estatísticos e de análise, pois esses fatores garantem que as conclusões sejam válidas, confiáveis e relevantes para o avanço do conhecimento na área.