Contexto: A escoliose idiopática do adolescente pode apresentar resposta clínica variável a intervenções conservadoras. Objetivo: Explorar associações entre características basais e melhora radiográfica em 6 meses. Métodos: Estudo observacional com análise exploratória e inferencial. O desfecho contínuo foi \(\Delta\) (maior curva em 6 meses − baseline, em graus). O desfecho binário (MCID) foi melhora definida como \(\Delta \le -5°\). Ajustamos um modelo linear para \(\Delta\) e um modelo logístico para o MCID, reportando estimativas com IC95% e verificações de adequação dos modelos.
0.1 Como reproduzir
O arquivo de dados é lido de data/modelagem final.xlsx (aba dados).
As análises dependem de pacotes R listados no chunk de setup; caso algum pacote esteja ausente, o documento interrompe a execução com uma mensagem explícita.
0.2 Objetivo e delineamento
Este é um relatório exploratório e inferencial: o objetivo é estimar associações ajustadas entre variáveis basais e a evolução radiográfica em 6 meses.
0.3 Definições de desfecho
Desfecho contínuo:\(\Delta\) = (maior curva em 6 meses − maior curva baseline), em graus. Valores mais negativos indicam maior melhora.
Desfecho binário (MCID): melhora clínica definida como \(\Delta \le -5°\) (redução de pelo menos 5 graus).
0.4 Plano de análise estatística
Descrição da amostra: estatísticas descritivas das variáveis basais e do desfecho.
Inferência (associações ajustadas):
Modelo linear para \(\Delta\) (efeitos como betas, IC95%).
Modelo logístico para MCID (efeitos como odds ratios, IC95%).
Adequação dos modelos: diagnósticos de assunções (colinearidade, resíduos, heteroscedasticidade quando aplicável) e medidas de qualidade de ajuste (por exemplo, \(R^2\)).
Forma funcional: para preditores contínuos, assume-se relação aproximadamente linear.
Por se tratar de análise exploratória, os resultados devem ser interpretados com cautela, com ênfase em magnitude/direção e incerteza (IC95%).
# drop na in flexibilidadedf <- df |>drop_na(flexibilidade)
Observação: os modelos abaixo usam análise por caso completo (listwise deletion), que é o comportamento padrão do glm()/lm() quando há dados faltantes nas variáveis do modelo.
0.6 Codificação de variáveis categóricas (referências)
As variáveis categóricas entram como fatores. A categoria de referência (baseline) é o primeiro nível do fator (conforme levels()), a menos que seja explicitamente reordenado.
Verificação de colinearidade entre as variáveis independentes (Variance Inflation Factor). Valores maiores que 10 indicam colinearidade entre as variáveis.
Teste de Hosmer-Lemeshow para avaliar a qualidade do ajuste de modelos binomiais. P-valor < 0.05 indica que o modelo não ajusta bem os dados.
Código
performance::performance_hosmer(model_bin)
# Hosmer-Lemeshow Goodness-of-Fit Test
Chi-squared: 11.480
df: 8
p-value: 0.176
2.1.1.2.6 Colinearidade
Verificação de colinearidade entre as variáveis independentes (Variance Inflation Factor). Valores maiores que 10 indicam colinearidade entre as variáveis.
2.1.1.3 CART (árvore de decisão) para MCID (delta_cat)
2.1.1.3.1 Racional teórico
Um modelo CART (Classification and Regression Tree) é útil aqui porque:
Não linearidade: identifica automaticamente limiares (pontos de corte) em preditores contínuos.
Interações: a sequência de divisões (splits) representa interações condicionais sem precisar pre-especificar termos de interação.
Interpretabilidade: gera regras do tipo “se… então…”, úteis para comunicação clínica e geração de hipóteses.
Limitações importantes: árvores isoladas tendem a ter alta variância e podem superajustar. Por isso, esta seção usa validação cruzada (CV) e tuning/poda para controlar complexidade e reporta desempenho interno (sem validação externa).
Verificação de colinearidade entre as variáveis independentes (Variance Inflation Factor). Valores maiores que 10 indicam colinearidade entre as variáveis.
Teste de Hosmer-Lemeshow para avaliar a qualidade do ajuste de modelos binomiais. P-valor < 0.05 indica que o modelo não ajusta bem os dados.
Código
performance::performance_hosmer(model_bin)
# Hosmer-Lemeshow Goodness-of-Fit Test
Chi-squared: 21.170
df: 8
p-value: 0.007
2.1.2.2.6 Colinearidade
Verificação de colinearidade entre as variáveis independentes (Variance Inflation Factor). Valores maiores que 10 indicam colinearidade entre as variáveis.
2.1.2.3 CART (árvore de decisão) para MCID (delta_cat)
2.1.2.3.1 Racional teórico
Um modelo CART (Classification and Regression Tree) é útil aqui porque:
Não linearidade: identifica automaticamente limiares (pontos de corte) em preditores contínuos.
Interações: a sequência de divisões (splits) representa interações condicionais sem precisar pre-especificar termos de interação.
Interpretabilidade: gera regras do tipo “se… então…”, úteis para comunicação clínica e geração de hipóteses.
Limitações importantes: árvores isoladas tendem a ter alta variância e podem superajustar. Por isso, esta seção usa validação cruzada (CV) e tuning/poda para controlar complexidade e reporta desempenho interno (sem validação externa).