Este conjunto de dados foca na recorrência do câncer de tireoide após terapia com Iodo Radioativo (RAI). Ele contém 383 registros de pacientes com 13 atributos principais, incluindo idade, sexo, estadiamento do câncer, tipo de patologia, classificação de risco, resposta ao tratamento e status de recorrência. Os dados são valiosos para prever a recorrência do câncer, entender os fatores de risco e avaliar os resultados do tratamento.
# A tibble: 6 × 15
Age Gender `Hx Radiothreapy` Adenopathy Pathology Focality Risk T N
<dbl> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
1 27 Femin… No No Micropap… Uni-Foc… Low T1a N0
2 34 Femin… No No Micropap… Uni-Foc… Low T1a N0
3 30 Femin… No No Micropap… Uni-Foc… Low T1a N0
4 62 Femin… No No Micropap… Uni-Foc… Low T1a N0
5 62 Femin… No No Micropap… Multi-F… Low T1a N0
6 52 Mascu… No No Micropap… Multi-F… Low T1a N0
# ℹ 6 more variables: M <chr>, Stage <chr>, Response <chr>, Recurred <chr>,
# Response_pt <fct>, Faixa_Etaria <fct>
Este painel foi desenvolvido como parte de um projeto acadêmico para análise exploratória de dados sobre câncer de tireoide. As visualizações são baseadas em dados reais e oferecem suporte à interpretação clínica e estatística dos fatores associados à recorrência da doença.
Esta seção aborda variáveis categóricas, como o sexo dos pacientes e a resposta ao tratamento. Esses dados não numéricos são úteis para identificar padrões e tendências gerais entre os grupos analisados, facilitando a compreensão de características predominantes na população estudada.
As representações gráficas aqui empregadas — como gráficos de pizza e de barras — evidenciam a distribuição das categorias. Elas são fundamentais para análises descritivas e para comparações entre grupos.
Este gráfico de pizza demonstra uma clara predominância de pacientes do sexo feminino na amostra. Isso sugere que a incidência de câncer de tireoide pode ser mais alta entre mulheres, o que é um padrão frequentemente observado em estudos epidemiológicos desta doença.
O gráfico de barras mostra que a maioria dos pacientes teve uma resposta “Excelente” ao tratamento. No entanto, é importante notar a presença de diferentes categorias de respostas incompletas, indicando que uma parcela dos pacientes não alcançou a remissão completa. Isso sugere a necessidade de acompanhamento e, possivelmente, intervenções adicionais para esses grupos.
As variáveis quantitativas, como a idade dos pacientes, são expressas numericamente. Analisar essas variáveis permite observar tendências centrais e variações nos dados, além de possibilitar o uso de métodos estatísticos mais robustos. Os gráficos desta seção incluem distribuições por faixa etária e curvas de densidade, que ajudam a identificar a concentração dos valores e possíveis assimetrias.
Este gráfico de barras de Faixa Etária mostra a distribuição dos pacientes por grupo de idade. Observamos quais faixas etárias possuem a maior frequência de casos, o que é crucial para entender em que momento da vida os pacientes são mais diagnosticados ou tratados. É comum ver uma concentração em faixas etárias adultas.
O gráfico de Densidade Etária oferece uma visão suave da distribuição das idades. O pico da curva indica a idade mais frequente entre os pacientes, e a forma da curva revela se a distribuição é simétrica ou se há uma inclinação para idades mais jovens ou mais velhas. Isso pode sugerir um perfil de idade típico para a condição estudada.
A análise de frequência permite observar quantas vezes determinadas categorias ou faixas numéricas ocorrem nos dados. Esse tipo de análise é essencial para entender como as informações estão distribuídas.
As representações gráficas incluem histogramas, gráficos de barras e gráficos de pizza, oferecendo diferentes formas de visualizar a distribuição de variáveis como idade e tipo de patologia.
Este gráfico de barras ilustra a frequência de cada tipo de patologia. Ele permite identificar rapidamente quais tipos de câncer de tireoide são mais comuns neste conjunto de dados, fornecendo insights sobre a prevalência de diferentes condições patológicas.
Semelhante ao gráfico de barras, o gráfico de pizza de Patologia mostra a proporção de cada tipo de patologia em relação ao total. Ele é particularmente útil para visualizar rapidamente qual tipo de patologia representa a maior fatia da amostra, oferecendo uma compreensão intuitiva da distribuição percentual.
O Histograma de Idades exibe a distribuição das idades dos pacientes em intervalos definidos. Ele ajuda a entender a forma geral da distribuição dos dados: se ela é simétrica, inclinada (assimétrica para a esquerda ou direita), bimodal, ou se há picos de frequência em determinadas faixas etárias.
O Boxplot de Idades é uma excelente ferramenta para resumir a distribuição das idades. Ele destaca a mediana (linha central), os quartis (as bordas da caixa, representando 25% e 75% dos dados), e os “bigodes” que indicam a dispersão dos dados. Pontos fora dos bigodes são outliers, que representam idades atípicas na amostra e merecem uma investigação mais aprofundada.
As medidas separatrizes — como quartis, decis e percentis — dividem o conjunto de dados em partes iguais e auxiliam na compreensão da dispersão dos valores. Elas ajudam a identificar a posição de determinado valor em relação ao conjunto. Os gráficos e tabelas aqui apresentados destacam a variação dos dados com base nas divisões estatísticas. O boxplot, por exemplo, é útil para visualizar esses limites e possíveis outliers.
Este Boxplot, especificamente nomeado “Quartis”, reforça a visualização das medidas separatrizes. A caixa central representa os 50% dos pacientes com idades mais concentradas, delimitados pelo primeiro (Q1) e terceiro (Q3) quartis. A linha central dentro da caixa é a mediana (Q2), dividindo os dados ao meio. A extensão dos “bigodes” mostra a variação dos dados que não são considerados outliers.