1 VADeaths

1.1 Análise Gráfica

# Preparar os dados do dataset VADeaths para o ggplot
df_vadeaths <- as.data.frame(VADeaths) %>%
  tibble::rownames_to_column("Faixa Etaria") %>%
  pivot_longer(
    cols = -`Faixa Etaria`,
    names_to = "Grupo",
    values_to = "Mortalidade"
  )

# Criar o gráfico de barras agrupadas com ggplot2
ggplot(df_vadeaths, aes(x = `Faixa Etaria`, y = Mortalidade, fill = Grupo)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8), width = 0.7) +
  scale_fill_brewer(palette = "Pastel1") +
  labs(
    title = "Taxas de Mortalidade por Grupo Etário e Região (Virginia, 1940)",
    x = "Faixa Etária",
    y = "Mortes por 1000 Habitantes",
    fill = "Categoria"
  ) +
  theme_minimal(base_size = 12) +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 16),
    legend.position = "bottom",
    axis.text.x = element_text(angle = 45, hjust = 1)
  )
Gráfico de barras agrupadas mostrando as taxas de mortalidade na Virgínia em 1940.

Gráfico de barras agrupadas mostrando as taxas de mortalidade na Virgínia em 1940.

2 Classificação da Doença

2.1 Distribuição de Estágios

# Dados dos pacientes
dados_pacientes <- c(
  "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado",
  "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado",
  "leve", "severo", "moderado", "moderado", "moderado", "leve"
)

# Calcular frequências e porcentagens
frequencias <- table(dados_pacientes)

df_doenca <- as.data.frame(frequencias) %>%
  rename(Estagio = dados_pacientes) %>% 
  mutate(
    porcentagem = Freq / sum(Freq) * 100,
    rotulo = paste0(Estagio, "\n", sprintf("%.1f%%", porcentagem))
  )

# Criar o gráfico de pizza com ggplot2
ggplot(df_doenca, aes(x = "", y = porcentagem, fill = Estagio)) +
  geom_bar(width = 1, stat = "identity") +
  coord_polar("y", start = 0) +
  geom_text(aes(label = rotulo), position = position_stack(vjust = 0.5), color = "white", size = 4) +
  scale_fill_manual(values = c("leve" = "#4e79a7", "moderado" = "#f28e2b", "severo" = "#e15759")) +
  labs(
    title = "Distribuição de Estágios da Doença (n = 20 pacientes)",
    fill = "Estágio"
  ) +
  theme_void() +
  theme(
    plot.title = element_text(hjust = 0.5, face = "bold", size = 16),
    legend.position = "right"
  )
Gráfico de pizza mostrando a distribuição percentual dos estágios da doença.

Gráfico de pizza mostrando a distribuição percentual dos estágios da doença.

3 Teorema do Limite Central

3.1 Demonstração TLC

# **CORREÇÃO FINAL: LENDO O ARQUIVO DO CAMINHO COMPLETO FORNECIDO**

# Define o caminho completo para o arquivo
caminho_arquivo_flu <- "/home/ianlucasalmeida/Mestrado/CPAD/flu.csv"

tryCatch({
  # Ler o arquivo localmente do caminho absoluto
  flu <- read.csv(caminho_arquivo_flu)
}, error = function(e) {
  # Se o arquivo não for encontrado, esta mensagem de erro aparecerá.
  stop(paste("ERRO: O arquivo não foi encontrado no caminho especificado:", caminho_arquivo_flu, ". Por favor, verifique se o caminho está correto e se o arquivo 'flu.csv' realmente existe nesse local."))
})


# O restante do código permanece o mesmo.
idades <- flu$age

# Configurar a área de plotagem para dois gráficos lado a lado
par(mfrow = c(1, 2))

# 1. Histograma da população original
hist(idades,
     breaks = 15,
     main = "Distribuição Original das Idades",
     xlab = "Idade",
     ylab = "Densidade",
     col = "lightblue",
     probability = TRUE)
lines(density(idades, na.rm = TRUE), col = "red", lwd = 2)

# 2. Gerar 200 médias de amostras com tamanho n = 35
set.seed(123)
medias_amostrais <- replicate(200, mean(sample(idades, 35, replace = TRUE)))

# 3. Histograma da distribuição das médias amostrais
hist(medias_amostrais,
     breaks = 15,
     main = "Distribuição das Médias Amostrais",
     xlab = "Média das Idades (n=35)",
     ylab = "Densidade",
     col = "lightgreen",
     probability = TRUE)
lines(density(medias_amostrais), col = "blue", lwd = 2)
Comparação da distribuição original das idades com a distribuição normal das médias amostrais.

Comparação da distribuição original das idades com a distribuição normal das médias amostrais.

# Resetar o layout da área de plotagem
par(mfrow = c(1, 1))