Prova - 2a VA

VADeaths


Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias.

# Converter o dataset para data.frame
df <- as.data.frame(VADeaths)

# Adicionar coluna com categorias (rownames)
df$AgeGroup <- rownames(df)

df_long <- df %>%
  pivot_longer(
    cols = c("Rural Male", "Rural Female", "Urban Male", "Urban Female"),
    names_to = "Category",
    values_to = "DeathRate"
  )

# Gráfico de barras empilhadas agrupadas
ggplot(df_long, aes(x = AgeGroup, y = DeathRate, fill = Category)) +
  geom_bar(stat = "identity", position = "stack") +
  facet_wrap(~ Category, nrow = 1) +  # barras agrupadas lado a lado
  labs(
    title = "Taxas de Mortalidade - VADeaths",
    x = "Faixa Etária",
    y = "Taxa de Mortalidade (por 100.000)",
    fill = "Categoria"
  ) +
  theme_minimal() +
  theme(
    plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
    axis.text.x = element_text(angle = 45, hjust = 1)
  )

ClassificaçãoDoença


Uma doença pode ser classificada em três estágios (leve, moderado e severo). Foram examinados 20 pacientes e obtidos os dados: moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve, leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado, moderado,leve. Com base nestes dados crie um gráfico de piza. Inclua a porcentagem de cada fatia, as cores das fatias e o nome do gráfico. Adicionalmente, use o comando legend() para incluir a legenda do gráfico.

# Dados dos pacientes
pacientes <- c(
"moderado","leve","leve","severo","leve","moderado","moderado","moderado",
"leve","leve","severo","leve","moderado","moderado","leve","severo",
"moderado","moderado","moderado","leve"
)

# Contagem dos estágios
tabela <- table(pacientes)

# Calcular porcentagens
porcent <- round(prop.table(tabela) * 100, 1)

# Criar rótulos com porcentagem
labels <- paste(names(tabela), "-", porcent, "%")

# Cores das fatias
cores <- c("lightblue", "orange", "tomato")

# Criar gráfico de pizza
pie(
tabela,
labels = labels,
col = cores,
main = "Classificação dos Pacientes por Estágio da Doença"
)

# Adicionar legenda
legend(
"topright",
legend = names(tabela),
fill = cores,
title = "Estágio"
)

TeoremaDoLimiteCentral


Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras.

# 1) Carregar dados e plotar população
flu <- read.csv("flu.csv")

# Atribuindo coluna age à variável
idade <- flu$age

# Histograma + densidade da população
hist(idade,
     breaks = 30,
     freq = FALSE,
     col = "lightblue",
     main = "Histograma das Idades das Mortes (População flu)",
     xlab = "Idade")

lines(density(idade), col = "red", lwd = 2)

# 2) Criar 200 médias de amostras com n = 35
n <- 35
num_amostras <- 200

medias <- replicate(num_amostras,
                    mean(sample(idade, n, replace = TRUE)))

# 3) Histograma + densidade das médias amostrais
hist(medias,
     breaks = 20,
     freq = FALSE,
     col = "lightgreen",
     main = "Distribuição das Médias Amostrais (n = 35, 200 amostras)",
     xlab = "Média da amostra")

lines(density(medias), col = "blue", lwd = 2)