Prova - 2a VA
VADeaths
Visualize o dataset VADeaths (já incluído no R) e crie um
gráfico de barras empilhadas desses dados, de modo que as barras estejam
agrupadas (lado a lado) para cada categoria. Também defina uma cor
diferente para cada grupo das categorias.
# Converter o dataset para data.frame
df <- as.data.frame(VADeaths)
# Adicionar coluna com categorias (rownames)
df$AgeGroup <- rownames(df)
df_long <- df %>%
pivot_longer(
cols = c("Rural Male", "Rural Female", "Urban Male", "Urban Female"),
names_to = "Category",
values_to = "DeathRate"
)
# Gráfico de barras empilhadas agrupadas
ggplot(df_long, aes(x = AgeGroup, y = DeathRate, fill = Category)) +
geom_bar(stat = "identity", position = "stack") +
facet_wrap(~ Category, nrow = 1) + # barras agrupadas lado a lado
labs(
title = "Taxas de Mortalidade - VADeaths",
x = "Faixa Etária",
y = "Taxa de Mortalidade (por 100.000)",
fill = "Categoria"
) +
theme_minimal() +
theme(
plot.title = element_text(size = 18, face = "bold", hjust = 0.5),
axis.text.x = element_text(angle = 45, hjust = 1)
)ClassificaçãoDoença
Uma doença pode ser classificada em três estágios (leve,
moderado e severo). Foram examinados 20 pacientes e obtidos os dados:
moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve,
leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado,
moderado,leve. Com base nestes dados crie um gráfico de piza. Inclua a
porcentagem de cada fatia, as cores das fatias e o nome do gráfico.
Adicionalmente, use o comando legend() para incluir a legenda do
gráfico.
# Dados dos pacientes
pacientes <- c(
"moderado","leve","leve","severo","leve","moderado","moderado","moderado",
"leve","leve","severo","leve","moderado","moderado","leve","severo",
"moderado","moderado","moderado","leve"
)
# Contagem dos estágios
tabela <- table(pacientes)
# Calcular porcentagens
porcent <- round(prop.table(tabela) * 100, 1)
# Criar rótulos com porcentagem
labels <- paste(names(tabela), "-", porcent, "%")
# Cores das fatias
cores <- c("lightblue", "orange", "tomato")
# Criar gráfico de pizza
pie(
tabela,
labels = labels,
col = cores,
main = "Classificação dos Pacientes por Estágio da Doença"
)
# Adicionar legenda
legend(
"topright",
legend = names(tabela),
fill = cores,
title = "Estágio"
)TeoremaDoLimiteCentral
Nesta questão, demonstre o uso do teorema do limite central,
usando o conjunto de dados “flu” que é altamente não normal. Esse
dataset contém as frequências das idades das mortes durante a epidemia
de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a
população. Execute os passos a seguir. (1)Mostre o histograma e a curva
de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras
da população com tamanho n = 35. (3) Mostre o histograma com a curva de
densidade para a médias das amostras.
# 1) Carregar dados e plotar população
flu <- read.csv("flu.csv")
# Atribuindo coluna age à variável
idade <- flu$age
# Histograma + densidade da população
hist(idade,
breaks = 30,
freq = FALSE,
col = "lightblue",
main = "Histograma das Idades das Mortes (População flu)",
xlab = "Idade")
lines(density(idade), col = "red", lwd = 2)# 2) Criar 200 médias de amostras com n = 35
n <- 35
num_amostras <- 200
medias <- replicate(num_amostras,
mean(sample(idade, n, replace = TRUE)))
# 3) Histograma + densidade das médias amostrais
hist(medias,
breaks = 20,
freq = FALSE,
col = "lightgreen",
main = "Distribuição das Médias Amostrais (n = 35, 200 amostras)",
xlab = "Média da amostra")
lines(density(medias), col = "blue", lwd = 2)