Questões

VADeaths

Questão 01: Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias.

Resolução:

data("VADeaths")

# Transformando o dataset em um data frame
df <- as.data.frame(as.table(VADeaths))
colnames(df) <- c("AgeGroup", "Category", "DeathRate")

# Criando o gráfico de barras empilhadas
ggplot(df, aes(x = Category, y = DeathRate, fill = AgeGroup)) +
  geom_bar(stat = "identity", position = "dodge") +
  scale_fill_brewer(palette = "Dark2") +
  labs(title = "Taxas de Mortalidade na Virgínia (1940)",
       x = "Categoria",
       y = "Taxa de Mortalidade (por 1000)",
       fill = "Grupo de Idade") +
  theme_minimal()

Classificação Doença

Questão 02: Uma doença pode ser classificada em três estágios (leve, moderado e severo). Foram examinados 20 pacientes e obtidos os dados: moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve, leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado, moderado,leve. Com base nestes dados crie um gráfico de piza. Inclua a porcentagem de cada fatia, as cores das fatias e o nome do gráfico. Adicionalmente, use o comando legend() para incluir a legenda do gráfico.

Resolução:

dados <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado", "leve")

# Contagem de cada estágio
contagem <- table(dados)

# Porcentagem de cada estágio
porcentagem <- round(100 * contagem / sum(contagem), 1)

# Labels com porcentagem
labels <- paste(names(contagem), porcentagem, "%")

# Cores para cada estágio
cores <- c("leve" = "red", "moderado" = "pink", "severo" = "darkred")

# Configurações do gráfico
par(bg = "#FFF0F5")

# Gráfico de pizza
pie(contagem, labels = labels, col = cores, main = "Distribuição dos Estágios da Doença")

# Adicionando legenda
legend("topleft", legend = names(contagem), fill = cores)

Teorema

Questão 03: Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras.

Resolução:

flu <- read.csv("C:/Users/itbps/Downloads/flu.csv")

# Mostrando o histograma e a curva de densidade
ggplot(data.frame(Idade = flu), aes(x = age)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "lightpink", color = "darkgray") +
  geom_density(color = "red", size = 1) +
  labs(title = "Idades das Mortes",
       x = "Idade",
       y = "Densidade") +
  theme_minimal()

# Criando 200 médias de amostras da população com tamanho n = 35
set.seed(123)  
n <- 35
num_amostras <- 200
medias_amostras <- replicate(num_amostras, mean(sample(flu$age, n, replace = TRUE)))

# histograma com a curva de densidade para as médias das amostras
ggplot(data.frame(Media = medias_amostras), aes(x = Media)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "#7FFFD4", color = "darkgray") +
  geom_density(color = "#008080", size = 1) +
  labs(title = "Médias das Amostras",
       x = "Média das Idades",
       y = "Densidade") +
  theme_minimal()