VADeaths

Questão

Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “VADeaths”.

# Carregar as bibliotecas necessárias
library(ggplot2)
library(reshape2)

# Carregar e transformar o dataset
data("VADeaths")
va_deaths_long <- melt(VADeaths, 
                       varnames = c("FaixaEtaria", "Localizacao"), 
                       value.name = "TaxaMortalidade")

# Criar o gráfico de barras empilhadas
ggplot(va_deaths_long, aes(x = Localizacao, y = TaxaMortalidade, fill = FaixaEtaria)) + 
  geom_bar(stat = "identity", position = "dodge") + 
  labs(
    title = "Mortalidade na Virgínia por Grupo de Idade e Localização",
    x = "Grupos p/Localização",
    y = "Taxa de Mortalidade",
    fill = "Faixa Etária"
  ) +
  scale_fill_brewer(palette = "Set1") + 
  theme_minimal()

ClassificaçãoDoença

Questão

Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “VADeaths”.

# Carregar biblioteca necessária
library(ggplot2)

# Definir os dados
estagios <- c("Leve", "Moderado", "Severo")
contagem <- c(7, 9, 3)  # Contagem dos estágios

# Calcular porcentagem
porcentagem <- round(contagem / sum(contagem) * 100, 1)

# Criar rótulos com porcentagem
rotulos <- paste(estagios, "-", porcentagem, "%")

# Definir cores personalizadas
cores <- c("lightblue", "orange", "red")

# Criar gráfico de pizza
pie(contagem, labels = rotulos, col = cores, main = "Classificação da Doença")

# Adicionar legenda
legend("topleft", legend = estagios, fill = cores, title = "Estágios")

Teorema

Questão

Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras. 4) Submeta o link do RPubs com o resultado das etapas anteriores . Essa questão deve ficar dentro de uma aba chamada de “Teorema”. Note que apenas um link do RPubs é necessário. Basta repetir o link abaixo se você já tiver submetido para outras questões.

# Carregar os dados
dados <- read.csv("flu.csv", header = TRUE, sep = ",")

# Criar histograma com curva de densidade
hist(dados$age, freq = FALSE, col = "lightblue", border = "black",
     main = "Histograma das Idades das Mortes",
     xlab = "Idade", ylab = "Densidade", breaks = 30)

# Adicionar curva de densidade
lines(density(dados$age, na.rm = TRUE), col = "red", lwd = 2.5)

# Definir o tamanho da amostra
n <- 35

# Criar 200 amostras da população e calcular suas médias
set.seed(123)  #  seed para reprodutibilidade
medias_amostras <- replicate(200, mean(sample(dados$age, size = n, replace = TRUE)))

# Visualizar as primeiras 6 médias
#head(medias_amostras)


# Plotar o histograma das médias das amostras
hist(medias_amostras, freq = FALSE, col = "lightgreen", main = "Histograma das Médias Amostrais (n = 35)",
     xlab = "Média das Amostras", ylab = "Densidade")

# Adicionar a curva de densidade
lines(density(medias_amostras), col = "blue", lwd = 2)