VADeaths

Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “VADeaths”.

# 1ª Questão - Visualização do VADeaths
# Definindo cores personalizadas para as faixas etárias
cores <- c("lightblue", "mistyrose", "lightcyan", "lavender", "cornsilk")

# Criando o gráfico de barras agrupadas (beside = TRUE)
barplot(VADeaths, 
        beside = TRUE,              # Barras lado a lado
        col = cores,                # Cores para cada faixa etária
        legend.text = TRUE,         # Adiciona a legenda automaticamente baseada nos rownames
        args.legend = list(x = "topright", bty="n", title="Faixa Etária"), # Ajuste da legenda
        main = "Taxas de Mortalidade na Virgínia (1940)", # Título
        xlab = "Grupos Populacionais",  # Nome do eixo X
        ylab = "Taxa por 1000 habitantes", # Nome do eixo Y
        ylim = c(0, 100))           # Ajuste do limite Y

ClassificaçãoDoença

Uma doença pode ser classificada em três estágios (leve, moderado e severo). Foram examinados 20 pacientes e obtidos os dados: moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve, leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado, moderado,leve. Com base nestes dados crie um gráfico de piza. Inclua a porcentagem de cada fatia, as cores das fatias e o nome do gráfico. Adicionalmente, use o comando legend() para incluir a legenda do gráfico. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “ClassificaçãoDoença”. Note que apenas um link do RPubs é necessário. Basta repetir o link abaixo se você já tiver submetido para outras questões.

# 2ª Questão - Classificação da Doença (Gráfico de Pizza)

# 1. Entrada dos dados brutos
dados_pacientes <- c("moderado", "leve", "leve", "severo", "leve", 
                     "moderado", "moderado", "moderado", "leve", "leve", 
                     "severo", "leve", "moderado", "moderado", "leve", 
                     "severo", "moderado", "moderado", "moderado", "leve")

# 2. Tabulação dos dados
contagem <- table(dados_pacientes)

# 3. Cálculo das porcentagens
porcentagens <- round(100 * contagem / sum(contagem), 1)

# 4. Criação dos rótulos (apenas a porcentagem)
rotulos <- paste(porcentagens, "%", sep="")

# 5. Definição das cores
cores <- c("lightblue", "mistyrose", "lightcyan")

# 6. Criação do Gráfico de Pizza
# Nota: O objeto 'contagem' ordena alfabeticamente por padrão (Leve, Moderado, Severo)
pie(contagem, 
    labels = rotulos,       # Rótulos nas fatias (apenas %)
    col = cores,            # Cores das fatias
    main = "Classificação dos Estágios da Doença") # Título do Gráfico

# 7. Adição da Legenda
# O parâmetro fill deve ter as mesmas cores do gráfico
legend("topright", 
       legend = names(contagem), # Nomes das categorias (Leve, Moderado, Severo)
       fill = cores,             # Caixas de cor correspondentes
       title = "Estágios",
       bty = "n")                # Remove a caixa em volta da legenda (estética mais limpa)

Teorema

Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras. 4) Submeta o link do RPubs com o resultado das etapas anteriores . Essa questão deve ficar dentro de uma aba chamada de “Teorema”. Note que apenas um link do RPubs é necessário. Basta repetir o link abaixo se você já tiver submetido para outras questões.

# 3ª Questão - Teorema do Limite Central

# 1. Carregar os dados
dados <- read.csv("flu.csv")
populacao <- dados$age

# Configuração da área de plotagem para mostrar 2 gráficos lado a lado
par(mfrow = c(1, 2)) 

# --- Passo 1: Histograma e Densidade da População ---
# O parâmetro 'prob = TRUE' é essencial para que o histograma seja de densidade, não contagem
hist(populacao, 
     prob = TRUE, 
     main = "População (Idades)", 
     xlab = "Idade", 
     col = "lightgray", 
     border = "white")

# Adicionando a curva de densidade
lines(density(populacao), col = "red", lwd = 2)


# --- Passo 2: Simulação das Médias Amostrais ---
n <- 35           # Tamanho da amostra
k <- 200          # Quantidade de amostras (médias)

# Criar um vetor vazio para armazenar as médias
medias_amostrais <- numeric(k)

# Loop para gerar as 200 amostras e calcular suas médias
set.seed(123) # Define uma semente para reprodutibilidade (opcional, mas recomendado)
for (i in 1:k) {
  amostra <- sample(populacao, size = n)
  medias_amostrais[i] <- mean(amostra)
}

# --- Passo 3: Histograma e Densidade das Médias ---
hist(medias_amostrais, 
     prob = TRUE, 
     main = "Distribuição das Médias (n=35)", 
     xlab = "Média das Idades", 
     col = "lightblue", 
     border = "white")

# Adicionando a curva de densidade das médias
lines(density(medias_amostrais), col = "blue", lwd = 2)

# Restaurar o layout gráfico padrão (1 gráfico por vez)
par(mfrow = c(1, 1))