Segunda Avaliação da Disciplina de Computação para Análise de Dados

VADeaths

Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “VADeaths”.

print(VADeaths)
##       Rural Male Rural Female Urban Male Urban Female
## 50-54       11.7          8.7       15.4          8.4
## 55-59       18.1         11.7       24.3         13.6
## 60-64       26.9         20.3       37.0         19.3
## 65-69       41.0         30.9       54.6         35.1
## 70-74       66.0         54.3       71.1         50.0
barplot(
  VADeaths, 
  beside = TRUE,           # Agrupar as barras lado a lado
  col = c("#1b9e77", "#d95f02", "#7570b3", "#e7298a"), # Cores para cada faixa etária
  legend.text = TRUE,      # Adicionar legenda automaticamente
  args.legend = list(title = "Faixa Etária", x = "topright"),
  main = "Taxas de Mortalidade na Virgínia (1940)",
  xlab = "Grupo",
  ylab = "Taxa de Mortalidade (por 1000)"
)

ClassificaçãoDoença

count_diseases <- c(8, 9, 3)
labels <- c("leve", "moderado", "severo")
percent <- round(count_diseases / sum(count_diseases) * 100)
lbls <- paste(percent, "%", sep = "")

pie(count_diseases, labels = lbls, main = "Gráfico de Estágios da Doença", col = rainbow(4))
legend("topright",
       legend = labels,
       cex = 0.8,
       fill = rainbow(length(count_diseases)))

Teorema

Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras. 4) Submeta o link do RPubs com o resultado das etapas anteriores . Essa questão deve ficar dentro de uma aba chamada de “Teorema”. Note que apenas um link do RPubs é necessário. Basta repetir o link abaixo se você já tiver submetido para outras questões.

Densidade

flu <- read.csv("flu.csv")
flu_age <- flu$age
hist(flu_age, probability = TRUE, main = "Distribuição das Idades (População)",
     xlab = "Idade", col = "lightblue", border = "black")
lines(density(flu_age), col = "red", lwd = 2)

### Amostragem

n <- 200       
n_sample <- 35  

# Inicializar um vetor para armazenar as médias
xbar <- rep(NA, n)

for (i in 1:n) {
  sample <- sample(flu$age, size = n_sample, replace = TRUE)
  xbar[i] <- mean(sample)
}

head(xbar)
## [1] 41.25714 44.65714 40.71429 46.22857 43.88571 42.77143
hist(xbar, probability = TRUE)
lines(density(xbar), col = "red", lwd = 2)