Resolução da 2VA:

As questões a seguir são referentes à segunda avaliação da disciplina CPAD

VADeaths

Visualize o dataset VADeaths (já incluído no R) e crie um gráfico de barras empilhadas desses dados, de modo que as barras estejam agrupadas (lado a lado) para cada categoria. Também defina uma cor diferente para cada grupo das categorias. Por fim, adicione título, legenda e nomes nos eixos. Abaixo submeta o link do RPubs com o resultado dessa questão. Ela deve ficar dentro de uma aba chamada de “VADeaths”.

colors <- c('pink', 'grey', 'purple', 'skyblue') 

barplot(VADeaths, main = "Taxas de mortalidade na Virgínia (1940)",
        xlab = "Grupo de População", ylab = "Taxa de Mortalidade", 
        col = colors, beside = FALSE, legend.text = FALSE)

legend("topleft", legend = rownames(VADeaths), fill = colors, horiz = TRUE, cex = 0.7)

ClassificaçãoDoença

Uma doença pode ser classificada em três estágios (leve, moderado e severo). Foram examinados 20 pacientes e obtidos os dados: moderado, leve, leve, severo, leve, moderado, moderado, moderado, leve, leve, severo,leve, moderado, moderado, leve, severo, moderado, moderado, moderado,leve. Com base nestes dados crie um gráfico de pizza. Inclua a porcentagem de cada fatia, as cores das fatias e o nome do gráfico. Adicionalmente, use o comando legend() para incluir a legenda do gráfico.

library(plotly)

estagios <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado",
           "leve", "leve", "severo", "leve", "moderado", "moderado", "leve", "severo",
           "moderado", "moderado", "moderado", "leve")

df_estagios <- table(estagios)

porcent <- round(100 * df_estagios / sum(df_estagios), 1)

fig <- plot_ly(labels = names(df_estagios), values = porcent, type = 'pie',
               textinfo = 'percent', insidetextorientation = 'radial',
               marker = list(colors = c("lightblue", "pink", "purple")))

fig <- fig %>% layout(title = 'Classificação dos Estágios da Doença',
                      legend = list(title = list(text = 'Estágios')))

fig

Teorema

Nesta questão, demonstre o uso do teorema do limite central, usando o conjunto de dados “flu” que é altamente não normal. Esse dataset contém as frequências das idades das mortes durante a epidemia de gripe espanhola na Suíça em 1918. Considere a idade das mortes como a população. Execute os passos a seguir. (1)Mostre o histograma e a curva de densidade do conjunto de dados “flu”. (2) Crie 200 médias de amostras da população com tamanho n = 35. (3) Mostre o histograma com a curva de densidade para a médias das amostras.

library(readr)

df_flu <- read.csv('https://www.dropbox.com/s/hmt4vt3xllfrcmd/flu.csv?dl=1')

# Passo 1: Mostre o histograma e a curva de densidade do conjunto de dados "flu"

hist(df_flu$age, probability = T, main = "Histograma do Conjunto Flu")
lines(density((df_flu$age), col = 2))

#Passo 2: Crie 200 médias de amostras da população com tamanho n = 35
n <- 200
tam <- 35
xbar <- rep(NA, n)

for(i in 1:n){
  amostra <- sample(df_flu$age, size = tam) 
  xbar[i] <- mean(amostra)
}

#Passo 3: Mostre o histograma com a curva de densidade para a médias das amostras

hist(amostra, probability = T, main = "Histograma do Conjunto Flu + amostras")
lines(density((amostra), col = 2))