Prova 2VA

VADeaths

Visualização e Gráfico de Barras Empilhadas

# Visualizar o dataset VADeaths
print("Dataset VADeaths:")

## [1] "Dataset VADeaths:"

print(VADeaths)

##       Rural Male Rural Female Urban Male Urban Female
## 50-54       11.7          8.7       15.4          8.4
## 55-59       18.1         11.7       24.3         13.6
## 60-64       26.9         20.3       37.0         19.3
## 65-69       41.0         30.9       54.6         35.1
## 70-74       66.0         54.3       71.1         50.0

# Criar o gráfico de barras empilhadas agrupadas
barplot(VADeaths, 
        beside = TRUE,  # Barras agrupadas lado a lado
        col = c("lightblue", "lightgreen", "salmon", "gold", "purple"),
        main = "Taxas de Mortalidade na Virgínia (1940)",
        xlab = "Grupos Demográficos",
        ylab = "Taxa de Mortalidade (por 1000)",
        legend.text = rownames(VADeaths),
        args.legend = list(x = "topright", title = "Faixa Etária"))

Descrição: Este gráfico mostra as taxas de mortalidade na Virgínia em 1940, organizadas por faixa etária (nas cores diferentes) e grupo demográfico (eixo X). As barras estão agrupadas lado a lado para facilitar a comparação entre os diferentes grupos.

Classificação Doença

Gráfico de Pizza da Classificação das Doenças

# Dados dos pacientes
dados <- c("moderado", "leve", "leve", "severo", "leve", "moderado", 
           "moderado", "moderado", "leve", "leve", "severo", "leve", 
           "moderado", "moderado", "leve", "severo", "moderado", 
           "moderado", "moderado", "leve")

# Criar tabela de frequências
tabela_freq <- table(dados)
print("Frequência dos estágios da doença:")

## [1] "Frequência dos estágios da doença:"

print(tabela_freq)

## dados
##     leve moderado   severo 
##        8        9        3

# Calcular porcentagens
porcentagens <- round(100 * tabela_freq / sum(tabela_freq), 1)

# Criar labels com porcentagens
labels <- paste(names(tabela_freq), "\n", porcentagens, "%", sep="")

# Definir cores para as fatias
cores <- c("lightgreen", "yellow", "red")

# Criar gráfico de pizza
pie(tabela_freq, 
    labels = labels,
    col = cores,
    main = "Distribuição da Classificação da Doença",
    cex = 1.2)

# Adicionar legenda
legend("topright", 
       legend = names(tabela_freq), 
       fill = cores,
       title = "Estágio",
       cex = 0.9)

Resumo:

Leve: 8 pacientes (40.0%)
Moderado: 9 pacientes (45.0%)
Severo: 3 pacientes (15.0%)

Teorema

Demonstração do Teorema do Limite Central

# Carregar o dataset flu
flu <- read.csv("flu.csv")

# (1) Histograma e curva de densidade do conjunto de dados original
hist(flu$age, 
     probability = TRUE,
     main = "Distribuição das Idades - População (Gripe Espanhola 1918)",
     xlab = "Idade",
     ylab = "Densidade",
     col = "lightblue",
     border = "white")

# Adicionar curva de densidade
lines(density(flu$age), col = "red", lwd = 2)

# Estatísticas da população
cat("\nEstatísticas da População Original:\n")

## 
## Estatísticas da População Original:

cat("Média:", mean(flu$age), "\n")

## Média: 43.21765

cat("Desvio Padrão:", sd(flu$age), "\n")

## Desvio Padrão: 26.34562

cat("Mediana:", median(flu$age), "\n")

## Mediana: 43

# (2) Criar 200 médias de amostras com n = 35
set.seed(123)  # Para reprodutibilidade
n_amostras <- 200
tamanho_amostra <- 35
medias_amostrais <- numeric(n_amostras)

for(i in 1:n_amostras) {
  amostra <- sample(flu$age, size = tamanho_amostra, replace = TRUE)
  medias_amostrais[i] <- mean(amostra)
}

# (3) Histograma com curva de densidade das médias amostrais
hist(medias_amostrais, 
     probability = TRUE,
     main = "Distribuição das Médias Amostrais (n=35, 200 amostras)",
     xlab = "Média Amostral",
     ylab = "Densidade",
     col = "lightgreen",
     border = "white")

# Adicionar curva de densidade
lines(density(medias_amostrais), col = "blue", lwd = 2)

# Adicionar curva normal teórica
curve(dnorm(x, mean = mean(medias_amostrais), sd = sd(medias_amostrais)), 
      add = TRUE, 
      col = "red", 
      lwd = 2, 
      lty = 2)

legend("topright", 
       legend = c("Densidade Observada", "Normal Teórica"), 
       col = c("blue", "red"), 
       lwd = 2, 
       lty = c(1, 2))

# Estatísticas das médias amostrais
cat("\nEstatísticas das Médias Amostrais:\n")

## 
## Estatísticas das Médias Amostrais:

cat("Média das médias:", mean(medias_amostrais), "\n")

## Média das médias: 42.86329

cat("Desvio padrão das médias:", sd(medias_amostrais), "\n")

## Desvio padrão das médias: 4.164951

cat("Erro padrão teórico:", sd(flu$age)/sqrt(tamanho_amostra), "\n")

## Erro padrão teórico: 4.453223

Conclusão: O Teorema do Limite Central afirma que, independentemente da distribuição original da população, a distribuição das médias amostrais tende a uma distribuição normal à medida que o tamanho da amostra aumenta. Podemos observar que:

A população original (idades durante a epidemia de gripe) é altamente não-normal
As médias de 200 amostras de tamanho 35 seguem aproximadamente uma distribuição normal
A média das médias amostrais é próxima à média populacional
O desvio padrão das médias amostrais é próximo ao erro padrão teórico