VA21.knit

2 VA

VADeaths

library(ggplot2)
library(reshape2)

## Warning: pacote 'reshape2' foi compilado no R versão 4.5.2

# Dataset pedido
data("VADeaths")

df <- as.data.frame(VADeaths)
df$Faixa <- rownames(df)

df_long <- melt(df, id.vars = "Faixa",
                variable.name = "Grupo",
                value.name = "Taxa")

# grafico das barras cruzando faixa etária e a taxa de mortalidade de cada grupo
ggplot(df_long, aes(x = Faixa, y = Taxa, fill = Grupo)) +
  geom_bar(stat = "identity") +
  labs(
    title = "Mortalidade na Virgínia – Barras Empilhadas",
    x = "Faixa Etária",
    y = "Taxa",
    fill = "Grupo"
  ) +
  theme_bw()

ClassificaçãoDoença

# Dados
doenca <- c(
  "moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo","leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado","leve")
# Frequências
tab <- table(doenca)
# Porcentagens
pct <- round(tab / sum(tab) * 100, 2)
# Labels com porcentagem
lbl <- paste(names(tab), "-", pct, "%")
# Cores
cores <- c("yellow", "orange", "red")


# Gráfico de pizza
pie(
  tab,
  labels = lbl,
  col = cores,
  main = "Classificação dos Pacientes"
)
# Legenda
legend(
  "topright",
  legend = names(tab),
  fill = cores,
  cex = 1
)

Teorema

# 1. Carregar dataset
flu <- read.csv("flu.csv")
idade <- flu$age 
# 1) Histograma e densidade da população
hist(idade,
     breaks = 30,
     freq = FALSE,
     col = "lightgray",
     main = "Distribuição das Idades",
     xlab = "Idade",
     ylab = "quantidade de mortes")

lines(density(idade), col = "red", lwd = 2)

# 2) Criando as 200 médias de amostras com n = 35
set.seed(123)
medias <- replicate(200, mean(sample(idade, 35, replace = TRUE)))
# 3) Histograma e a densidade das médias
hist(medias,
     breaks = 15,
     freq = FALSE,
     col = "lightblue",
     main = "Distribuição das Médias Amostrais",
     xlab = "Média da Idade",
     ylab = "Quantidade de mortes")
lines(density(medias), col = "darkblue", lwd = 2)

Peso dos gatos da Ruralinda

N <- 300 # numero de gatos da amostra
Z <- 2.575829 #Z obtido da tabela valor crítico da distribuição normal para 99%
sigma <- 0.5 #valor  desvio-padrão para 0.5
E <- 0.1 #Valor maximo de erro amostral

n <- (N * (Z^2) * (sigma^2)) / (E^2 * (N - 1) + (Z^2) * (sigma^2))
n

## [1] 107.0438

Quantidade de comida ingerida no RU

alunos <- 1 - pnorm(500, mean = 400, sd = 45)
alunos <- alunos*100
alunos

## [1] 1.313415

bdims.RData

load("bdims.RData")

# filtrar só as mulheres
mulheres <- subset(bdims, sex == 0)

# a média
media <- mean(mulheres$hgt)

# o desvio padrão
desvio <- sd(mulheres$hgt)

# tamanho da amostra
n <- length(mulheres$hgt)

# nível 98.5%
z <- qnorm(0.9925)  #obtido de1-0.985, sobrando 0.015, dai divide por /2 ficando 0.0075, com isso subtrai 1- 0.0075 = 0.9925, seguindo a logica estatistica de probabilidade acumulada

# margem de erro pedida
ME <- z * desvio / sqrt(n)

# intervalo de confiança
IC_inferior <- media - ME
IC_superior <- media + ME

IC_inferior

## [1] 163.8851

IC_superior

## [1] 165.8596