2 VA

VADeaths

library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.3     ✔ readr     2.1.4
## ✔ forcats   1.0.0     ✔ stringr   1.5.0
## ✔ ggplot2   3.4.4     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.0
## ✔ purrr     1.0.2     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
data(VADeaths)

df <- as.data.frame(VADeaths)

df$AgeGroup <- rownames(df)

cores <- c("Rural Male" = "DarkGreen", "Rural Female" = "LightGreen", "Urban Male" = "DarkGray", "Urban Female" = "LightGray")

df_long <- df %>%
  pivot_longer(cols = -AgeGroup, names_to = "Category", values_to = "Frequency")

ggplot(df_long, aes(x = AgeGroup, y = Frequency, fill = Category)) +
  geom_bar(stat = "identity", position = "dodge") +
  scale_fill_manual(values = cores) +
  labs(title = "Mortes por Categoria", x = "Faixa Etária", y = "Frequência", fill = "Categoria") +
  theme_minimal()

ClassificaçãoDoença

pacientes <- c("moderado", "leve", "leve", "severo", "leve", "moderado", "moderado", "moderado", "leve", "leve", "severo","leve", "moderado", "moderado", "leve", "severo", "moderado", "moderado", "moderado","leve")

freq <- table(pacientes)

cores <- c("leve" = "orange", "moderado" = "red", "severo" = "purple")

pie(freq, labels = paste0(names(freq), "\n", round(prop.table(freq) * 100, 1), "%"), col = cores[names(freq)], main = "Estágios da doença")

legend("topright", legend = names(freq), fill = cores[names(freq)])

Teorema

library(ggplot2)

flu <- read_csv("flu.csv")
## Rows: 75034 Columns: 1
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## dbl (1): age
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
ggplot(flu, aes(x = age)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "lightgreen", color = "black") +
  geom_density(color = "red") +
  theme_minimal() +
  labs(title = "Histograma e Densidade do Conjunto de Dados 'flu'", x = "Idade", y = "Densidade")

num_samples <- 200
sample_size <- 35

sample_means <- numeric(num_samples)

set.seed(123) 
for (i in 1:num_samples) {
  sample <- sample(flu$age, size = sample_size)
  sample_means[i] <- mean(sample)
}

head(sample_means)
## [1] 38.88571 42.94286 48.51429 42.48571 40.34286 42.14286
sample_means_df <- data.frame(sample_means = sample_means)

ggplot(sample_means_df, aes(x = sample_means)) +
  geom_histogram(aes(y = ..density..), bins = 30, fill = "lightgreen", color = "black") +
  geom_density(color = "red") +
  theme_minimal() +
  labs(title = "Histograma e Densidade das Médias das Amostras", x = "Média da Amostra", y = "Densidade")

Amostra

Z <- 2.576  # Valor Z para um nível de confiança de 99%
sigma <- 0.5  # Desvio padrão da população
E <- 0.1  # Erro amostral desejado
N <- 300  # Tamanho da população

n <- (Z * sigma / E)^2

if (n > N * 0.05) {
  n <- n / (1 + (n - 1) / N)
}

n <- round(n, 2)

cat("O tamanho da amostra é", n)
## O tamanho da amostra é 107.05

Porcentagem

x <- 500  # Pontuação bruta
mu <- 400  # Média da população
sigma <- 45  # Desvio padrão da população


z <- (x - mu) / sigma

p_less_than_x <- pnorm(z)

p_more_than_x <- 1 - p_less_than_x

p_more_than_x_percent <- round(p_more_than_x * 100, 2)

cat(p_more_than_x_percent,"%")
## 1.31 %

Bdims

load("bdims.RData")

women_data <- subset(bdims, sex == 0)

result <- t.test(women_data$hgt, conf.level = 0.985)

ci <- round(result$conf.int, 2)

ci_formatted <- paste0("Intervalo de Confianca: ","[", sprintf("%.2f", ci[1]), "-", sprintf("%.2f", ci[2]), "]")

ci_formatted
## [1] "Intervalo de Confianca: [163.88-165.87]"