Serão mostradas as distribuições que a estatística tem como padronização.
Distribuição Normal:
A distribuição normal, também conhecida como a distribuição gaussiana, é caracterizada pela sua forma de sino. Ela é completamente especificada por sua média (centro) e desvio padrão (dispersão). Muitos fenômenos naturais seguem uma distribuição normal, de acordo com o Teorema Central do Limite.
# Gerar dados de uma distribuição normal
dados_normais <- rnorm(1000, mean = 0, sd = 1)
# Criar um histograma
hist(dados_normais, main = "Distribuição Normal", xlab = "Valores", ylab = "Frequência", col = "skyblue")
# Adicionar uma curva de densidade
lines(density(dados_normais), col = "red")
Distribuição Uniforme:
A distribuição uniforme é caracterizada por ter todos os valores entre dois limites igualmente prováveis. Em outras palavras, cada valor dentro do intervalo tem a mesma chance de ocorrer. É comumente usada em simulações e modelagem quando não há razão para acreditar que um valor é mais provável do que outro.
# Gerar dados de uma distribuição uniforme
dados_uniformes <- runif(1000, min = 0, max = 1)
# Criar um histograma
hist(dados_uniformes, main = "Distribuição Uniforme", xlab = "Valores", ylab = "Frequência", col="skyblue")
Distribuição Exponencial:
A distribuição exponencial descreve o tempo entre eventos em um processo de Poisson, onde os eventos ocorrem de forma contínua e independentemente a uma taxa média constante. Ela é frequentemente usada para modelar o tempo de vida de dispositivos ou a duração de intervalos de tempo entre eventos.
# Gerar dados de uma distribuição exponencial
dados_exponenciais <- rexp(1000, rate = 0.1)
# Criar um histograma
hist(dados_exponenciais, main = "Distribuição Exponencial", xlab = "Valores", ylab = "Frequência", col="skyblue")
Distribuição de Poisson:
A distribuição de Poisson modela a ocorrência de eventos em um intervalo de tempo ou espaço fixo. Ela é usada quando os eventos são raros e independentes, mas a taxa média de ocorrência é constante. Exemplos incluem a contagem de chamadas em um call center ou o número de acidentes em uma rodovia em um determinado período.
# Gerar dados de uma distribuição de Poisson
dados_poisson <- rpois(1000, lambda = 3)
# Criar um histograma
hist(dados_poisson, main = "Distribuição de Poisson", xlab = "Valores", ylab = "Frequência", col="skyblue")
Distribuição Binomial:
A distribuição binomial descreve o número de sucessos em um número fixo de tentativas independentes, cada uma com a mesma probabilidade de sucesso. É comumente usada para modelar experimentos de Bernoulli, onde um evento pode ter apenas dois resultados possíveis, como sucesso ou fracasso.
# Gerar dados de uma distribuição binomial
dados_binomiais <- rbinom(1000, size = 10, prob = 0.3)
# Criar um histograma
hist(dados_binomiais, main = "Distribuição Binomial", xlab = "Valores", ylab = "Frequência", col="skyblue")
#Distribuição de Chi-Square:
A distribuição qui-quadrado é usada principalmente em testes de hipóteses estatísticas. É a distribuição da soma dos quadrados de variáveis aleatórias padrão normais independentes. A forma da distribuição depende do número de graus de liberdade.
# Gerar dados de uma distribuição de chi-square
dados_chi_square <- rchisq(1000, df = 5)
# Criar um histograma
hist(dados_chi_square, main = "Distribuição de Chi-Square", xlab = "Valores", ylab = "Frequência", col = "skyblue")
#Distribuição T de Student:
A distribuição t de Student é usada em inferência estatística para estimar a média de uma população quando a amostra é pequena e/ou quando a variância populacional é desconhecida. Ela é mais larga e tem caudas mais pesadas do que a distribuição normal, o que a torna apropriada para amostras menores. O grau de liberdade afeta a forma da distribuição.
# Gerar dados de uma distribuição t de Student
dados_t <- rt(1000, df = 10)
# Criar um histograma
hist(dados_t, main = "Distribuição T de Student", xlab = "Valores", ylab = "Frequência", col="skyblue")
#$Distribuição Gama:
A distribuição gama é uma família de distribuições que inclui a exponencial e a distribuição de Erlang como casos especiais. É frequentemente usada para modelar o tempo de espera até um determinado número de eventos ocorrer.
# Gerar dados de uma distribuição gama
dados_gama <- rgamma(1000, shape = 2, rate = 1)
# Criar um histograma
hist(dados_gama, main = "Distribuição Gama", xlab = "Valores", ylab = "Frequência", col="skyblue")
A distribuição log-normal modela variáveis cujos logs são normalmente distribuídos. Isso significa que os dados em si não são normalmente distribuídos, mas seus logs são. É frequentemente utilizada para modelar preços de ativos financeiros, onde as variações percentuais são mais relevantes do que as variações absolutas.
# Gerar dados de uma distribuição log-normal
dados_lognormais <- rlnorm(1000, meanlog = 0, sdlog = 1)
# Criar um histograma
hist(dados_lognormais, main = "Distribuição Log-Normal", xlab = "Valores", ylab = "Frequência", col="skyblue")
# Instale a biblioteca ggplot2 se ainda não estiver instalada
# install.packages("ggplot2")
# Carregue a biblioteca
# Instale a biblioteca ggplot2 se ainda não estiver instalada
# install.packages("ggplot2")
# Carregue a biblioteca
library(ggplot2)
# Crie dados para cada distribuição
dados_normais <- rnorm(1000, mean = 0, sd = 1)
dados_uniformes <- runif(1000, min = 0, max = 1)
dados_exponenciais <- rexp(1000, rate = 0.1)
dados_poisson <- rpois(1000, lambda = 3)
dados_binomiais <- rbinom(1000, size = 10, prob = 0.3)
dados_chi_square <- rchisq(1000, df = 5)
dados_t <- rt(1000, df = 10)
dados_lognormais <- rlnorm(1000, meanlog = 0, sdlog = 1)
dados_weibull <- rweibull(1000, shape = 2, scale = 1)
dados_gama <- rgamma(1000, shape = 2, rate = 1)
# Crie um data frame com os dados
dados <- data.frame(
Distribuicao = rep(c("Normal", "Uniforme", "Exponencial", "Poisson", "Binomial", "Chi-Square", "T de Student", "Log-Normal", "Weibull", "Gama"), each = 1000),
Valores = c(dados_normais, dados_uniformes, dados_exponenciais, dados_poisson, dados_binomiais, dados_chi_square, dados_t, dados_lognormais, dados_weibull, dados_gama)
)
# Crie um gráfico de facetas (facet_wrap)
ggplot(dados, aes(x = Valores, fill = Distribuicao)) +
geom_histogram(binwidth = 0.5, position = "identity", alpha = 0.7) +
facet_wrap(~Distribuicao, scales = "free") +
labs(title = "Distribuições Estatísticas", x = "Valores", y = "Frequência") +
theme_minimal()