Serão mostradas as distribuições que a estatística tem como padronização.

Distribuição Normal:

A distribuição normal, também conhecida como a distribuição gaussiana, é caracterizada pela sua forma de sino. Ela é completamente especificada por sua média (centro) e desvio padrão (dispersão). Muitos fenômenos naturais seguem uma distribuição normal, de acordo com o Teorema Central do Limite.

# Gerar dados de uma distribuição normal
dados_normais <- rnorm(1000, mean = 0, sd = 1)

# Criar um histograma
hist(dados_normais, main = "Distribuição Normal", xlab = "Valores", ylab = "Frequência", col = "skyblue")

# Adicionar uma curva de densidade
lines(density(dados_normais), col = "red")

Distribuição Uniforme:

A distribuição uniforme é caracterizada por ter todos os valores entre dois limites igualmente prováveis. Em outras palavras, cada valor dentro do intervalo tem a mesma chance de ocorrer. É comumente usada em simulações e modelagem quando não há razão para acreditar que um valor é mais provável do que outro.

# Gerar dados de uma distribuição uniforme
dados_uniformes <- runif(1000, min = 0, max = 1)

# Criar um histograma
hist(dados_uniformes, main = "Distribuição Uniforme", xlab = "Valores", ylab = "Frequência", col="skyblue")

Distribuição Exponencial:

A distribuição exponencial descreve o tempo entre eventos em um processo de Poisson, onde os eventos ocorrem de forma contínua e independentemente a uma taxa média constante. Ela é frequentemente usada para modelar o tempo de vida de dispositivos ou a duração de intervalos de tempo entre eventos.

# Gerar dados de uma distribuição exponencial
dados_exponenciais <- rexp(1000, rate = 0.1)

# Criar um histograma
hist(dados_exponenciais, main = "Distribuição Exponencial", xlab = "Valores", ylab = "Frequência", col="skyblue")

Distribuição de Poisson:

A distribuição de Poisson modela a ocorrência de eventos em um intervalo de tempo ou espaço fixo. Ela é usada quando os eventos são raros e independentes, mas a taxa média de ocorrência é constante. Exemplos incluem a contagem de chamadas em um call center ou o número de acidentes em uma rodovia em um determinado período.

# Gerar dados de uma distribuição de Poisson
dados_poisson <- rpois(1000, lambda = 3)

# Criar um histograma
hist(dados_poisson, main = "Distribuição de Poisson", xlab = "Valores", ylab = "Frequência", col="skyblue")

Distribuição Binomial:

A distribuição binomial descreve o número de sucessos em um número fixo de tentativas independentes, cada uma com a mesma probabilidade de sucesso. É comumente usada para modelar experimentos de Bernoulli, onde um evento pode ter apenas dois resultados possíveis, como sucesso ou fracasso.

# Gerar dados de uma distribuição binomial
dados_binomiais <- rbinom(1000, size = 10, prob = 0.3)

# Criar um histograma
hist(dados_binomiais, main = "Distribuição Binomial", xlab = "Valores", ylab = "Frequência", col="skyblue")

#Distribuição de Chi-Square:

A distribuição qui-quadrado é usada principalmente em testes de hipóteses estatísticas. É a distribuição da soma dos quadrados de variáveis aleatórias padrão normais independentes. A forma da distribuição depende do número de graus de liberdade.

# Gerar dados de uma distribuição de chi-square
dados_chi_square <- rchisq(1000, df = 5)

# Criar um histograma
hist(dados_chi_square, main = "Distribuição de Chi-Square", xlab = "Valores", ylab = "Frequência", col = "skyblue")

#Distribuição T de Student:

A distribuição t de Student é usada em inferência estatística para estimar a média de uma população quando a amostra é pequena e/ou quando a variância populacional é desconhecida. Ela é mais larga e tem caudas mais pesadas do que a distribuição normal, o que a torna apropriada para amostras menores. O grau de liberdade afeta a forma da distribuição.

# Gerar dados de uma distribuição t de Student
dados_t <- rt(1000, df = 10)

# Criar um histograma
hist(dados_t, main = "Distribuição T de Student", xlab = "Valores", ylab = "Frequência", col="skyblue")

#$Distribuição Gama:

A distribuição gama é uma família de distribuições que inclui a exponencial e a distribuição de Erlang como casos especiais. É frequentemente usada para modelar o tempo de espera até um determinado número de eventos ocorrer.

# Gerar dados de uma distribuição gama
dados_gama <- rgamma(1000, shape = 2, rate = 1)

# Criar um histograma
hist(dados_gama, main = "Distribuição Gama", xlab = "Valores", ylab = "Frequência", col="skyblue")

Distribuição Log-Normal:

A distribuição log-normal modela variáveis cujos logs são normalmente distribuídos. Isso significa que os dados em si não são normalmente distribuídos, mas seus logs são. É frequentemente utilizada para modelar preços de ativos financeiros, onde as variações percentuais são mais relevantes do que as variações absolutas.

# Gerar dados de uma distribuição log-normal
dados_lognormais <- rlnorm(1000, meanlog = 0, sdlog = 1)

# Criar um histograma
hist(dados_lognormais, main = "Distribuição Log-Normal", xlab = "Valores", ylab = "Frequência", col="skyblue")

Todas as distribuições citadas acima.

# Instale a biblioteca ggplot2 se ainda não estiver instalada
# install.packages("ggplot2")

# Carregue a biblioteca
# Instale a biblioteca ggplot2 se ainda não estiver instalada
# install.packages("ggplot2")

# Carregue a biblioteca
library(ggplot2)

# Crie dados para cada distribuição
dados_normais <- rnorm(1000, mean = 0, sd = 1)
dados_uniformes <- runif(1000, min = 0, max = 1)
dados_exponenciais <- rexp(1000, rate = 0.1)
dados_poisson <- rpois(1000, lambda = 3)
dados_binomiais <- rbinom(1000, size = 10, prob = 0.3)
dados_chi_square <- rchisq(1000, df = 5)
dados_t <- rt(1000, df = 10)
dados_lognormais <- rlnorm(1000, meanlog = 0, sdlog = 1)
dados_weibull <- rweibull(1000, shape = 2, scale = 1)
dados_gama <- rgamma(1000, shape = 2, rate = 1)

# Crie um data frame com os dados
dados <- data.frame(
  Distribuicao = rep(c("Normal", "Uniforme", "Exponencial", "Poisson", "Binomial", "Chi-Square", "T de Student", "Log-Normal", "Weibull", "Gama"), each = 1000),
  Valores = c(dados_normais, dados_uniformes, dados_exponenciais, dados_poisson, dados_binomiais, dados_chi_square, dados_t, dados_lognormais, dados_weibull, dados_gama)
)

# Crie um gráfico de facetas (facet_wrap)
ggplot(dados, aes(x = Valores, fill = Distribuicao)) +
  geom_histogram(binwidth = 0.5, position = "identity", alpha = 0.7) +
  facet_wrap(~Distribuicao, scales = "free") +
  labs(title = "Distribuições Estatísticas", x = "Valores", y = "Frequência") +
  theme_minimal()

Distribuições Estatísticas.

aldrei peralta

2023-12-03

Distribuição Log-Normal:

Todas as distribuições citadas acima.