matricula <- 2902

Distribuição Binomial

Introdução

1.1.Introdução: A Distribuição Binomial é usada em casos em que o pesquisador deseja descrever um determinado fenômeno através de sua probabilidade de ocorrência na qual as opções são sempre aos pares: cara ou coroa, sucesso ou fracasso, correto ou incorreto, dentre outros, levando em consideração processos anteriores. Para que a distribuição estatística usando Distribuição Binominal seja utilizada, é necessário que o estudo possua as características abaixo:

-Contar com apenas duas probabilidades de resultados; -Os dois resultados possíveis devem ter as mesmas chances de ocorrerem; -Ter espaço amostral finito; -Os eventos devem ser independentes entre si; -Os resultados devem ser descritos em valores discretos;

Seguindo esses critérios, podemos usar dessa análise estatítica ppara conduzir um estudo.

Para determinar os valores atribuidos no estudo, utiliza-se de ferramentas matemáticas para descrever os resultados. Para tal, usa-se a formula algébrica determinada abaixo:

Onde: P é probabilidade de sucesso (1 – p) ou Q é probabilidade de fracasso n é total de ensaios k é número de sucessos da amostra

A Distribuição Binomial é de gnande relevância no meio administrativo e empresarial quando deseja-se implementar um Projeto Seis Sigma, pois auxiliará ao analista do projeto identificar qual variável está saindo de seu processo. Através dessa verificação de dados, o gestor poderá descrever de forma clara e objetiva qual a probabilidade de uma produção contínua apresentar um lote que tenha algum defeito ou falhas exatas na produção, sendo excelente em empresas com volumes altos e lotes maiores.

REFERÊNCIAS https://www.inf.ufsc.br/~andre.zibetti/probabilidade/binomial.html

Suponha que \(X\) tenha distribuição \(Binomial(n,p),\) calcule:

(Exercício 1) \(n=10\) e \(p=0.5\)

n=10
set.seed(matricula)
(p <- round(runif(1,0.3,0.7), digits = 2))
## [1] 0.6
  1. \(P(X=2)\)
dbinom(x=2, size = n, prob = p)
## [1] 0.01061683
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos ==2, "2", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X = 2",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


  1. \(P(X<2)\)
prob1 <- pbinom(q=1, size = n, prob = p, lower.tail = TRUE)

dbinom(x=0, size = n, prob = p)+dbinom(x=1, size = n, prob = p)
## [1] 0.001677722
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos < 2, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X < 2",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

A probabilidade de \(X\) ser menor do que 2 é igual a 0.0016777

  1. \(P(X>2)\)
prob1 <- pbinom(q=2, size = n, prob = p, lower.tail = FALSE)

sum(dbinom(x=3:10, size = n, prob = p))
## [1] 0.9877054
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos > 2, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X > 2",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


  1. \(P(X\leq 2)\)
prob1 <- pbinom(q=2, size = n, prob = p, lower.tail = TRUE)

sum(dbinom(x=0:2, size = n, prob = p))
## [1] 0.01229455
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos <= 2, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X menor ou igual a 2",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

(Exercício 2) \(n=15\) e \(p=??\)

n=15
set.seed(matricula)
(p=round(runif(1,0.3,0.7),2))
## [1] 0.6

a)\(P(X=3)\)

prob1 <- dbinom(x=3, size = n, prob = p)

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos == 3, "3", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X = 3",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


b)\(P(X=5)\)

prob1 <- dbinom(x=5, size = n, prob = p)

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos == 5, "5", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X = 5",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

c)\(P(X\geq 5)\)

prob1 <- 1-sum(dbinom(x=0:4, size = n, prob = p))

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos >= 5, "Maior ou igual a 5", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X >= 5",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


d)\(P(X\leq 4)\)

prob1 <- sum(dbinom(x=0:4, size = n, prob = p))

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos <= 5, "Menor ou igual a 4", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X <= 4",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

e)\(P(X=0)\)

prob1 <- dbinom(x=0, size = n, prob = p)

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse(NSucessos == 0, "0", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X = 0",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


f)\(P(6<X<9)\)

prob1 <- pbinom(q=8, size = n, prob = p, lower.tail = TRUE)-pbinom(q=6, size = n, prob = p, lower.tail = TRUE)

sum(dbinom(x=7:8, size = n, prob = p))
## [1] 0.2951394
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos == 7) | (NSucessos == 8), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de 6<X<9",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


g)\(P(10<X<14)\)

prob1 <- pbinom(q=14, size = n, prob = p, lower.tail = TRUE)-pbinom(q=10, size = n, prob = p, lower.tail = TRUE)

sum(dbinom(x=11:13, size = n, prob = p))
## [1] 0.2121057
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos < 14) & (NSucessos > 10), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de 10<X<14",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


h)\(P(X<11)\)

prob1 <- pbinom(q=10, size = n, prob = p, lower.tail = TRUE)
sum(dbinom(x=0:10, size = n, prob = p))
## [1] 0.7827223
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos < 11), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X<11 ",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


i)\(P(X\leq 11)\)

prob1 <- sum(dbinom(x=0:11, size = n, prob = p))

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos <= 11), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X<=11",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")


j)\(P(X\geq 11)\)

prob1 <- 1-sum(dbinom(x=0:10, size = n, prob = p))

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos >= 11), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X>=11",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

l)\(P(X<15)\)

prob1 <- pbinom(q=14, size = n, prob = p, lower.tail = TRUE)
sum(dbinom(x=0:14, size = n, prob = p))
## [1] 0.9995298
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos < 15), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X<15",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

m)\(P(X=15)\)

prob1 <- dbinom(x=15, size = n, prob = p)

df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos == 15), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X=15",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

n)\(P(X>15)\)

prob1 <- pbinom(q=15, size = n, prob = p, lower.tail = FALSE)
1-sum(dbinom(x=0:15, size = n, prob = p))
## [1] 1.110223e-16
df <- data.frame(NSucessos = 0:n, 
                 prob = dbinom(x=0:n, size = n, prob = p)) %>% 
  mutate(Resultados = ifelse((NSucessos > 15), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X>15",
        subtitle = paste0("Binomial(",n,p,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

Distribuição de Poisson

Introdução

A Distribuição de Poisson foi desenvolvida em meados de 1838 por Siméon Poisson. É uma ferramenta estatística utilizada quando a probabilidade de ocorrência discreta é muito maior que o número médio de ocorrência em um determinado intervalo.

Para se usar esse método de análise é necessário observar alguns pontos:

O experimento calcula quantas vezes um evento ocorre em um determinado intervalo de tempo, área, volume, etc; A probabilidade do evento ocorrer é a mesma para cada intervalo; O número de ocorrências de um intervalo é independente do outro. Esse artifício é muito utlizando por profissionais do Lean Seis Sigma, para desenvolver projetos voltados a otimizações de processos e impulsionar o faturamento de empresas. Os estudos usando Distribuição de Poisson utilizam-se de ferramentas matemática smuito próximas às de Distribuição Binomial, porém, em Poisson utiliza-se os valores de ‘n’ tendento ao infinito e P tendendo a zero, conforme abaixo:

Onde x é a variável aleatória que assume o valor k, e o valor da taxa média “e” é o número de Euler. ## Suponha que \(X\) tenha distribuição \(Poisson(\lambda),\) calcule:

(Exercício 3) \(\lambda = 2\)

n=10
lambda=2
  1. \(P(X=2)\)
prob1 <- dpois(x=2, lambda = lambda)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos == 2, "2", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X=2",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Logo, \(P(X=2)=\) 0.2706706

  1. \(P(X\leq 2)\)
ppois(q=2, lambda = lambda, lower.tail = TRUE)
## [1] 0.6766764
sum(dpois(x=0:2, lambda = lambda))
## [1] 0.6766764
df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos <= 2, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X<=2",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")


  1. \(P(X>2)\)
1-ppois(q=2, lambda = lambda)
## [1] 0.3233236
ppois(q = 2, lambda = lambda, lower.tail = FALSE)
## [1] 0.3233236
df <- data.frame(NSucessos = 0:10, 
                 prob = dpois(x = 0:10, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos > 2, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X>2",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")


  1. \(P(X<2)\)
prob1 <- ppois(q=1, lambda = lambda)

df <- data.frame(NSucessos = 0:10, 
                 prob = dpois(x = 0:10, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos < 2, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X<2",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Dessa forma \(P(X<2)=\) 0.4060058


(Exercício 4) \(lambda=??\)

n=20
set.seed(matricula)
(lambda=round(runif(1,1,5),2))
## [1] 4.03

a)\(P(X=3)\)

sum(dpois(7:8, lambda = lambda))
## [1] 0.09155323
prob1 <- ppois(q=8, lambda = lambda, lower.tail = TRUE)-
  ppois(q=6, lambda = lambda, lower.tail = TRUE)


df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse((NSucessos == 7)| (NSucessos == 8), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de (X=3)",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X=3)=\) 0.0915532


b)\(P(X=5)\)

prob1 <- dpois(x=5, lambda = lambda)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos == 5, "5", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X=5",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X=5)=\) 0.157448

c)\(P(X\geq 5)\)

prob1 <- ppois(q = 4, lambda = lambda, lower.tail = FALSE)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos >= 5, "Maior ou igual a 5", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X=5",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X\geq 5)=\) 0.3770239

d)\(P(X\leq 4)\)

prob1 <- ppois(q = 4, lambda = lambda, lower.tail = TRUE)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos <= 4, "Menor ou igual a 4", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X<=4",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X\leq 4)=\) 0.6229761

e)\(P(X=0)\)

prob1 <- dpois(x=0, lambda = lambda)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos == 0, "0", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X=0",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P((X=0))=\) 0.0177743


f)\(P(6<X<9)\)

sum(dpois(7:8, lambda = lambda))
## [1] 0.09155323
prob1 <- ppois(q=8, lambda = lambda, lower.tail = TRUE)-
  ppois(q=6, lambda = lambda, lower.tail = TRUE)


df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse((NSucessos == 7)| (NSucessos == 8), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de X =7 ou X=8",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(6<X<9)=\) 0.0915532


g)\(P(10<X<14)\)

prob <- sum(dpois(11:13, lambda = lambda))

ppois(q=13, lambda = lambda, lower.tail = TRUE)-ppois(q=10, lambda = lambda, lower.tail = TRUE)
## [1] 0.002919698
df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse((NSucessos > 10) & (NSucessos < 14), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de 10<X<14",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(10<X<14)=\) 0.0915532


h)\(P(X<11)\)

prob1 <- ppois(q = 10, lambda = lambda, lower.tail = TRUE)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos < 11, "Menor do que 11", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X<11",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X<11)=\) 0.9969978


i)\(P(X\leq 11)\)

prob1 <- ppois(q = 11, lambda = lambda, lower.tail = TRUE)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos <= 11, "Menor ou igual a 11", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X<=11",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X\leq 11)=\) 0.9990255


j)\(P(X\geq 11)\)

prob1 <- ppois(q = 10, lambda = lambda, lower.tail = FALSE)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos >= 11, "Maior ou igual a 11", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X>=11",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X\geq 11)=\) 0.0030022


k)\(P(10<X<12)\)

prob1 <- dpois(11, lambda = lambda)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos == 11, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de 10<X<12",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(10<X<12)=\) 0.0020277


l)\(P(X<15)\)

prob1 <- sum(dpois(0:14, lambda = lambda))

ppois(q=14, lambda = lambda, lower.tail = TRUE)
## [1] 0.9999783
df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos < 15, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de X<15",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X<15)=\) 0.9999783


m)\(P(X=15)\)

prob1 <- dpois(x=15, lambda = lambda)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos == 15, "15", "Outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade X=15",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X=15)=\) 1.6325606^{-5}


n)\(P(X>15)\)

prob1 <- ppois(q=15, lambda = lambda, lower.tail = FALSE)

df <- data.frame(NSucessos = 0:n, 
                 prob = dpois(x = 0:n, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos > 15, "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de X>15",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Assim, temos que \(P(X>15)=\) 5.3628504^{-6}



Distribuição Normal

Introdução

A Distribuição Normal foi desenvolvida por Friedrich Gauss em meados do século XIX em que o pesquisador observou, durante seus estudos de fenômenos naturais, que as análises de um espaço amostral giram em torno de um valor médio e possui uma variância padrão (para mais ou para menos). Os valores obtidos possuem um valor médio em seu ponto central do gráfico e possui bordas simétricas, fazendo com que o gráfico a ser montado tenha a famosa forma de sino. Após a formação da curva de Gauss, utilizando-se ferramentas matemáticas, calculando-se a área abaixo da curva é possível determinar a probabilidade de ocorrência de um determinado evento.

Os dados basicamente são expostos no gráfico de forma simples. Calcula-se inicialmente qual o ponto em que ocorre a maior parte dos eventos (chamado de ponto médio) e em seguida, calcula-se os desvios padrões que esse estudo terá. Sendo assim, pode-se traçar um grafico de Gauss como ilustrado abaixo.

Sendo assim, a probabilidade de um valor investigado acontecer é dado pelo cálculo da área traçada abaixo da curva.

Suponha que \(X\) tenha distribuição \(Normal(\mu, \sigma^2),\) calcule:

(Exercício 5) \(\mu = 5, \sigma=2\)

mu=5
sigma=2

  1. \(P(X<2)\)
pnorm(q=2, mean = mu, sd=sigma)
## [1] 0.0668072
pnormGC(2, region="below", mean=mu,
        sd=sigma, graph=TRUE)

## [1] 0.0668072
  1. \(P(X>2)\)
1-pnorm(2, mean = mu, sd=sigma, lower.tail = TRUE)
## [1] 0.9331928
pnorm(2, mean = mu, sd=sigma, lower.tail = FALSE)
## [1] 0.9331928
pnormGC(2, region="above", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.9331928

  1. \(P(2<X<11)\)
pnorm(11, mean = mu, sd=sigma)-pnorm(2, mean = mu, sd=sigma)
## [1] 0.9318429
pnormGC(c(2,11), region="between", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.9318429
  1. \(P(X>8)\)
pnorm(8, mean = mu, sd=sigma, lower.tail = FALSE)
## [1] 0.0668072
pnormGC(8, region="above", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.0668072

(Exercício 6) \(\mu = ??, \sigma=??\)

set.seed(matricula)
(mu <- 5)
## [1] 5
(sigma <- round(runif(1,2,10), digits = 0))
## [1] 8

a)\(P(X\leq 3)\)

prob1 <- pnorm(3, mean = mu, sd=sigma, lower.tail = TRUE)


pnormGC(3, region="below", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.4012937

A probabilidade de \(X\) menor ou igual a 3 é de 0.4012937


b)\(P(X=5)\)

prob1 <- pnorm(5, mean = mu, sd=sigma, lower.tail = FALSE)-pnorm(5, mean = mu, sd=sigma, lower.tail = TRUE)


pnormGC(c(5,5), region="between", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0

A probabilidade de \(X\) igual a 5 é de 0

c)\(P(X\geq 5)\)

prob1 <- pnorm(5, mean = mu, sd=sigma, lower.tail = FALSE)


pnormGC(5, region="above", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.5

A probabilidade de \(X\) maior igual a 5 é de 0.5


d)\(P(X\leq 4)\)

prob1 <- pnorm(4, mean = mu, sd=sigma, lower.tail = TRUE)


pnormGC(4, region="below", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.4502618

A probabilidade de \(X\) menor igual a 4 é de 0.4502618


e)\(P(X=0)\)

prob1 <- pnorm(0, mean = mu, sd=sigma, lower.tail = FALSE)-pnorm(0, mean = mu, sd=sigma, lower.tail = TRUE)


pnormGC(c(0,0), region="between", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0

A probabilidade de \(X\) igual a 0 é de 0.4680289


f)\(P(3<X<5)\)

prob1 <- pnorm(5, mean = mu, sd=sigma)-pnorm(3, mean = mu, sd=sigma)


pnormGC(c(3,5), region="between", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.09870633

A probabilidade de \(X\) maior que 3 e menor que 5 é de 0.0987063


g)\(P(2<X<6)\)

prob1 <- pnorm(6, mean = mu, sd=sigma)-pnorm(2, mean = mu, sd=sigma)


pnormGC(c(2,6), region="between", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.195908

A probabilidade de \(X\) maior que 2 e menor que 6 é de 0.195908


h)\(P(X<4)\)

prob1 <- pnorm(q=4, mean = mu, sd=sigma)

pnormGC(4, region="below", mean=mu,
        sd=sigma, graph=TRUE)

## [1] 0.4502618

A probabilidade de \(X\) menor que 4 é igual a 0.4502618


i)\(P(X\leq 7)\)

prob1 <- pnorm(7, mean = mu, sd=sigma, lower.tail = TRUE)


pnormGC(7, region="below", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.5987063

A probabilidade de \(X\) menor igual a 7 é de 0.5987063


j)\(P(X\geq 7)\)

prob1 <- 1-pnorm(7, mean = mu, sd=sigma)


pnormGC(7, region="above", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.4012937

A probabilidade de \(X\) maior igual a 7 será de 0.4012937


k)\(P(3<X<4)\)

prob1 <- pnorm(4, mean = mu, sd=sigma)-pnorm(3, mean = mu, sd=sigma)


pnormGC(c(3,4), region="between", mean=mu,
        sd=sigma,graph=TRUE)

## [1] 0.0489681

A probabilidade de \((3<X<4)\) maior que 3 e menor que 4 é de 0.0489681


l)\(P(X<6)\)

prob1 <- pnorm(q=6, mean = mu, sd=sigma)

pnormGC(6, region="below", mean=mu,
        sd=sigma, graph=TRUE)

## [1] 0.5497382

A probabilidade de \((X<6)\) menor que 6 é de 0.5497382


m)\(P(X=15)\)

prob <- pnormGC(c(15,15), region="between", mean=mu,
        sd=sigma,graph=TRUE)

Vemos que área da figura com a distribuição normal para X assumindo um valor específico é \(P(X=15)=\) 0.5497382


n)\(P(X>5)\)

prob <- pnormGC(5, region="above", mean=mu,
        sd=sigma,graph=TRUE)

A probabilidade de \(P(X>5)]=\) é igual a 0.5497382


Exercícios Práticos

(Retirado de Rpubs) Considere nascimentos de 4 filhotes de coelhos de uma determinada raça. Nesta raça há um distúrbio genético e a probabilidade de nascer fêmea é 5/8. Sendo X a ocorrência de fêmeas e utilizando a distribuição binomial obter:

  1. Construa um gráfico de probabilidades
femeas <- 0:4
prob <- dbinom(x=femeas, # Quantidade de sucessos
               size = 4, # Quantidade de nascimento
               prob=5/8) # Probabilidade a priori de sucesso

prob
## [1] 0.01977539 0.13183594 0.32958984 0.36621094 0.15258789
plot(femeas, prob, 
     type='h',   # Desenha uma linha vertical
     col='red',   # Cor da linha
     lwd=3)      # Espessura da linha/ponto

  1. Qual a probabilidade de nascer pelo menos três fêmeas.
prob <- pbinom(q=2,         # Quantidade de fêmeas
        size=4,      # Quantidade total de filhores
        prob=5/8,    # Probabilidade inicial de fêmea
        lower.tail = FALSE #P[X> x]
        )

A probabilidade de nascer pelo menos três fêmeas é dada por 0.5187988

Exercício Prático de Binomial (Acrescentar)

O centro de distribuição da Mary Kay em Betim tira da linha para conferência de qualidade 20 caixas de um lote que contém 20% das caixas com erro. Qual a probabilidade que não mais do que 4 caixas retiradas contenham erros ?

prob1 <- sum(dbinom(x=0:4, size = 20, prob = 0.2))

df <- data.frame(NSucessos = 0:20, 
                 prob = dbinom(x=0:20, size = 20, prob = 0.2)) %>% 
  mutate(Resultados = ifelse(NSucessos <= 4, "Menor ou igual a 4", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X <= 4",
        subtitle = paste0("Binomial(",20,",",0.2,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

Sendo assim temos que a probabilidade de se encontrar não mais que 4 caixas com erros é de 0.6296483

Um atirador em um clube de tiro dispara 15 munições de um lote onde 85% das munições não apresenta defeito, qual a probabilidade de que 10 das munições não apresentem falha ?

prob1 <- dbinom(x=10, size = 15, prob = 0.85)

df <- data.frame(NSucessos = 0:15, 
                 prob = dbinom(x=0:15, size = 15, prob = 0.85)) %>% 
  mutate(Resultados = ifelse(NSucessos == 10, "10", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) + 
  geom_col() + 
  geom_text(
    aes(label = round(prob, 5), y = prob+0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) + 
  labs (title = "Probabilidade de X = 10",
        subtitle = paste0("Binomial(",15,",",0.85,")"),
        x = "Sucessos (X)",
        y = "Probabilidade")

Sendo assim temos que a probabilidade de 10 munições não apresentarem defeitos é de 0.0448953

Exercício Prático de Poisson (Acrescentar)

Em uma guerra o número de aviões que aparece em um sistema de radar em qualquer intervalo de 60 segundos sob determinadas condições é em média 1.81. Os aviões aparecem aleatóriamente e sem relação definida.

  1. Qual é a probabilidade de que nenhum avião seja encontrado em um intervalo de 90 segundos?
segundos <- 90
tsegundosOcorrenciaAvioes <- 30
tMinutosOcorrenciaAvioes <- tsegundosOcorrenciaAvioes/segundos
lambda <- 1.81/tMinutosOcorrenciaAvioes

prob1 <- dpois(x=0, lambda = lambda)

df <- data.frame(NSucessos = 0:10, 
                 prob = dpois(x = 0:10, lambda = lambda)) %>%
      mutate(Resultados = ifelse(NSucessos == 0, "0 Avioes", "outro"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de ocorrencia de 0 Avioes (P(X=0))",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Ocorrencia de avioes (x)",
       y = "Probabilidade")

Sendo assim temos que a probabilidade de nenhum avião ser encontrado dentro do intervalo de 90 segundos é de 0.0043831

  1. Qual é a probabilidade de que sejam observados no mínimo cinco porém não mais que oito aviões em 120-segundos de observação?
segundos <- 60
tsegundosOcorrenciaAvioes <- 30
tsegundosOcorrenciaAvioes <- tsegundosOcorrenciaAvioes/segundos
lambda <- (1.81/tsegundosOcorrenciaAvioes) * 2

prob1 <- sum(dpois(5:8, lambda = lambda))

df <- data.frame(NSucessos = 0:10, 
                 prob = dpois(x = 0:10, lambda = lambda)) %>%
      mutate(Resultados = ifelse((NSucessos >= 5) & (NSucessos <= 8), "Sucesso", "Fracasso"))

ggplot(df, aes(x = factor(NSucessos), y = prob, fill = Resultados)) +
  geom_col() +
  geom_text(
    aes(label = round(prob,5), y = prob + 0.01),
    position = position_dodge(0.9),
    size = 3,
    vjust = 0
  ) +
  labs(title = "Probabilidade de 5 <= X <= 8",
       subtitle = paste0("Poisson(",lambda,")"),
       x = "Sucessos (x)",
       y = "Probabilidade")

Exercício Prático de Normal (Acrescentar)

Uma pesquisa da UQEQ mostra o tempo médio para um avião pousar e decolar de um aeroporto de grande porte em Belo Horizonte. Com base nos dados foi calculado o tempo médio de 142 minutos e um desvio padrão de 23 minutos.

  1. Qual a probabilidade de um avião pousar e decolar em 100 minutos ou menos ?
mu <- 142
sigma <- 23
prob <- pnormGC(100, region="below", mean=mu,
        sd=sigma,graph=TRUE)

Sendo assim temos que a probabilidade de um avião pousar e decolar em 100 minutos ou menos é de 0.5451062

  1. Qual a probabilidade de um avião pousar e decolar entre 115 e 130 minutos ?
mu <- 142
sigma <- 23
prob1 <- pnormGC(c(115,130), region="between", mean=mu,
        sd=sigma,graph=TRUE)

Sendo assim temos que a probabilidade de um avião pousar e decolar entre 115 e 130 minutos é de 0.1807111