2 Distribuição de Probabilidades:

2.1 Distribuição Binomial:

1. Uma moeda é lançada 8 vezes. Qual é a probabilidade de obter exatamente 3 caras?

dbinom(3, size = 8, prob = 0.5)
## [1] 0.21875

2. Um dado é lançado 10 vezes. Qual é a probabilidade de obter exatamente 2 vezes o número 5?

dbinom(2, size = 10, prob = 1/6)
## [1] 0.29071

3. Em uma linha de produção, 90% dos produtos são de boa qualidade. Se selecionarmos aleatoriamente 15 produtos, qual é a probabilidade de exatamente 12 serem de boa qualidade?

dbinom(12, size = 15, prob = 0.9)
## [1] 0.1285054

4. Um jogo de trivia tem 20 perguntas. Se uma pessoa responde aleatoriamente a cada pergunta, qual é a probabilidade de acertar pelo menos 15 perguntas?

1 - pbinom(14, size = 20, prob = 0.25)
## [1] 3.813027e-06

5. Uma urna contém 8 bolas vermelhas e 5 bolas azuis. Se retirarmos 3 bolas aleatoriamente, qual é a probabilidade de exatamente 2 serem vermelhas?

probabilidade2 <- dhyper(2, m = 8, n = 5, k = 3)
print(paste("Em percentual temos: ", round(probabilidade2 * 100, 2), "%"))
## [1] "Em percentual temos:  48.95 %"

6. Um estudante está se preparando para um teste de múltipla escolha com 5 questões. Cada questão tem 4 opções. Qual é a probabilidade de o estudante acertar exatamente 3 questões?

dbinom(3, size = 5, prob = 1/4)
## [1] 0.08789063

7. Um dado viciado é lançado 6 vezes. A probabilidade de obter um número ímpar em um único lançamento é 0,4. Qual é a probabilidade de obter exatamente 2 números ímpares em 6 lançamentos?

dbinom(2, size = 6, prob = 0.4)
## [1] 0.31104

8. Um experimento é repetido 20 vezes. Se a probabilidade de sucesso em um único experimento é 0,3, qual é a probabilidade de exatamente 6 sucessos?

dbinom(6, size = 20, prob = 0.3)
## [1] 0.191639

9. Uma urna contém 12 bolas, das quais 4 são defeituosas. Se retirarmos 3 bolas aleatoriamente, qual é a probabilidade de pelo menos 2 serem defeituosas?

result <- dhyper(2, m = 4, n = 8, k = 3) + dhyper(3, m = 4, n = 8, k = 3)
print(result)
## [1] 0.2363636
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 23.64 %"

10. Uma lâmpada tem uma probabilidade de 0,9 de funcionar corretamente. Se comprarmos 5 lâmpadas, qual é a probabilidade de pelo menos 4 delas funcionarem corretamente?

result <- dbinom(4, 5, 0.9) + dbinom(5, 5, 0.9)
print(result)
## [1] 0.91854
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 91.85 %"

2.2 Distribuição de Poisson:

11.Em uma fábrica de chocolates, a média de defeitos por lote é 2. Qual é a probabilidade de haver exatamente 3 defeitos em um lote?

result <- dpois(3, lambda = 2)
print(result)
## [1] 0.180447
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 18.04 %"

12. Um call center recebe em média 4 reclamações por hora. Qual é a probabilidade de receber pelo menos 6 reclamações em uma hora?

result <- 1 - ppois(5, lambda = 4)
print(result)
## [1] 0.2148696
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 21.49 %"

13. Em uma livraria, a média de clientes que entram a cada 15 minutos é 8. Qual é a probabilidade de pelo menos 10 clientes entrarem em um intervalo de 15 minutos?

result <- 1 - ppois(9, lambda = 8)
print(result)
## [1] 0.2833757
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 28.34 %"

14. Um sistema de alarme de incêndio tem uma média de 0,5 disparos por dia. Qual é a probabilidade de ocorrerem exatamente 1 disparo em um dia específico?

result <- dpois(1, lambda = 0.5)
print(result)
## [1] 0.3032653
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 30.33 %"

15. Em uma estação de metrô, a média de atrasos por semana é 3. Qual é a probabilidade de ocorrerem pelo menos 5 atrasos em uma semana?

result <- 1 - ppois(4, lambda = 3)
print(result)
## [1] 0.1847368
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 18.47 %"

16. Um site de comércio eletrônico recebe em média 12 pedidos por dia. Qual é a probabilidade de receber exatamente 10 pedidos em um dia específico?

result <- dpois(10, lambda = 12)
print(result)
## [1] 0.1048373
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 10.48 %"

17. Um serviço de entrega de alimentos tem uma média de 1,5 entregas por hora. Qual é a probabilidade de realizar exatamente 2 entregas em uma hora?

result <- dpois(2, lambda = 1.5)
print(result)
## [1] 0.2510214
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 25.1 %"

18. Em uma fábrica de automóveis, a média de carros com defeito por semana é 5. Qual é a probabilidade de ter pelo menos 8 carros com defeito em uma semana?

result <- 1 - ppois(7, lambda = 5)
print(result)
## [1] 0.1333717
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 13.34 %"

19. Um sistema de vigilância de uma loja tem uma média de 0,2 eventos de intrusão por dia. Qual é a probabilidade de não ocorrer nenhum evento de intrusão em um dia específico?

result <- dpois(0, lambda = 0.2)
print(result)
## [1] 0.8187308
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 81.87 %"

20. Em uma fazenda, a média de nascimentos de bezerros por mês é 7. Qual é a probabilidade de ocorrerem exatamente 6 nascimentos em um mês?

result <- dpois(6, lambda = 7)
print(result)
## [1] 0.1490028
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 14.9 %"

2.3 Distribuição de Normal:

21. As alturas de uma população seguem uma distribuição normal com média 170 cm e desvio padrão 10 cm. Qual é a probabilidade de uma pessoa aleatória ter altura superior a 185 cm? (Lembre-se de configurar o lower.tail = F)

result <- pnorm(185, mean = 170, sd = 10, lower.tail = FALSE)
print(result)
## [1] 0.0668072
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 6.68 %"

22. O tempo de vida de uma bateria de celular segue uma distribuição normal com média 800 dias e desvio padrão 50 dias. Qual é a probabilidade de uma bateria durar pelo menos 750 dias?

result <- pnorm(750, mean = 800, sd = 50, lower.tail = FALSE)
print(result)
## [1] 0.8413447
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 84.13 %"

23. As pontuações em um teste padronizado têm média 100 e desvio padrão 15. Qual é a probabilidade de um aluno ter uma pontuação superior a 120? (Lembre-se de configurar o lower.tail = F)

result <- pnorm(120, mean = 100, sd = 15, lower.tail = FALSE)
print(result)
## [1] 0.09121122
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 9.12 %"

24. Os pesos dos sacos de café em uma fábrica seguem uma distribuição normal com média 5 kg e desvio padrão 0,5 kg. Qual é a probabilidade de um saco ter peso inferior a 4,2 kg?

result <- pnorm(4.2, mean = 5, sd = 0.5)
print(result)
## [1] 0.05479929
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 5.48 %"

25. As temperaturas médias diárias em uma cidade seguem uma distribuição normal com média 25°C e desvio padrão 3°C. Qual é a probabilidade de um dia ter temperatura superior a 30°C? (Lembre-se de configurar o lower.tail = F)

result <- pnorm(30, mean = 25, sd = 3, lower.tail = FALSE)
print(result)
## [1] 0.04779035
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 4.78 %"

26. As velocidades de conexão à internet em uma área urbana seguem uma distribuição normal com média 50 Mbps e desvio padrão 8 Mbps. Qual é a probabilidade de uma conexão ter velocidade inferior a 40 Mbps?

result <- pnorm(40, mean = 50, sd = 8)
print(result)
## [1] 0.1056498
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 10.56 %"

27. As notas de um exame têm média 70 e desvio padrão 10. Qual é a probabilidade de um aluno ter uma nota entre 60 e 80?

result <- pnorm(80, mean = 70, sd = 10) - pnorm(60, mean = 70, sd = 10)
print(result)
## [1] 0.6826895
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 68.27 %"

28. O consumo diário de calorias de um grupo de pessoas segue uma distribuição normal com média 2000 calorias e desvio padrão 300 calorias. Qual é a probabilidade de uma pessoa consumir mais de 2500 calorias por dia?

result <- pnorm(2500, mean = 2000, sd = 300, lower.tail = FALSE)
print(result)
## [1] 0.04779035
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 4.78 %"

29. As pressões sanguíneas de uma população têm média 120 mmHg e desvio padrão 10 mmHg. Qual é a probabilidade de uma pessoa ter pressão superior a 130 mmHg?

result <- pnorm(130, mean = 120, sd = 10, lower.tail = FALSE)
print(result)
## [1] 0.1586553
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 15.87 %"

30. As medidas de um componente eletrônico seguem uma distribuição normal com média 8 cm e desvio padrão 1 cm. Qual é a probabilidade de um componente ter medida inferior a 6,5 cm?

result <- pnorm(6.5, mean = 8, sd = 1)
print(result)
## [1] 0.0668072
print(paste("Em percentual:", round(result * 100, 2), "%"))
## [1] "Em percentual: 6.68 %"

3 Amostragem:

31. Uma empresa deseja realizar uma pesquisa de satisfação de seus clientes. Ela possui uma lista com 500 clientes e decide selecionar aleatoriamente uma amostra de 50 clientes para entrevistar. Que tipo de amostragem está sendo utilizada?

Tipo de Amostragem: Amostragem Aleatória Simples.

32. Um pesquisador está estudando o comportamento de aves em uma floresta. Ele divide a floresta em diferentes estratos, como copa das árvores, sub-bosque e solo. Em seguida, realiza amostragens separadas em cada estrato. Que tipo de amostragem está sendo empregada?

Tipo de Amostragem: Amostragem Estratificada.

33. Um professor deseja saber a opinião de seus alunos sobre um novo método de ensino. Ele divide a turma em grupos de acordo com o desempenho acadêmico e seleciona aleatoriamente alunos de cada grupo para formar a amostra. Que tipo de amostragem é essa?

Tipo de Amostragem: Amostragem Estratificada.

34. Uma agência de publicidade quer avaliar a aceitação de um novo comercial de TV. Ela seleciona aleatoriamente cinco cidades diferentes e entrevista todas as pessoas que assistiram ao comercial nessas cidades. Que tipo de amostragem está sendo realizada?

Tipo de Amostragem: Amostragem por Conglomerados.

35. Um instituto de pesquisa deseja estudar a prevalência de uma doença em uma cidade. Ele divide a cidade em regiões geográficas e seleciona aleatoriamente alguns bairros em cada região para realizar exames médicos. Que tipo de amostragem está sendo empregada?

Tipo de Amostragem: Amostragem por Conglomerados.

36. Um fabricante de smartphones deseja verificar a qualidade de seus produtos. Ele seleciona aleatoriamente 100 smartphones do estoque e verifica se há defeitos em cada um deles. Que tipo de amostragem está sendo utilizada?

Tipo de Amostragem: Amostragem Aleatória Simples.

37. Um pesquisador quer avaliar a eficácia de um novo medicamento. Ele divide os pacientes em grupos de acordo com a gravidade da doença e, em seguida, seleciona aleatoriamente pacientes de cada grupo para participar do estudo. Que tipo de amostragem está sendo realizada?

Tipo de Amostragem: Amostragem Estratificada.

38. Um sindicato deseja conhecer a opinião de seus membros sobre questões trabalhistas. Eles dividem os membros em grupos de acordo com a faixa etária e selecionam aleatoriamente representantes de cada faixa etária para participar de uma reunião. Que tipo de amostragem é essa?

Tipo de Amostragem: Amostragem Estratificada.

39. Uma empresa de alimentos deseja avaliar a aceitação de um novo produto. Ela seleciona aleatoriamente supermercados em diferentes regiões do país e, em seguida, coleta dados de vendas em cada supermercado. Que tipo de amostragem está sendo empregada?

Tipo de Amostragem: Amostragem por Conglomerados.

40. Um instituto de pesquisa deseja estudar o hábito de consumo de café em uma cidade. Eles escolhem aleatoriamente uma rua principal da cidade e entrevistam todas as pessoas que passam por ela em um determinado período. Que tipo de amostragem está sendo realizada?

Tipo de Amostragem: Amostragem por Conveniência.

4 Estimação:

41. Um pesquisador está interessado na altura média de estudantes universitários em uma universidade. Ele coleta uma amostra de 100 estudantes e calcula a média amostral como 175 cm. Construa um intervalo de confiança de 95% para a altura média dos estudantes, supondo um desvio padrão populacional de 8 cm.

z <- qnorm(0.975)
media <- 175
desvio <- 8
n <- 100
erro <- z * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 173.432 176.568

42. Uma empresa deseja estimar a proporção de clientes satisfeitos com seus serviços. Ela coleta uma amostra de 200 clientes e descobre que 150 estão satisfeitos. Construa um intervalo de confiança de 90% para a proporção de clientes satisfeitos.

p <- 150 / 200
z <- qnorm(0.95)
erro <- z * sqrt(p * (1 - p) / 200)
c(p - erro, p + erro)
## [1] 0.6996368 0.8003632

43. Um agricultor deseja estimar a produção média de maçãs por árvore em seu pomar. Ele coleta uma amostra de 30 árvores e obtém uma produção média de 50 kg. O desvio padrão amostral é 6 kg. Construa um intervalo de confiança de 99% para a produção média por árvore.

t <- qt(0.995, df = 29)
media <- 50
desvio <- 6
n <- 30
erro <- t * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 46.98053 53.01947

44. Um fabricante de lâmpadas deseja estimar a vida média de suas lâmpadas. Ele testa uma amostra de 50 lâmpadas e calcula a vida média como 1200 horas, com um desvio padrão de 100 horas. Construa um intervalo de confiança de 95% para a vida média das lâmpadas.

z <- qnorm(0.975)
media <- 1200
desvio <- 100
n <- 50
erro <- z * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 1172.282 1227.718

45. Um epidemiologista quer estimar a taxa média de infecção em uma determinada região. Ele coleta uma amostra de 500 pessoas e encontra uma taxa de infecção de 4%, com desvio padrão de 0,1%. Construa um intervalo de confiança de 98% para a taxa média de infecção.

z <- qnorm(0.99)
media <- 0.04
desvio <- 0.001
n <- 500
erro <- z * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 0.03989596 0.04010404

46. Um gerente de projeto deseja estimar o tempo médio necessário para concluir uma tarefa. Ele coleta uma amostra de 20 tarefas e calcula o tempo médio como 25 horas, com um desvio padrão de 3 horas. Construa um intervalo de confiança de 90% para o tempo médio de conclusão da tarefa.

t <- qt(0.95, df = 19)
media <- 25
desvio <- 3
n <- 20
erro <- t * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 23.84006 26.15994

47. Um pesquisador quer estimar a média de calorias consumidas por adultos em uma cidade. Ele coleta uma amostra de 100 adultos e encontra uma média de 2000 calorias, com um desvio padrão de 300 calorias. Construa um intervalo de confiança de 95% para a média de calorias consumidas por adultos.

z <- qnorm(0.975)
media <- 2000
desvio <- 300
n <- 100
erro <- z * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 1941.201 2058.799

48. Uma empresa deseja estimar a diferença média de salários entre dois departamentos. Ela coleta uma amostra de 50 funcionários de cada departamento e encontra que a diferença média é de R$500,00, com um desvio padrão de R$100,00. Construa um intervalo de confiança de 99% para a diferença média de salários.

z <- qnorm(0.995)
media <- 500
desvio <- 100
n <- 50
erro <- z * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 463.5723 536.4277

49. Um professor quer estimar a média de horas de estudo por semana dos estudantes de sua turma. Ele coleta uma amostra de 25 estudantes e encontra uma média de 12 horas, com um desvio padrão de 2 horas. Construa um intervalo de confiança de 96% para a média de horas de estudo.

t <- qt(0.98, df = 24)
media <- 12
desvio <- 2
n <- 25
erro <- t * desvio / sqrt(n)
c(media - erro, media + erro)
## [1] 11.13138 12.86862

50. Uma empresa de tecnologia deseja estimar a proporção de usuários satisfeitos com seu novo aplicativo. Ela coleta uma amostra de 150 usuários e descobre que 120 estão satisfeitos, com desvio padrão de 2 funcionários. Construa um intervalo de confiança de 99% para a proporção de usuários satisfeitos.

p <- 120 / 150
z <- qnorm(0.995)
erro <- z * sqrt(p * (1 - p) / 150)
c(p - erro, p + erro)
## [1] 0.7158738 0.8841262

5 Cálculo do Tamanho da Amostra:

51. Um pesquisador deseja estimar a média de salários de uma população de trabalhadores. Ele quer um intervalo de confiança de 95%, com um erro máximo de R\(100. A variabilidade dos salários é conhecida de R\) 500,00. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população infinita?

z <- qnorm(0.975)
erro <- 100
desvio <- 500
n <- (z * desvio / erro)^2
ceiling(n)
## [1] 97

52. Uma empresa deseja estimar a proporção de clientes que comprariam um novo produto. Ela quer um intervalo de confiança de 90%, com um erro máximo de 5%, assumindo um desvio padrão de 3%. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população finita de 5000 clientes?

N <- 5000
E <- 0.05
sigma <- 0.03
z <- qnorm(0.95)

n2 <- ceiling((z^2 * sigma^2 * N) / (z^2 * sigma^2 + E^2 * (N - 1)))
ceiling(n2)
## [1] 1

53. Um cientista social deseja estimar a média de horas que os estudantes universitários gastam estudando por semana. Ele quer um intervalo de confiança de 99%, com um erro máximo de 2 horas e desvio padrão de 1 hora. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população infinita?

z <- qnorm(0.995)
erro <- 2
desvio <- 1
n <- (z * desvio / erro)^2
ceiling(n)
## [1] 2

54. Uma agência de viagens deseja estimar a proporção de pessoas que preferem viajar de avião em vez de ônibus. Ela quer um intervalo de confiança de 95%, com um erro máximo de 3%. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população finita de 8000 pessoas, para aceitarmos um desvio de 3%?

z <- qnorm(0.975)
E <- 0.03
p <- 0.5
N <- 8000
n0 <- (z^2 * p * (1 - p)) / E^2
n <- n0 / (1 + ((n0 - 1) / N))
ceiling(n)
## [1] 942

55. Um pesquisador deseja estimar a média de idade de uma população de idosos. Ele quer um intervalo de confiança de 90%, com um erro máximo de 1 ano. A variabilidade das idades é desconhecida. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população infinita e desvio padrão de 6 meses?

z <- qnorm(0.95)
erro <- 1
desvio <- 0.5
n <- (z * desvio / erro)^2
ceiling(n)
## [1] 1

56. Uma empresa de telecomunicações deseja estimar a proporção de clientes insatisfeitos com seus serviços. Ela quer um intervalo de confiança de 96%, com um erro máximo de 2% e desvio padrão de 0,5%. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população finita de 10000 clientes?

z <- qnorm(0.98)
erro <- 0.02
p <- 0.5
N <- 10000
n_bruto <- (z^2 * p * (1 - p)) / erro^2
n_56 <- n_bruto / (1 + ((n_bruto - 1) / N))
ceiling(n_56)
## [1] 2087

57. Um pesquisador deseja estimar a média de gastos mensais de uma população de famílias. Ele quer um intervalo de confiança de 98%, com um erro máximo de R$10. A variabilidade dos gastos é de R$50,00. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população infinita?

z <- qnorm(0.99)
erro <- 10
desvio <- 50
n <- (z * desvio / erro)^2
ceiling(n)
## [1] 136

58. Uma ONG deseja estimar a proporção de voluntários em uma comunidade. Ela quer um intervalo de confiança de 94%, com um erro máximo de 4%. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população finita de 6000 pessoas e desvio padrão de 5%?

z <- qnorm(0.97)
erro <- 0.04
p <- 0.5
N <- 6000
n_bruto <- (z^2 * p * (1 - p)) / erro^2
n_58 <- n_bruto / (1 + ((n_bruto - 1) / N))
ceiling(n_58)
## [1] 507

59. Um cientista de dados deseja estimar a média de tempo que os usuários gastam em um aplicativo. Ele quer um intervalo de confiança de 99%, com um erro máximo de 5 minutos. A variabilidade do tempo gasto é de 10 minutos. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população infinita?

z <- qnorm(0.995)
erro <- 5
desvio <- 10
n <- (z * desvio / erro)^2
ceiling(n)
## [1] 27

60. Uma empresa de alimentos deseja estimar a proporção de consumidores que preferem um novo sabor de produto. Ela quer um intervalo de confiança de 92%, com um erro máximo de 2%. Qual seria o tamanho mínimo da amostra necessário, assumindo uma população finita de 12000 consumidores e desvio máximo de 3%?

z <- qnorm(0.96)
E <- 0.02
p <- 0.03
N <- 12000
n0 <- (z^2 * p * (1 - p)) / E^2
n <- n0 / (1 + ((n0 - 1) / N))
ceiling(n)
## [1] 219