Tarefa 3 - Probabilidade

Author

Mario Antônio Vieira Filho

1) Em cada um dos seguintes casos indique se os dados podem ser considerados como qualitativos ou quantitativos. No caso de qualitativos, se eles são nominais ou ordinais, e no caso das variáveis quantitativas, indique se são discretas ou contínuas:

(a) Número de pulsaçőes por minuto em adultos normais
Quantitativa discreta
(b) Lugar de nascimento de uma pessoa
Qualitativa nominal
(c) Causa de óbito de um indivíduo
Qualitativa nominal
(d) Número de atendimentos em um Pronto Socorro, em um período de 24 horas
Quantitativa discreta
(e) Conceito obtido por um aluno numa prova (pode ser A, B , etc.)
Qualitativa ordinal
(f) Aumento de pesos em cobaias submetidas a uma determinada dieta.
Quantitativa contínua
(g) Respostas a questőes sobre grau de satisfação das pessoas com um determinado tipo de serviço.
Qualitativa ordinal

2) Segundo o Boletim Estatístico do IBGE, durante o ano 1973, foram aplicadas as seguintes vacinas no Serviço de Saúde dos Portos do Estado do Rio de Janeiro: 81335 vacinas antivariólicas, 23012 antiamarílicas, 12058 anticoléricas, 2155 anti- tificas e 12276 de outras espécies.

a) Organize esses dados em uma tabela, indicando frequências absolutas, proporçőes e porcentagens.

vacinas = c(81335, 23012, 12058, 2155, 12276)
nomes = c("Antivariólica", "Antiamarílica", "Anticolérica", "Antitífica", "Outras")

proporcao = vacinas / sum(vacinas)
porcentagem = proporcao * 100

tabela = data.frame(vacina = nomes, Proporcao = proporcao,Porcentagem = porcentagem)

print(tabela)
         vacina  Proporcao Porcentagem
1 Antivariólica 0.62165612   62.165612
2 Antiamarílica 0.17588431   17.588431
3  Anticolérica 0.09216118    9.216118
4    Antitífica 0.01647100    1.647100
5        Outras 0.09382739    9.382739

b) Desenhe um gráfico de barras verticais e um gráfico de barras horizontais.

barplot(vacinas, names.arg = nomes, col = "darkred", main = "Gráfico de Barras Verticais", ylab = "Frequência", las = 2)

barplot(vacinas, names.arg = nomes, col = "darkred", main = "Gráfico de Barras Horizontais", xlab = "Frequência", horiz = TRUE,  las = 1)

c) Desenhe um gráfico de pizza, especificando os correspondentes ângulos do centro.

pie(vacinas, labels = nomes, col = rainbow(length(vacinas)), main = "Gráfico de Pizza das Vacinas")

3) Uma pesquisa é feita entre os habitantes de uma comunidade para avaliar as suas expectativas em relação com um programa de fluoração da água potável. A ques- tão formulada é “haverá uma melhoria nas condiçőes odontológicas?”. 32% res- ponderam “certamente haverá uma melhoria”, 24% responderam “provavelmente haverá uma melhoria”, para 14% , “provavelmente não haverá melhoria”, para 12%, certamente não haverá melhoria” enquanto que as restantes declararam não ter opinião sobre o tema.

a) Diga o tipo de dados que está sendo observado.

Dados qualitativos ordinais

b) Faça uma tabela de porcentagens e porcentagens acumuladas. Qual a porcentagem de pessoas que acredita numa possível melhoria?

porcentagens = c(32, 24, 14, 12, 100 - (32 + 24 + 14 + 12))
nomes = c("Certamente haverá melhoria", 
           "Provavelmente haverá melhoria", 
           "Provavelmente não haverá melhoria", 
           "Certamente não haverá melhoria", 
           "Não tem opinião")


porcentagens_acumuladas = cumsum(porcentagens)


tabela2 = data.frame(Resposta = nomes, Porcentagem = porcentagens, Porcentagem_Acumulada = porcentagens_acumuladas)


print(tabela)
         vacina  Proporcao Porcentagem
1 Antivariólica 0.62165612   62.165612
2 Antiamarílica 0.17588431   17.588431
3  Anticolérica 0.09216118    9.216118
4    Antitífica 0.01647100    1.647100
5        Outras 0.09382739    9.382739
porcentagem_melhoria = sum(porcentagens[1:2])
print(paste("Porcentagem de pessoas que acredita numa possível melhoria:", porcentagem_melhoria, "%"))
[1] "Porcentagem de pessoas que acredita numa possível melhoria: 56 %"

c) Faça um gráfico de colunas.

barplot(porcentagens, names.arg = nomes, col = "darkred",main = "Expectativas em relação à fluoração da água", ylab = "Porcentagem",  xlab = "Respostas", las = 2)

d) Faça um gráfico setorial.

pie(porcentagens, labels = nomes,  col = rainbow(length(porcentagens)), main = "Gráfico Setorial - Expectativas sobre a Fluoração da Água")

4) Os dados apresentados a seguir correspondem à taxa de creatinina na urina de 24 horas (mg/100 mL), em uma amostra de 36 homens normais.

a) Construa o Box plot e identifique a existência de valores discrepantes.

creatinina = c(1.08, 1.22, 1.26, 1.37, 1.38, 1.40, 1.40, 1.43, 1.43, 1.44, 1.46, 1.46, 1.49,1.49, 1.51, 1.52, 1.52, 1.54, 1.58, 1.59, 1.60, 1.61, 1.66, 1.66, 1.67, 1.69,1.69, 1.73, 1.75, 1.76, 1.83, 1.86, 1.89, 2.02, 2.18)

boxplot(creatinina, main = "Boxplot da Taxa de Creatinina na Urina (mg/100 mL)", ylab = "Taxa de Creatinina (mg/100 mL)", col = "darkred", horizontal = TRUE)

boxplot.stats(creatinina)$out
[1] 2.18
# O indivíduo 36 aparece como um outlier, sendo o único valor discrepante.

b) Os dados sugerem simetria ou assimetria? Justifique.

quantile(creatinina)
   0%   25%   50%   75%  100% 
1.080 1.435 1.540 1.690 2.180 
summary(creatinina)
   Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
  1.080   1.435   1.540   1.576   1.690   2.180 
# Os dados, apresentados através do boxplot, sugerem uma leve assimetria positiva

c) O que você pode dizer quanto a dispersão dos dados?

A maioria dos dados está concentrada em um intervalo controlado, exceto pelo outlier. A mediana mostra leve desproporção da distribuição.

5) Um fabricante de chips de computador produz 60% de sua produção na fábrica A e 40% na fábrica B. A taxa de falha na produção dos chips de A é de 35% e a taxa de falha nos chips da fábrica B é de 25%. Para um chip qualquer deste fabricante comprado por um consumidor qualquer, qual a probabilidade:

a) Do chip ser defeituoso?

fabrica.A = 0.60         
fabrica.B = 0.40          
defeito.A = 0.35        
defeito.B = 0.25 

DefeitoGeral = (defeito.A * fabrica.A) + (defeito.B * fabrica.B)
print(DefeitoGeral)
[1] 0.31

b) Do chip ser defeituoso uma vez tenha sido produzido na fábrica A?

print(defeito.A)
[1] 0.35

c) Do chip ser defeituoso uma vez tenha sido produzido na fábrica B?

print(defeito.B)
[1] 0.25

d) Do chip ser da fábrica A dado seja defeituoso?

GeralMasA = (defeito.A * fabrica.A ) / DefeitoGeral
print(GeralMasA)
[1] 0.6774194

6) Discos de policarbonato são analisados no que se refere a resistência a arranhőes e resistência a choque. Os resultados de 100 discos são mostrados abaixo:

Considere o evento A de que um disco tenha alta resistência a choques e o evento B de que ele tenha alta resistência a arranhőes.

a) Se um disco é selecionado aleatoriamente qual é a probabilidade de que ele tenha alta resistência a choque e arranhőes?

totaldisco = 100
altageral = 70

resp.a = altageral / totaldisco

print (resp.a)
[1] 0.7
# a probabilidade é de 70%

b) Se um disco é selecionado aleatoriamente qual é a probabilidade de que ele tenha alta resistência a choque ou arranhőes ?

altachoque = 79
altaaranhao = 86

p1 = altachoque / totaldisco
p2 = altaaranhao / totaldisco
inter12 = altageral / totaldisco

uniao.choque.arranhao = p1 + p2 - inter12
print(uniao.choque.arranhao)
[1] 0.95
# a probabilidade é de 95%

c) São os eventos A e B mutuamente excludentes ?

# não são mutuamente excludentes, vide resposta A, onde há ponto de interseção 

d) Determina \(P(A^c \cup B)\) , \(P(A^c \cup B^c)\)

choquealta.baixaarra = 9

interx = choquealta.baixaarra / totaldisco
PACUB = 1 - interx
PACUBC = 1 - inter12

print(PACUB)
[1] 0.91
print(PACUBC)
[1] 0.3
# P(Ac U B) = 91%
# P(Ac U Bc ) = 30%

e) Determine \(P(A | B)\) e \(P(B|A)\)

PAB =inter12 / p1
PBA = inter12 / p2

print(PAB)
[1] 0.8860759
print(PBA)
[1] 0.8139535
# P(A|B) = 88,06%
# P(B|A) = 81,39%

7) No design preliminar de produtos são utilizadas avaliaçőes de clientes. No passado, 95% dos produtos de alto sucesso receberam boas avaliaçőes, 60% dos produtos de sucesso moderado receberam boas avaliaçőes, e 10% dos produto de pobre desempenho receberam boas avaliaçőes. Além disso, 40% dos produtos tiveram alto sucesso, 35% tiveram sucesso moderado e 25% tiveram desempenho pobre.

Alto =0.40  
Moderado = 0.35  
Pobre = 0.25  

BomAlto = 0.95  
BomModerado = 0.60  
BomPobre = 0.10

(a) Qual é a probabilidade de que o produto consiga uma boa avaliação ?

AvaliaçãoBoa = (BomAlto * Alto) + (BomModerado * Moderado) + (BomPobre * Pobre)
print(AvaliaçãoBoa)
[1] 0.615
# probabilidade de 61,5%

(b) Se um novo design obtém uma boa avaliação, qual a probabilidade de que ele tenha alto sucesso ?

AltoSucessoBom =  (BomAlto * Alto) / AvaliaçãoBoa
print(AltoSucessoBom)
[1] 0.6178862
# probabilidade de 61,7%

(c) Se um produto não recebe uma boa avaliação, qual é a probabilidade de que ele tenha alto sucesso?

SucessoRuim =  (BomPobre * Pobre) / AvaliaçãoBoa
print(SucessoRuim)
[1] 0.04065041
# probabilidade de 4%

8) Uma urna contém 12 bolas: 5 brancas, 4 vermelhas, e 3 pretas. Outra contém 18 bolas: 5 brancas, 6 vermelhas e 7 pretas. Uma bola é retirada de cada urna. Qual a probabilidade de que as duas bolas sejam da mesma cor?

brancas.urna1 = 5
vermelhas.urna1 = 4
pretas.urna1 = 3
total.urna1 = 12


brancas.urna2 = 5
vermelhas.urna2 = 6
pretas.urna2 = 7
total.urna2 = 18


Probabilidade.brancas = (brancas.urna1 / total.urna1) * (brancas.urna2 / total.urna2)
Probabilidade.vermelhas = (vermelhas.urna1 / total.urna1) * (vermelhas.urna2 / total.urna2)
Probabilidade.pretas = (pretas.urna1 / total.urna1) * (pretas.urna2 / total.urna2)

Probabilidade.mesma.cor = Probabilidade.brancas + Probabilidade.vermelhas + Probabilidade.pretas

Probabilidade.mesma.cor
[1] 0.3240741
# probabilidade da mesma cor é de 32,4%

9. A probabilidade de uma mulher estar viva daqui a 30 anos é 3/4 e de seu marido é 3/5. Calcular a probabilidade de:

mulher.viva <- 3/4
homem.vivo <- 3/5

(a) apenas o homem estar vivo

homem.so = homem.vivo * (1 - mulher.viva)
homem.so
[1] 0.15
# probabilidade de apenas o homem estar vivo 15%

(b) somente a mulher estar viva

mulher.so = mulher.viva * (1 - homem.vivo)
mulher.so
[1] 0.3
# probabilidade de apenas a mulher estar viva 30%

(c) pelo menos um estar vivo

um.vivo =  1 - (1 - mulher.viva) * (1 -homem.vivo)
um.vivo
[1] 0.9
# probabilidade de ao menos 1 estar vivo é 90%

10) Uma experiência consiste em arremessar uma moeda 3 vezes. Qual é o espaço amostral desta experiência? Que evento corresponde à experiência resultante em mais caras do que coroas?

# cara X, coroa Z
 moeda.resultados = c ('X','Z')
amostra.esp = expand.grid(moeda.resultados, moeda.resultados, moeda.resultados)
amostra.esp = apply(amostra.esp, 1, paste, collapse = "")

print(amostra.esp)
[1] "XXX" "ZXX" "XZX" "ZZX" "XXZ" "ZXZ" "XZZ" "ZZZ"
mais.cara = amostra.esp[nchar(gsub('Z', "", amostra.esp)) > nchar(gsub('X', "", amostra.esp))]

print (mais.cara)
[1] "XXX" "ZXX" "XZX" "XXZ"

11) Os dados da tabela abaixo descrevem o desempenho de alunos de graduação na disciplina de Probabilidade e Estatística oferecida para alunos de uma universidade pública.

Considerando que será realizada a seleção aleatória de um estudante obtenha a probabilidade de ocorrência dos seguintes eventos:

m.total = 70
m.aprov = 60
m.reprov = 10
f.total_f.aprov = 30
aa.total = 100

a. “O estudante é do sexo masculino”

m.prob = m.total / aa.total
m.prob
[1] 0.7
# 70% de ser do sexo masculino

b. “O estudante foi aprovado”

aprov.prob = (m.aprov + f.total_f.aprov) / aa.total
aprov.prob
[1] 0.9
# 90% de ser aprovado

c. “O estudante é do sexo masculino e foi aprovado”

m.aprov / 100
[1] 0.6
# 60% sexo masculino e aprovado

d. “O aluno é do sexo masculino ou foi aprovado”

prob.m_aprov = m.total + aprov.prob - m.aprov
prob.m_aprov/100
[1] 0.109
# 10,9% de ser masculino ou aprovado

12) Num saco estão sete bolas numeradas de 1 a 7. Retira-se uma bola do saco dez vezes, com reposição. Qual a probabilidade do acontecimento “A bola com o número 5 não sai mais de duas vezes”?

n = 10  
p = 1/7  

prob.v = dbinom(0, n, p) + dbinom(1, n, p) + dbinom(2, n, p)
prob.v
[1] 0.8383951
# A probabilidade é de 83,83%

13. Numa fábrica verificou-se que um certo artigo pode apresentar defeitos de dois tipos. A probabilidade de ocorrer o defeito do tipo A é 0.1 e a probabilidade de ocorrer o defeito do tipo B é 0.05. Sabendo que os defeitos ocorrem independentemente um do outro, calcule a probabilidade de:

prob.defA = 0.1
prob.defB = 0.05

a) Um artigo não ter qualquer defeito;

prob.naoA = 1 - prob.defA
prob.naoB = 1 - prob.defB
prob.nao.def = prob.naoA * prob.naoB

prob.nao.def
[1] 0.855
# 85,5% de probabilidade de qualquer defeito

b) Um artigo ter defeito;

prob.sim.def = 1 - prob.nao.def
prob.sim.def
[1] 0.145
# 14,5% de probabilidade de algum artigo ter defeito

c) Um artigo com defeito ter um e um só tipo de defeito.

apenas.A = prob.defA * prob.naoB
apenas.B = prob.defB * prob.naoA

apenas.A
[1] 0.095
apenas.B
[1] 0.045
pro.um.def = apenas.A + apenas.B

pro.um.def
[1] 0.14
# 14% de probabilidade de apenas um artigo ter defeito

14) Em uma empresa de pesquisa determinou-se que a probabilidade de haver crise energética é de 40% e que a probabilidade de haver aumento do desemprego é de 35%. Sabendo-se que a probabilidade de aumento no desemprego dado que houve crise energética é de 70%, responda:

prob.crise = 0.40
prob.desemp = 0.35
prob.desempDADOcrise = 0.70

a) Qual a probabilidade de não haver crise energética e haver aumento no desemprego?

prob.crise.desemp = prob.desempDADOcrise * prob.crise
prob.naocrise.desemp =  prob.desemp - prob.crise.desemp
prob.naocrise.desemp
[1] 0.07
# 7% de probabilidade de não haver crise energética e haver aumento no desemprego

b) Qual a probabilidade de haver aumento no desemprego dado que não houve crise energética?

nao.crise = 1 - prob.crise

desemp.naocrise =  prob.naocrise.desemp / nao.crise 

desemp.naocrise
[1] 0.1166667
# 11,66% de probabilidade de haver aumento no desemprego dado que não houve crise energética 

c) Qual a probabilidade de não haver aumento no desemprego e nem crise energética?

nem.nem = nao.crise - prob.naocrise.desemp
nem.nem
[1] 0.53
# 53% de probabilidade de não haver aumento no desemprego e nem crise energética

d) Pode-se afirmar que os eventos haver crise energética e aumento no desemprego são independentes? Se não, caracterize-os como complementares ou concorrentes.

# Os eventos não são independentes, mas sim concorrentes, pois o evento "haver crise energética" aumenta significativamente a ocorrência de "aumento de desemprego"

15) Sabe-se que o soro da verdade, quando ministrado a um suspeito, é 90% eficaz quando a pessoa é culpada e 99% eficaz quando é inocente. Em outras palavras, 10% dos culpados são julgados inocentes, e 1% dos inocentes é julgado culpado. Se o suspeito foi retirado de um grupo em que 95% jamais cometeram qualquer crime, e o soro indica culpado, qual a probabilidade de o suspeito ser inocente?

prob.culp.culp = 0.90
prob.culp.inoc = 0.01
prob.amostra.culp = 0.05
prob.amostra.inoc = 0.95

prob.total.culp = prob.culp.culp * prob.amostra.culp + prob.amostra.inoc * prob.culp.inoc

prob.total.culp
[1] 0.0545
prob.final = (prob.culp.inoc * prob.amostra.inoc) / prob.total.culp

prob.final
[1] 0.1743119
# probabilidade de 17,4%

16. Sendo X uma variável seguindo o modelo Binomial com parâmetros n = 15 e p = 0, 4; obtenha a função de probabilidade, a função de distribuição acumulada, faça os gráficos dessas funçőes e pergunta-se:

(a) P(X ≥ 14);

(b) P(8 < X ≤ 10);

(c) P(X < 2 ou X ≥ 11);

(d) P(X ≥ 11 ou X > 13);

(e) P(X > 3 e X < 6);

(f) P(X ≤ 13|X ≥ 11).

17. Um atirador fez uma aposta com um amigo: ele atiraria no alvo 10 vezes e ganharia a aposta se conseguisse acertar na mosca pelo menos 8 vezes. Sabe-se, com base no desempenho usual desse atirador, que ele costuma acertar na mosca em 70% das vezes. Qual a probabilidade do atirador ganhar a aposta?

n = 10       
p = 0.7
k = 8:n

prob.atirador.vitoria = sum(dbinom(k, size = n, prob = p))

prob.atirador.vitoria
[1] 0.3827828
# o atirador tem 38,27% de chance de ganhar a aposta

18) Admita que o número de chegadas de navios a um porto durante um dia se comporta segundo uma distribuição de Poisson. Sabe-se também que, considerando somente os dias em que chegam no máximo 2 navios, em 60% desses dias chega no máximo 1 navio.

a) Qual o número médio diário de chegadas de navios a esse porto?

f = function(lambda) {(1 + lambda) / (1 + lambda + (lambda^2) / 2) - 0.60}

n.chegadas = uniroot(f, c(0, 10))$root

n.chegadas
[1] 2.000008
# O número médio diário de chegadas de navios a esse porto é 2

b) Considerando somente os dias em que chegam pelo menos 2 navios, em quantos por cento desses dias costumam chegar pelo menos 3 navios?

lambda = 2


cheg3 = 1 - ppois(2, lambda)
cheg2 = 1 - ppois(1, lambda)


resultado.condiçao = cheg3 / cheg2
resultado.condiçao
[1] 0.5443212
# nessas condições, em 54,43% ocorre a chegada de pelo menos 3 navios

19) Suponha que o tempo médio de permanência em um hospital para pacientes com determinada doença é de 60 dias com desvio-padrão de 15 dias. Supor que o tempo de permanência segue uma distribuição aproximadamente normal. Se for sorteado 1 paciente desta população, calcule a probabilidade de que seu tempo de permanência seja:

(a) Igual ou maior que 50 dias;

media = 60
desvio.padrao = 15
x = 50

probabilidade.de.a = 1 - pnorm(x, mean = media, sd = desvio.padrao)

probabilidade.de.a
[1] 0.7475075
# probabilidade de 74,75%

(b) Igual ou menor que 30 dias;

y = 30
probabilidade.de.b = pnorm(y, mean = media, sd = desvio.padrao)
probabilidade.de.b
[1] 0.02275013
# probabilidade de 2,28%

(c) No intervalo de 40 a 70 dias;

limite1 = 40
limite2 = 70


probabilidade.de.c = pnorm(limite2, mean = media, sd = desvio.padrao) - pnorm(limite1, mean = media, sd = desvio.padrao)

probabilidade.de.c
[1] 0.6562962
# probabilidade de 65,63%

(d) Igual ou maior que 75 dias.

z = 75
probabilidade.de.d = 1 - pnorm(z, mean = media, sd = desvio.padrao)

probabilidade.de.d
[1] 0.1586553
# probabilidade de 15,86%

20) Assumindo µ = 1, 5 e σ 2 = 0, 1 (conhecidos) determine a probabilidade da média amostral X¯ ser maior que 2.

media.20 =1.5
variancia.20 = 0.1
desvio.padrao.20 =sqrt(variancia.20)
z.20 = 50

erro.padrao = desvio.padrao.20 / sqrt(z.20)


probabilidade.20 = 1 - pnorm(2, mean = media, sd = erro.padrao)

probabilidade.20
[1] 1

21) Antes de uma eleição, um determinado partido está interessado em estimar a probabilidade p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favoráveis ao candidato.

a) Utilizando a informação da amostra piloto, determine o tamanho da amostra para que, com 0, 8 de probabilidade, o erro cometido na estimação seja no máximo 0, 05.

amostra.piloto = 0.60  
erro.max = 0.05  
signific = 0.20  
critico = qnorm(1 - signific / 2)

tam.amostra =  (critico^2 * amostra.piloto * (1 - amostra.piloto)) / (erro.max^2)

tam.amostra
[1] 157.6679
# O tamanho da amostra precisa ser de 158 (arredondando o número para ser inteiro)

b) Se na amostra final, com o tamanho obtido em (a), observou-se que 51% dos eleitores eram favoráveis ao candidato, construa o intervalo de confiança para p, com confiança de 95%

propor.b = 0.51
signific2 = 0.05

critico2 = qnorm(1 - signific2 / 2)
erro.padrao.21 = sqrt(propor.b * (1 - propor.b) / tam.amostra)

interv.1 = propor.b - critico2 * erro.padrao.21
interv.2 =propor.b + critico2 * erro.padrao.21

intervalo.confiança.95 = c(interv.1, interv.2)
intervalo.confiança.95
[1] 0.4319704 0.5880296
# o intervalo com confiança de 95% é entre 43,19% e 58,8% de eleitores favoráveis