1) Em cada um dos seguintes casos indique se os dados podem ser considerados como qualitativos ou quantitativos. No caso de qualitativos, se eles são nominais ou ordinais, e no caso das variáveis quantitativas, indique se são discretas ou contínuas:
(a) Número de pulsaçőes por minuto em adultos normais Quantitativa discreta
(b) Lugar de nascimento de uma pessoa Qualitativa nominal
(c) Causa de óbito de um indivíduo Qualitativa nominal
(d) Número de atendimentos em um Pronto Socorro, em um período de 24 horas Quantitativa discreta (e) Conceito obtido por um aluno numa prova (pode ser A, B , etc.) Qualitativa ordinal
(f) Aumento de pesos em cobaias submetidas a uma determinada dieta. Quantitativa contínua (g) Respostas a questőes sobre grau de satisfação das pessoas com um determinado tipo de serviço. Qualitativa ordinal
2) Segundo o Boletim Estatístico do IBGE, durante o ano 1973, foram aplicadas as seguintes vacinas no Serviço de Saúde dos Portos do Estado do Rio de Janeiro: 81335 vacinas antivariólicas, 23012 antiamarílicas, 12058 anticoléricas, 2155 anti- tificas e 12276 de outras espécies.
a) Organize esses dados em uma tabela, indicando frequências absolutas, proporçőes e porcentagens.
b) Desenhe um gráfico de barras verticais e um gráfico de barras horizontais.
barplot(vacinas, names.arg = nomes, col ="darkred", main ="Gráfico de Barras Verticais", ylab ="Frequência", las =2)
barplot(vacinas, names.arg = nomes, col ="darkred", main ="Gráfico de Barras Horizontais", xlab ="Frequência", horiz =TRUE, las =1)
c) Desenhe um gráfico de pizza, especificando os correspondentes ângulos do centro.
pie(vacinas, labels = nomes, col =rainbow(length(vacinas)), main ="Gráfico de Pizza das Vacinas")
3) Uma pesquisa é feita entre os habitantes de uma comunidade para avaliar as suas expectativas em relação com um programa de fluoração da água potável. A ques- tão formulada é “haverá uma melhoria nas condiçőes odontológicas?”. 32% res- ponderam “certamente haverá uma melhoria”, 24% responderam “provavelmente haverá uma melhoria”, para 14% , “provavelmente não haverá melhoria”, para 12%, certamente não haverá melhoria” enquanto que as restantes declararam não ter opinião sobre o tema.
a) Diga o tipo de dados que está sendo observado.
Dados qualitativos ordinais
b) Faça uma tabela de porcentagens e porcentagens acumuladas. Qual a porcentagem de pessoas que acredita numa possível melhoria?
porcentagem_melhoria =sum(porcentagens[1:2])print(paste("Porcentagem de pessoas que acredita numa possível melhoria:", porcentagem_melhoria, "%"))
[1] "Porcentagem de pessoas que acredita numa possível melhoria: 56 %"
c) Faça um gráfico de colunas.
barplot(porcentagens, names.arg = nomes, col ="darkred",main ="Expectativas em relação à fluoração da água", ylab ="Porcentagem", xlab ="Respostas", las =2)
d) Faça um gráfico setorial.
pie(porcentagens, labels = nomes, col =rainbow(length(porcentagens)), main ="Gráfico Setorial - Expectativas sobre a Fluoração da Água")
4) Os dados apresentados a seguir correspondem à taxa de creatinina na urina de 24 horas (mg/100 mL), em uma amostra de 36 homens normais.
a) Construa o Box plot e identifique a existência de valores discrepantes.
creatinina =c(1.08, 1.22, 1.26, 1.37, 1.38, 1.40, 1.40, 1.43, 1.43, 1.44, 1.46, 1.46, 1.49,1.49, 1.51, 1.52, 1.52, 1.54, 1.58, 1.59, 1.60, 1.61, 1.66, 1.66, 1.67, 1.69,1.69, 1.73, 1.75, 1.76, 1.83, 1.86, 1.89, 2.02, 2.18)boxplot(creatinina, main ="Boxplot da Taxa de Creatinina na Urina (mg/100 mL)", ylab ="Taxa de Creatinina (mg/100 mL)", col ="darkred", horizontal =TRUE)
boxplot.stats(creatinina)$out
[1] 2.18
# O indivíduo 36 aparece como um outlier, sendo o único valor discrepante.
b) Os dados sugerem simetria ou assimetria? Justifique.
quantile(creatinina)
0% 25% 50% 75% 100%
1.080 1.435 1.540 1.690 2.180
summary(creatinina)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.080 1.435 1.540 1.576 1.690 2.180
# Os dados, apresentados através do boxplot, sugerem uma leve assimetria positiva
c) O que você pode dizer quanto a dispersão dos dados?
A maioria dos dados está concentrada em um intervalo controlado, exceto pelo outlier. A mediana mostra leve desproporção da distribuição.
5) Um fabricante de chips de computador produz 60% de sua produção na fábrica A e 40% na fábrica B. A taxa de falha na produção dos chips de A é de 35% e a taxa de falha nos chips da fábrica B é de 25%. Para um chip qualquer deste fabricante comprado por um consumidor qualquer, qual a probabilidade:
6) Discos de policarbonato são analisados no que se refere a resistência a arranhőes e resistência a choque. Os resultados de 100 discos são mostrados abaixo:
Considere o evento A de que um disco tenha alta resistência a choques e o evento B de que ele tenha alta resistência a arranhőes.
a) Se um disco é selecionado aleatoriamente qual é a probabilidade de que ele tenha alta resistência a choque e arranhőes?
7) No design preliminar de produtos são utilizadas avaliaçőes de clientes. No passado, 95% dos produtos de alto sucesso receberam boas avaliaçőes, 60% dos produtos de sucesso moderado receberam boas avaliaçőes, e 10% dos produto de pobre desempenho receberam boas avaliaçőes. Além disso, 40% dos produtos tiveram alto sucesso, 35% tiveram sucesso moderado e 25% tiveram desempenho pobre.
8) Uma urna contém 12 bolas: 5 brancas, 4 vermelhas, e 3 pretas. Outra contém 18 bolas: 5 brancas, 6 vermelhas e 7 pretas. Uma bola é retirada de cada urna. Qual a probabilidade de que as duas bolas sejam da mesma cor?
10) Uma experiência consiste em arremessar uma moeda 3 vezes. Qual é o espaço amostral desta experiência? Que evento corresponde à experiência resultante em mais caras do que coroas?
# cara X, coroa Z moeda.resultados =c ('X','Z')amostra.esp =expand.grid(moeda.resultados, moeda.resultados, moeda.resultados)amostra.esp =apply(amostra.esp, 1, paste, collapse ="")print(amostra.esp)
11) Os dados da tabela abaixo descrevem o desempenho de alunos de graduação na disciplina de Probabilidade e Estatística oferecida para alunos de uma universidade pública.
Considerando que será realizada a seleção aleatória de um estudante obtenha a probabilidade de ocorrência dos seguintes eventos:
12) Num saco estão sete bolas numeradas de 1 a 7. Retira-se uma bola do saco dez vezes, com reposição. Qual a probabilidade do acontecimento “A bola com o número 5 não sai mais de duas vezes”?
n =10p =1/7prob.v =dbinom(0, n, p) +dbinom(1, n, p) +dbinom(2, n, p)prob.v
[1] 0.8383951
# A probabilidade é de 83,83%
13. Numa fábrica verificou-se que um certo artigo pode apresentar defeitos de dois tipos. A probabilidade de ocorrer o defeito do tipo A é 0.1 e a probabilidade de ocorrer o defeito do tipo B é 0.05. Sabendo que os defeitos ocorrem independentemente um do outro, calcule a probabilidade de:
# 14% de probabilidade de apenas um artigo ter defeito
14) Em uma empresa de pesquisa determinou-se que a probabilidade de haver crise energética é de 40% e que a probabilidade de haver aumento do desemprego é de 35%. Sabendo-se que a probabilidade de aumento no desemprego dado que houve crise energética é de 70%, responda:
# 11,66% de probabilidade de haver aumento no desemprego dado que não houve crise energética
c) Qual a probabilidade de não haver aumento no desemprego e nem crise energética?
nem.nem = nao.crise - prob.naocrise.desempnem.nem
[1] 0.53
# 53% de probabilidade de não haver aumento no desemprego e nem crise energética
d) Pode-se afirmar que os eventos haver crise energética e aumento no desemprego são independentes? Se não, caracterize-os como complementares ou concorrentes.
# Os eventos não são independentes, mas sim concorrentes, pois o evento "haver crise energética" aumenta significativamente a ocorrência de "aumento de desemprego"
15) Sabe-se que o soro da verdade, quando ministrado a um suspeito, é 90% eficaz quando a pessoa é culpada e 99% eficaz quando é inocente. Em outras palavras, 10% dos culpados são julgados inocentes, e 1% dos inocentes é julgado culpado. Se o suspeito foi retirado de um grupo em que 95% jamais cometeram qualquer crime, e o soro indica culpado, qual a probabilidade de o suspeito ser inocente?
16. Sendo X uma variável seguindo o modelo Binomial com parâmetros n = 15 e p = 0, 4; obtenha a função de probabilidade, a função de distribuição acumulada, faça os gráficos dessas funçőes e pergunta-se:
(a) P(X ≥ 14);
(b) P(8 < X ≤ 10);
(c) P(X < 2 ou X ≥ 11);
(d) P(X ≥ 11 ou X > 13);
(e) P(X > 3 e X < 6);
(f) P(X ≤ 13|X ≥ 11).
17. Um atirador fez uma aposta com um amigo: ele atiraria no alvo 10 vezes e ganharia a aposta se conseguisse acertar na mosca pelo menos 8 vezes. Sabe-se, com base no desempenho usual desse atirador, que ele costuma acertar na mosca em 70% das vezes. Qual a probabilidade do atirador ganhar a aposta?
n =10p =0.7k =8:nprob.atirador.vitoria =sum(dbinom(k, size = n, prob = p))prob.atirador.vitoria
[1] 0.3827828
# o atirador tem 38,27% de chance de ganhar a aposta
18) Admita que o número de chegadas de navios a um porto durante um dia se comporta segundo uma distribuição de Poisson. Sabe-se também que, considerando somente os dias em que chegam no máximo 2 navios, em 60% desses dias chega no máximo 1 navio.
a) Qual o número médio diário de chegadas de navios a esse porto?
# nessas condições, em 54,43% ocorre a chegada de pelo menos 3 navios
19) Suponha que o tempo médio de permanência em um hospital para pacientes com determinada doença é de 60 dias com desvio-padrão de 15 dias. Supor que o tempo de permanência segue uma distribuição aproximadamente normal. Se for sorteado 1 paciente desta população, calcule a probabilidade de que seu tempo de permanência seja:
(a) Igual ou maior que 50 dias;
media =60desvio.padrao =15x =50probabilidade.de.a =1-pnorm(x, mean = media, sd = desvio.padrao)probabilidade.de.a
[1] 0.7475075
# probabilidade de 74,75%
(b) Igual ou menor que 30 dias;
y =30probabilidade.de.b =pnorm(y, mean = media, sd = desvio.padrao)probabilidade.de.b
[1] 0.02275013
# probabilidade de 2,28%
(c) No intervalo de 40 a 70 dias;
limite1 =40limite2 =70probabilidade.de.c =pnorm(limite2, mean = media, sd = desvio.padrao) -pnorm(limite1, mean = media, sd = desvio.padrao)probabilidade.de.c
[1] 0.6562962
# probabilidade de 65,63%
(d) Igual ou maior que 75 dias.
z =75probabilidade.de.d =1-pnorm(z, mean = media, sd = desvio.padrao)probabilidade.de.d
[1] 0.1586553
# probabilidade de 15,86%
20) Assumindo µ = 1, 5 e σ 2 = 0, 1 (conhecidos) determine a probabilidade da média amostral X¯ ser maior que 2.
media.20=1.5variancia.20=0.1desvio.padrao.20=sqrt(variancia.20)z.20=50erro.padrao = desvio.padrao.20/sqrt(z.20)probabilidade.20=1-pnorm(2, mean = media, sd = erro.padrao)probabilidade.20
[1] 1
21) Antes de uma eleição, um determinado partido está interessado em estimar a probabilidade p de eleitores favoráveis ao seu candidato. Uma amostra piloto de tamanho 100 revelou que 60% dos eleitores eram favoráveis ao candidato.
a) Utilizando a informação da amostra piloto, determine o tamanho da amostra para que, com 0, 8 de probabilidade, o erro cometido na estimação seja no máximo 0, 05.
# O tamanho da amostra precisa ser de 158 (arredondando o número para ser inteiro)
b) Se na amostra final, com o tamanho obtido em (a), observou-se que 51% dos eleitores eram favoráveis ao candidato, construa o intervalo de confiança para p, com confiança de 95%