A tabela a seguir apresenta as proporções do número de apendicectomias de emergência realizadas mensalmente em um certo hospital (dados coletados ao longo de alguns anos).
| Número de Apendicectomias | Proporção |
|---|---|
| 0 | 0.05 |
| 1 | 0.17 |
| 2 | 0.10 |
| 3 | 0.02 |
| 4 | 0.17 |
| 5 | 0.14 |
| 6 | 0.15 |
| 7 | 0.20 |
Os dados a seguir apresentam o tipo sanguíneo de 50 doadores de sangue:
“A” “A” “O” “A” “O” “O” “A” “O” “O” “A” “O” “A” “B” “O” “A” “O” “O” “O” “O” “A” “B” “AB” “O” “A” “O” “O” “A” “A” “O” “O” “O” “A” “O” “A” “O” “O” “A” “A” “O” “O” “O” “O” “O” “A” “O” “O” “AB” “AB” “A” “O”
Utilize estes dados e preencha a tabela de distribuição de frequências a seguir.
Tipo Sanguíneo FrequênciaO link a seguir apresenta o gráfico de casos confirmados por faixa etária: Desconsidere os casos “sem informação”. A tolerância de erro para a correção é ±0.01.
dbinom(x = 4, size = 15, prob = 0.6 ) # item a
## [1] 0.007419892
pbinom(q = 2, size = 15, prob = 0.6, lower.tail = FALSE) # item b
## [1] 0.9997211
dbinom(x = 0, size = 5, prob = 0.7) # item c
## [1] 0.00243
pbinom(q = 0, size = 5, prob = 0.7) # item d
## [1] 0.00243
dbinom(x = 9, size = 14, prob = 0.3) # item e
## [1] 0.00662286
pbinom(q = 1, size = 14, prob = 0.3) # item f
## [1] 0.04747562
dbinom(x = 0, size = 6, prob = 0.4) # item g
## [1] 0.046656
pbinom(q = 4, size = 6, prob = 0.4, lower.tail = FALSE) # item h
## [1] 0.04096
A variável aleatória discreta(v.a.d.) \(X\) é a ocorrência de pendrives defeituosos
em um pacote contendo 30 deles com \(p =
0.07\)(chance de ser defeituoso,“sucesso”). Assim \(X\) pode ser aproximado por uma binomial em
que \(X \in \{0,..,30\}\).
Formalizando:
\[ X \sim Bin(n = 30,p = 0.07) \] A
fábrica só não devolve dinheiro se nenhum pendrive falhar em um pacote,
em todos os outros casos ela devolve. Assim por pacote: \[ \mathbb{P}(X > 0) = 1-\mathbb{P}(X =
0)=1-\binom{n}{X=0}p^0(1-p)^{n-0}=
1-\binom{30}{0}0.07^0(0.93)^{30}\]
#primeira forma
1-dbinom(0,15,0.07)
## [1] 0.6632991
#segunda forma
pbinom(0,15, 0.07, lower.tail = FALSE)
## [1] 0.6632991
No caso do cliente comprar 3 pacotes, a chance ter reembolso é do item anterior \(p= 0.8866325\). Sendo Y a chance de reembolso pelo pacote, temos : \[ Y \sim Bin(n=3,p=0.8866325) \] Neste caso \(n=3\), queremos saber \(\mathbb{P}(Y=2)\): \[\mathbb{P}(Y=2) = \binom{n}{Y=2}p^2(1-p)^{n-2} =\binom{3}{2}0.8866325^2 0.1133675^{1} \]
#primeira forma
choose(3,2)*0.8866325^2*(1-0.8866325)
## [1] 0.2673604
#segunda forma
dbinom(2,3, 0.8866325)
## [1] 0.2673604
Num jogo de dados, você paga R$25 e lança 3 dados. Se sair o número 1 em apenas um dos dados, você ganha R$25. Se sair o número 1 em dois dos dados, você ganha R$55. Se sair o número 1 em todos os três dados, você ganha R$65. Calcule o lucro líquido esperado de uma jogada. Tolerância da correção é ±0.5.
Temos X como sendo uma v.a.d. que contam a ocorrência do número em 3 dados. Formamente: \[X\sim Bin(n,p)\] Neste caso \(n=3\)(dados) e a chance de sucesso \(p=1/6\). Assim: \[ p_1=\mathbb{P}(X=1) = \binom{3}{1}\frac{1}{6}^1 \left( 1-\frac{1}{6}\right)^{3-1}= 0.3472222\] \[p_2=\mathbb{P}(X=2) = \binom{3}{2}\frac{1}{6}^2 \left( 1-\frac{1}{6}\right)^{3-2}=0.06944444\] \[p_3=\mathbb{P}(X=3) = \binom{3}{3}\frac{1}{6}^3 \left( 1-\frac{1}{6}\right)^{3-3}=0.00462963\]
p1 <- dbinom(x = 1, size = 3, prob =1/6)
p2 <- dbinom(x = 2, size = 3, prob =1/6)
p3 <- dbinom(x = 3, size = 3, prob =1/6)
p1;p2;p3
## [1] 0.3472222
## [1] 0.06944444
## [1] 0.00462963
Chamamos de Y uma variável discreta que assumi os seguintes valores com suas respectivas probabilidades:
\[Y = -25;p = 1\] \[Y = 25;p = p_1\] \[Y = 55;p = p_2\] \[Y = 65;p = p_3\]
Assim o Lucro Líquido(LL: Esperança da variável Y) será:
\[LL =\mathbb{E}[Y]= -25 + 25\times p_1 + 55\times p_2+ 65\times p_3\]
prob <-c(1, p1, p2, p3)
Y <-c(-25, 25, 55, 65)
sum(Y*prob)
## [1] -12.19907
A variável aleatória discreta(v.a.d.) \(X\) é a quantidade de pacientes que obtém
sucesso após o procedimento sendo n = 8 e \(p
= 0.76\)(sucesso de cada paciente). Assim \(X\) pode ser aproximado por uma binomial em
que \(X \in \{0,..,8\}\).
Formalizando:
\[ X \sim Bin(n,p) \] Neste caso \(n=8\), queremos saber \(\mathbb{P}(X = 4)\): \[\mathbb{P}(X=4) = \binom{n}{X=4}p^2(1-p)^{n-4}
=\binom{8}{4}0.76^4 (1-0.76)^{8-4} =0.07748139 \]
dbinom(x = 4,size = 8, prob = 0.76 )
## [1] 0.07748139
\(\mathbb{P}(X \ge 4)\): \[\mathbb{P}(X \ge 4) = \sum^{8}_{k=4}\binom{n}{X=k}p^k(1-p)^{n-k} = \] \[=\binom{8}{4}0.76^4 (1-0.76)^{8-4}+\binom{8}{5}0.76^5 (1-0.76)^{8-5}+\binom{8}{6}0.76^6 (1-0.76)^{8-6}+\] \[ + \binom{8}{7}0.76^4 (1-0.76)^{8-7}+\binom{8}{8}0.76^8 (1-0.76)^{8-8} = 0.9770452\]
# 1º Forma
pbinom(q = 3,size = 8, prob = 0.76, lower.tail = FALSE)
## [1] 0.9770452
# 2º Forma
choose(8,4)*(0.76^4)*((1-.76)^(4))+
choose(8,5)*(0.76^5)*((1-.76)^(3))+
choose(8,6)*(0.76^6)*((1-.76)^(2))+
choose(8,7)*(0.76^7)*((1-.76)^(1))+
choose(8,8)*(0.76^8)*((1-.76)^(0))
## [1] 0.9770452
# 3º Forma
sum(dbinom(4:8, 8, 0.76))
## [1] 0.9770452
\(\mathbb{P}(X < 4)\): \[\mathbb{P}(X < 4) = \sum^{3}_{k=0}\binom{n}{X=k}p^k(1-p)^{n-k} = \] \[=\binom{8}{0}0.76^0 (1-0.76)^{8-0}+\binom{8}{1}0.76^1 (1-0.76)^{8-1}+\binom{8}{2}0.76^2 (1-0.76)^{8-2}+ \] \[ + \binom{8}{3}0.76^3 (1-0.76)^{8-3}= 1 - \mathbb{P(X \ge 4)} =0.02295478 \]
# 1º Forma
pbinom(q = 3,size = 8, prob = 0.76 )
## [1] 0.02295478
# 2º Forma
choose(8,0)*(0.76^0)*((1-.76)^(8))+
choose(8,1)*(0.76^1)*((1-.76)^(7))+
choose(8,2)*(0.76^2)*((1-.76)^(6))+
choose(8,3)*(0.76^3)*((1-.76)^(5))
## [1] 0.02295478
#3º Forma
sum(dbinom(0:3, 8, 0.76))
## [1] 0.02295478
p <- 0.6
dgeom( x = 0, prob = p) #item a
## [1] 0.6
pgeom( q = 3, prob = p) # item b
## [1] 0.9744
pgeom( q = 1, prob = p, lower.tail = FALSE) - pgeom(q = 4, prob = p, lower.tail = FALSE) # item c
## [1] 0.14976
pgeom( q =0, prob = p, lower.tail = FALSE) #item d
## [1] 0.4
Seja X a v.a.d. tal que \(X = X_1 + X_2\), onde \(X_k \sim U(n)\) para \(k={1,2}\)sendo os dados v.a.d. de distribuição uniforme com parâmetro \(n=6\), assim os valores \(X_k \in \{1,..,6\}\) com (\(k={1,2}\)).
Para modelar este problema consideramos X como sendo uma v.d.a. de distribuição geométrica, ou seja, temos: \[X \sim Geom(p = 1/18)\] Assim,temos para ocorrência de um sucesso em menos de 15 lançamentos: \[\mathbb{P}(X < 15)=\mathbb{P}(X \le 14) =\sum^{13}_{k=0} \left(1 - \frac{1}{18}\right)^{k}\frac{1}{18} = 0.5507689 \]
#sucesso em menos do que 15, significa que no máximo vão ter 14 lançamentos
# sendo o máximo de fracassos 13, logo:
pgeom(q=13, prob =1/18)
## [1] 0.5507689
Analogamente, reescrevemos e usamos a probabilidade complementar e o resultado do item anterior: \[\mathbb{P}(X > 15) = 1 - \mathbb{P}(X \le 15) = 1-\left[\mathbb{P}(X \le 14)+\mathbb{P}(X = 15)\right] = \] \[\mathbb{P}(X > 15) = 1-\left[ 0.5507689 + \left(1-\frac{1}{18}\right)^{14}\frac{1}{18} \right] =1-(0.5507689+0.02495728)= 0.4242738 \]
# 1°forma
1- pgeom(q = 14, prob = 1/18)
## [1] 0.4242738
#2° forma
pgeom(q = 14, prob = 1/18, lower.tail = FALSE)
## [1] 0.4242738
#3° forma
1- (pgeom(q = 13, prob = 1/18) + dgeom(x = 14, prob = 1/18))
## [1] 0.4242738
\[\mathbb{P}(G = 4) = (1-0.25)^{4-1}\times 0.25=0.75^3 \times 0.25 =0.1054688\] No R temos que a variável associada esta contando a quantidade de insucessos, logo devemos subtrair uma unidade. Assim se \(G = 4\), devemos buscar no R o valor \(x = 3\)
p <- 0.25 # chance de sucesso
dgeom(x = 3, prob = p)
## [1] 0.1054688
\[\mathbb{P}(G < 4) = \mathbb{P}(G \le 3) = \mathbb{F}(3)=\sum_{x=1}^{3}{(1-p)^{x-1}p}\] \[\mathbb{P}(G < 4) =(1-p)^2p+(1-p)p+p=0.578125\]
pgeom(q = 2, prob = p)
## [1] 0.578125
\[\mathbb{P}(1 < G \le 4) = \mathbb{F}(4)- \mathbb{F}(1) = \sum_{k=1}^{4}{(1-p)^{k-1}p} -(1-p)^0p =\left(\sum_{k=1}^{4}{(1-p)^{k-1}} -1\right)p \] \[\mathbb{P}(1 < G \le 4) =p(1 + (1-p)^2 + (1-p)^3+ (1-p)^4 - 1)\] \[\mathbb{P}(1 < G \le 4) = p((1-p)^2 + (1-p)^3+ (1-p)^4-p)=0.4335938\] Analogamente ao anterior realizando a transformação adequada, temos:
p <- 0.25
pgeom(q = 3 , prob = p)- pgeom(q = 0, prob = p)
## [1] 0.4335938
Suponha que uma loja envie ao cliente uma mensagem com as promoções da semana via WhatsApp. A probabilidade de que a venda para um cliente se realize após o envio da mensagem é 0.59. Assume-se que essa probabilidade seja mantida, independente do total de semanas que a loja já tenha enviado as promoções para o cliente. Encontre a probabilidade de que a primeira venda para um cliente só ocorra após o envio das promoções por 2 semanas seguidas.
Conside a v.a.d. \(E \in \{1, 2, \dots\}\), correspondendo a semana em que a venda ocorre após a k-ésima mensagem(\(E=k\)). Nossa v.a.d. \(E\) possui distribuição de probabilidade geométrica, assim: \[E \sim Geom(p = 0.59)\] \[\mathbb{P}(E = x) = (1-p)^{x-1}p\] Desejamos conhecer a probabilidade da primeira venda ocorra após o envio de duas mensagens, logo tivemos um fracassos e o sucesso ocorre na semana da segunda mensagem, logo \(E =2\). Portanto: \[\mathbb{P}(E=2) = p(1-p) \] No R temos que lidamos com a quantidade de insucessos(\(Q\)), assim \(\mathbb{P}(E = 2) = \mathbb{P}(Q =1)\), logo o código em R fica:
dgeom(x=1, prob = 0.59)
## [1] 0.2419
Substituindo os valores, temos: \[\mathbb{P}(X=0|m=4,n=11,k=5)=\large{\frac{\binom{4}{0}\binom{11}{5-0}}{\binom{15}{5}}}= 0.1538462\]
#1°forma
dhyper(x=5,m=11, n=4, k=5)
## [1] 0.1538462
#2° forma
dhyper(x=0, m=4, n=11, k=5)
## [1] 0.1538462
#3°forma
m = 11 # não defeituosas
n = 4 # defeituosa
k = 5 # tamanho da amostra
N = m + n # tamanho do lote
x = 5 # quantidade de não defeituosas
choose(m, x)*choose(n, k-x)/choose(N, k)
## [1] 0.1538462
#4°forma
m = 4 # defeituosas
n = 11 # não defeituosa
k = 5 # tamanho da amostra
N = m + n # tamanho do lote
x = 0 # quantidade de defeituosas
choose(m, x)*choose(n, k-x)/choose(N, k)
## [1] 0.1538462
Aceitar o lote equivale a encontrar apenas uma peça defeituosa na amostra, logo: \[\mathbb{P}(X \le 1|m=4,n=11,k=5)=\large{\sum_{i=0}^{1}\frac{\binom{4}{i}\binom{11}{k-i}}{\binom{15}{5}}}=\large{\frac{\binom{10}{0}\binom{5}{5-0}}{\binom{15}{5}}} + \large{\frac{\binom{10}{1}\binom{5}{5-1}}{\binom{15}{5}}}=0.5934066\]
#1° forma
phyper(q=1,m=4, n=11, k=5)
## [1] 0.5934066
#2° forma
dhyper(x=0,m=4, n=11, k=5)+dhyper(x=1,m=4, n=11, k=5)
## [1] 0.5934066
Entre os 17 programadores de uma empresa, 10 são do sexo masculino. A empresa decide sortear 2 programadores para fazer um curso avançado de programação. Qual é a probabilidade de termos 1 programadores do sexo masculino entre os 2 sorteados?
Semelhante ao clássico problema da urna contendo N bolas, sendo m brancas e n pretas, realizando k retiradas sem reposição, a quantidade de bolas brancas segue uma distribuição hipergeométrica de paramêtros m,n e k. Neste problema bolas branca equivale ao sexo masculino e bola preta ao feminino, nosso k é o número de vagas para o curso, neste caso k=2. \[\mathbb{P}(X=x|m,n,k)= \large{\frac{\binom{m}{x}\binom{n}{k-x}}{\binom{N}{k}}}\] \[\mathbb{P}(X = 1|m=10,n=7,k=2)= \large{\frac{\binom{10}{1}\binom{7}{2-1}}{\binom{17}{2}}}=0.5147059\]
dhyper(x = 1, m = 10, n = 7, k = 2)
## [1] 0.5147059
A variável aleatória discreta(v.a.d.) X é número de falhas ao longo do comprimento do cabo de fibra ótica(\(t\)), sendo que esta ocorrência tem natureza aproximado pela distribuição de Poisson. \[ X \sim Pois(\lambda t ) \] \[ \mathbb{P}(X = x | \lambda t) = \frac{\lambda t ^xe^{-\lambda t}}{x!} \] Temos \(t=180\) m(equivale ao comprimento do cabo) e \(\lambda = \frac{2.2}{50}\)(taxa de falha em um comprimento conhecido), logo \(\lambda t = 7.92\). Resultando:
#item a
lambda <- 2.2/50
t <- 180
x <- 8
dpois(x, lambda*t)
## [1] 0.1395303
\(\lambda t = 0.044\times 120= 5.28\) \[ \mathbb{P}(X \ge 3| \lambda t = 5.28) = 1- \mathbb{P}(X < 3| \lambda t = 5.28) = 1-(\mathbb{P}(X = 0)+\mathbb{P}(X = 1)+\mathbb{P}(X = 2)+\mathbb{P}(X = 3))\] \[ \mathbb{P}(X > 3| \lambda t = 5.28) = 1-(\mathbb{P}(X = 0)+\mathbb{P}(X = 1)+\mathbb{P}(X = 2) + \mathbb{P}(X = 3)) = 1 - \sum_{x=0}^{3}{ \frac{e^{-\lambda t}\lambda t^x }{x!}}\] \[ \mathbb{P}(X > 3| \lambda t = 5.28) = 1 - \left(\frac{e^{- 5.28}\times 5.28^0}{0!}+\frac{e^{- 5.28}\times 5.28^1}{1!}+\frac{e^{- 5.28}\times 5.28^2}{2!}+\frac{e^{- 5.28}\times 5.28^3}{3!}\right)\]
#item b
1-exp(-5.28)*(5.28^0/factorial(0)+5.28^1/factorial(1)+5.28^2/factorial(2)+5.28^3/factorial(3))
## [1] 0.7721026
#ou de outra forma
ppois(q = 3, lambda = 5.28, lower = FALSE)
## [1] 0.7721026
Você está no shopping e precisa retornar uma ligação urgente, mas seu celular está praticamente sem bateria. Você encontra um ponto de recarga, mas alguém chega para usá-lo primeiro do que você. Suponha que a duração média, em minutos, de uma recarga no shopping seja 10 e que o tempo de recarga no shopping siga uma distribuição exponencial.
A tolerância de erro para a correção é ±0.005.X: é uma variável aleatória contínua que mede o tempo de espera que podemos esperar para carregar nosso celular em um shopping \[ X \sim Exp(\lambda )\] Para \(x\) \(\ge\) 0 , temos a densidade de probabilidade de uma v.a.c. de distribuição exponencial sendo: \[f(x) = \begin{cases} \lambda e^{-\lambda x}, & \mbox{para } x\ge 0 \\ 0, & \mbox{caso contrário } x<0 \end{cases} \]
A função acumulada:
\[\mathbb{F}(X= x) = \mathbb{P}(X\le x) =\begin{cases} 1- e^{-\lambda x}, & \mbox{para } x\ge 0 \\ 0, & \mbox{caso contrário } x<0 \end{cases} \]Temos como obter o parâmetro \(\lambda\) da distribuição da v.a.c. X: \[\mathbb{E}(X) = \frac{1}{\lambda}=10\] \[\therefore \lambda = 0.1\] \[\mathbb{P}(X < 10 | \lambda = 0.1) = \mathbb{P}(X \le 10 | \lambda = 0.1) =\mathbb{F}(X=10)\] \[\mathbb{F}(X=10)= 1 - e^{-\lambda x}= 1- e^{\frac{1}{10} \times 10}= 0.6321206\] Pelo R:
pexp(q = 10, rate = 0.1)
## [1] 0.6321206
No intervalo não nos preocupamos com os extremos serem abertos ou fechados, pois a probabilidade de uma variável contínua em um ponto é nula, logo podemos fechar os extremos do intervalos ou deixa-los em aberto: \[\mathbb{P}(10 \le X < 11)= \mathbb{P}(10 < X \le 11)= \mathbb{P}(10 < X < 11) =\mathbb{P}(10 \le X \le 11) = \mathbb{F}(X=11) - \mathbb{F}(X=10)=\] \[\mathbb{P}(10 \le X \le 11) =1- e^{\frac{1}{10} \times 11}- \left(1- e^{\frac{1}{10} \times 10}\right)=0.03500836\]
Pelo R:
pexp(q = 11, rate = 0.1)-pexp(q = 10, rate = 0.1)
## [1] 0.03500836
Cedo ou tarde, as máquinas falham. Suponha que o tempo de falha (em unidades de mil horas) de uma certa máquina seja uma variável aleatória com distribuição exponencial de parâmetro 𝜆.
A experiência mostra que a probabilidade de que o tempo de falha de uma certa máquina exceda 11 mil horas é 0.56.
A tolerância de erro para a correção dos itens é ±0.01 e ±1, respectivamente.X: é uma variável aleatória contínua que mede o tempo de funcionamento de uma máquina antes dela vir a falhar. \[ X \sim Exp(\lambda )\] Para \(x\) \(\ge\) 0 , temos a densidade de probabilidade de uma v.a.c. de distribuição exponencial sendo: \[f(x) = \begin{cases} \lambda e^{-\lambda x}, & \mbox{para } x\ge 0 \\ 0, & \mbox{caso contrário } x<0 \end{cases} \]
A função acumulada: \[\mathbb{F}(X= x) = \mathbb{P}(X\le x) =\begin{cases} 1- e^{-\lambda x}, & \mbox{para } x\ge 0 \\ 0, & \mbox{caso contrário } x<0 \end{cases} \]A unidade de \(X\) é em mil horas,
temos:
\[\mathbb{P}(X > 11) = 1 - \mathbb{P}(X
< 11)=0.56 = 1-(1 - e^{-\lambda \times 11})\]
\[e^{-\lambda \times 11} = 0.56 \iff ln(e^{-\lambda \times 11}) = ln(0.56) \iff \lambda = -\frac{1}{11}\times ln(0.56) \] \[\therefore \lambda = 0.05271077\]
lambda <- -log(0.56)/11
##testando P(X>11|lambda)
pexp(q = 11, rate = lambda, lower.tail = FALSE)
## [1] 0.56
Temos que a integral imprópria da \(f(x)\), densidade de probabilidade da variável aleatória contínua, será:
\[\int_{-\infty}^{+\infty}{f(x)dx = 1}\] Como 𝑥∈[0,𝑐], resumimos: \[\int_{0}^{c}{f(x)dx = 1}\] \[\int_{0}^{c}{bx^4dx = 1} \iff \tfrac{1}{5} bx^5 \Big|_0^c=1 \iff \tfrac{1}{5} bc^5 -\tfrac{1}{5} b(0)^5=1\] \[\tfrac{1}{5} bc^5 =1 \tag{1}\] Utilizando a esperança da variável X encontraremos uma segunda equação que permita determinar o termo b com a expressão acima: \[\mathbb{E}[X] = \mu_X= \int_{-\infty}^{+\infty}{x.f(x)dx}\] \[\mathbb{E}[X] = \int_{0}^{c}{x(bx^4)}dx=0.55 \iff \int_{0}^{c}{bx^5}dx=0.55 \iff \tfrac{1}{6} bx^6 \Big|_0^c=0.55 \iff \]
\[\tfrac{1}{6} bc^6 =0.55 \tag{2} \] De \(\frac{(2)}{(1)}\), temos: \[\frac{5}{6}c=0.55\] \[\therefore c =0.66\] (a):Substituindo c em (1), temos:
\[\tfrac{1}{5} b(0.66)^5 =1 \] \[\therefore b =39.9255 \]
(c):Com os valores de b e c conhecidos, calculamos a seguinte acumula:
\[\mathbb{F}(X=c/3)=\mathbb{P}(X \le c/3)=\int_{0}^{c/3}{bx^4}dx \iff \tfrac{1}{5} bx^5 \Big|_0^{c/3}=\tfrac{1}{5} b(c/3)^5 \] \[\therefore \mathbb{F}(X=c/3)=\tfrac{1}{5} b(c/3)^5=0.004115227 \]
(d):A variância será:
\[\mathbb{Var}[X] = \sigma^2_X=\mathbb{E}[(X- \mu_X)^2]=\int_{-\infty}^{+\infty}{(x- \mu_X)}^2f(x)dx \]
Conhecendo a média(\(\mu_X\)=0.55) do enunciado, temos: \[\mathbb{Var}[X] = \int_{0}^{c}{(x-0.55)}^2bx^4dx= 0.008642857 \] Usando o R para resolver numericamente a integral:
c <- 0.55*6/5
b <- 5/c^5
mu <- 0.55
fx <- function(x){
b*x^4
}
gx <- function(x){
(x-mu)^2*fx(x)
}
integrate(gx, lower = 0, upper = c)$value
## [1] 0.008642857
pnorm(q= -0.4) # item a
## [1] 0.3445783
pnorm(q = -0.15) # item b
## [1] 0.4403823
pnorm(q = -0.35, lower.tail = FALSE) # item c
## [1] 0.6368307
pnorm(q = -0.78) # item d
## [1] 0.2176954
pnorm(q = -0.23) # item e
## [1] 0.4090459
pnorm(q = 0.95) # item f
## [1] 0.8289439
# item g: probabilidade em um ponto é nula para v.a.c.
pnorm(q = -0.12) - pnorm(q = -1.85) #item a
## [1] 0.4200848
pnorm(q = -0.39) - pnorm(q = -0.69) #item b
## [1] 0.1031712
pnorm(q = 0.91) - pnorm(q = -1.86) #item c
## [1] 0.787146
pnorm(q = 0.67) - pnorm(q = -0.18) #item d
## [1] 0.3199948
pnorm(q = 1.11) - pnorm(q = -1.26) #item e
## [1] 0.7626658
pnorm(q = 1.23) - pnorm(q = 0) #item f
## [1] 0.3906514
pnorm(q = 6.27, mean = 7, sd =2) - pnorm(q = 5.81, mean = 7, sd =2) #item a
## [1] 0.08163397
pnorm(q = 6.42, mean = 7, sd =2) - pnorm(q = 5.75, mean = 7, sd =2) #item b
## [1] 0.1199226
pnorm(q = 8.85, mean = 7, sd =2) - pnorm(q = 6.45, mean = 7, sd =2) #item c
## [1] 0.4308589
qnorm(p = 0.8904, lower.tail = FALSE) # item a
## [1] -1.228658
qnorm(p = 0.0809, lower.tail = FALSE) # item b
## [1] 1.399043
qnorm(p = 0.1607) # item c
## [1] -0.991585
qnorm(p = 0.6577) # item d
## [1] 0.4061941
qnorm(p = 0.418/2, lower.tail = FALSE) # item e
## [1] 0.8098959
qnorm(p = 0.1477/2, lower.tail = FALSE) # item f
## [1] 1.447703
qnorm(p = (1-0.1351)/2, lower.tail = FALSE) # item g
## [1] 0.17014
qnorm(p = (1-0.2577)/2, lower.tail = FALSE) # item h
## [1] 0.3288091
Suponha que o tempo que um aluno gasta para ir de casa até a UNICAMP segue aproximadamente uma distribuição Normal com média 41 minutos e desvio padrão 10 minutos. Se este aluno tem uma prova às 8:00 e quer ter 90% de certeza de que não vai chegar atrasado, quantos minutos antes da prova ele deverá sair de casa?
Arredonde para o maior inteiro.
\[X \sim \mathcal{N}(\mu = 41, \sigma=10)\] \[\mathbb{P}(X \le x) = 0.90\]
qnorm(p = 0.90, mean = 41, sd = 10)
## [1] 53.81552
Assim: \[\therefore \lceil x \rceil=54\] Logo ele deve sair com 54 minutos de antecedência.
23% melhores: \[\mathbb{P}(X \ge x) = 0.23\]
qnorm(p = 0.23, lower.tail = FALSE, mean = 387, sd = 73)
## [1] 440.9358
9% melhores: \[\mathbb{P}(X \ge x) = 0.09\]
qnorm(p = 0.09, lower.tail = FALSE, mean = 387, sd = 73)
## [1] 484.8751
A probabilidade buscada é traduzida como:
\[\mathbb{P}[X_A > 30| \mathcal{N}(37,6)]\]
pnorm(q = 30, mean = 37, sd = 6, lower.tail = FALSE)
## [1] 0.8783275
A probabilidade buscada é traduzida como:
\[\mathbb{P}[X_B > 30| \mathcal{N}(32,5)]\]
pnorm(q = 30, mean = 32, sd = 5, lower.tail = FALSE)
## [1] 0.6554217
Nos Estados Unidos, 37% das pessoas admitem bisbilhotar nos armários de banheiro de outras pessoas. Você seleciona aleatoriamente 230 pessoas nos EUA e lhes pergunta se eles bisbilhotam no armário do banheiro de outras pessoas. Qual é a probabilidade de que pelo menos 75 digam sim? Use a aproximação da binomial pela normal.
(A tolerância da correção é ±0.05)
Seja \(p\)=0.37 o valor do parâmetro populacional, que mede a fração da população que admite bisbilhotar nos armários e banheiros de outras pessoas, X é uma v.a.d. que mede a quantidade de pessoas que dizem sim e n = 230 é o tamanho da amostra. Temos:
\[X \sim Bin(n=230, p=0.37)\]Satisfeito as condições anteriores podemos aplicar a aproximação, assim: \[\mu = np=85.1 \\ \sigma^2 = np(1-p)=53.613\] A expressão “pelo menos” indica que será: \[\mathbb{P}(X \ge 75|p=0.37, n=230)=\sum_{k=75}^{230} \binom{230}{k}p^{k}(1-p)^{230-k}\] Vai ser aproximado pela normal: \[\mathbb{P}(X \ge 75|p=0.37, n=230)\approx \mathbb{P}(X \ge 75|\mathcal{N}(\mu=85.1, \sigma = 7.32209)) \] Podendo ser transformado para normal padrão: \[Z_{lim}=\frac{75-85.1}{7.32209}=-1.379388\] \[\mathbb{P}(X\ge 75|p=0.37, n=230)\approx \mathbb{P}(Z \ge Z_{lim} |\mathcal{N}(\mu=0, \sigma = 1))=\\ =1-\mathbb{P}(Z < Z_{lim} |\mathcal{N}(\mu=0, \sigma = 1))=0.9161124 \]
p <- 0.37 ; n <- 230
mu <- n*p; sigma_2 <-n*p*(1-p)
X <- 75
Z_lim <-(X - mu)/sqrt(sigma_2)
1-pnorm(Z_lim)
## [1] 0.9161124
#ou
pnorm(Z_lim, lower.tail = FALSE)
## [1] 0.9161124
O tempo de vida de uma determinada espécie de inseto é uma variável aleatória que pode ser modelada usando uma distribuição exponencial com parâmetro λ= 1/19 dias.
Seja X uma v.a.c.(variável aletória contínua) que mede o tempo de vida em dias de uma determinada espécie de inseto. A função densidade de distribuição de probabilidade(conhecido como pdf(probability density function)) é dado pelo modelo de distribuição exponencial. Logo:
\[X \sim Exp(\lambda)\]
\[\mathbb{P}(X \ge 19)=1-F(x=19)=\\ =1-\int_0^{19}{\lambda e^{-\lambda x}dx}=1-e^{\lambda t}\Big|_0^{x=19}=1-(1-e^{-19\times \big(\frac{1}{19}\big)})=\\ =e^{-1}= 0.3678794\]
#item c
exp(-1);
## [1] 0.3678794
## outra forma
pexp(q=19, rate = 1/19, lower.tail = FALSE)
## [1] 0.3678794
Considerando que temos uma amostra aletória de tamanho n=600, esperamos que a média amostral \(\overline{X}\) tenha como valor esperado a esperança de X, ou seja: \[\mathbb{E}[\overline{X}]=\mathbb{E}[X]=\mu= \frac{1}{\lambda}=19\]
\[\mathbb{P}(X \le t) =0.46\] \[\int_0^t \lambda e^{-\lambda t}= 0.46 \implies 1-e^{-t\times 1/19}=0.46 \iff e^{-t\times 1/19}=0.54 \iff \\ \iff ln(e^{-t\times 1/19})=ln(0.54) \iff \frac{-t}{19}=ln(0.54) \iff\\ \iff t= -19\times ln(0.54)\\ \therefore t = 11.70754\]
#item e
-19*log(0.54);
## [1] 11.70754
#outra forma
qexp(p = 0.46, rate = 1/19)
## [1] 11.70754
O desvio padrão das médias amostrais será: \[S=\Big(\frac{\sigma^2}{n}\Big)^{1/2}=\Big(\frac{1/ \lambda^2}{n}\Big)^{1/2}=\Big(\frac{1}{n\lambda^2}\Big)^{1/2}=\frac{19}{\sqrt{130}}\\ \therefore S= 1.66641\]
#item f
lambda <- 1/19; n_f <- 130;
sigma <- 1/(lambda);
S <- sigma/sqrt(n_f)
S
## [1] 1.66641
A média amostral do tempo de vida insetos é uma v.a.c. que tem uma distribuição normal de acordo com o TLC(Teorema do Limite Central), sendo os parâmetros dados pela distribuição exponencial, logo:
\[\overline{X} \sim N\Big(\mu=1/\lambda, \sigma=\sqrt{\frac{1/\lambda^2}{n}}\Big)\] A função densidade de probabilidade da normal tem a forma analítica: \[f(x|\mu, \sigma) =\frac{1}{\sqrt{2\pi\sigma^2}}e^{\frac{-(x-\mu)^2}{2\sigma^2}},\: -\infty <x< +\infty \]
Nosso problema é expresso: \[ \mathbb{P}(\overline{X} \le t|\mu, \sigma) = \alpha=0.46\\ \int_{-\infty}^{x=t}f(x)dx=0.46\]
\[ F(t) =\mathbb{P}(\overline{X} \le t)= \frac{1}{\sqrt{2\pi \sigma^2}}\int_{-\infty}^{t}{e^{\frac{-(x-\mu)}{2\sigma^2}}dx}=0.46\\ \] A forma analítica complexa é reduzida pela transformação para a normal padrão permitindo o uso de tabelas: \[ Z_{\alpha}= \frac{t-\mu}{\sigma} \sim \mathcal{N}(0,1) \]
Assim a forma analítica que encontramos em tabelas, por curiosidade fica: \[ F(t) =\mathbb{P}\Big(Z \le \frac{t-\mu}{\sigma}\Big)= \phi(Z=Z_{\alpha})=\alpha\\ \phi(Z_{\alpha})=\frac{1}{\sqrt{2\pi }}\int_{-\infty}^{\frac{(t-\mu)}{\sigma}}{e^{\frac{-z^2}{2}}dz}=0.46 \] Efetivamente quando usamos alguma tabela com normal padrão, estamos lidando com a função inversa, \(\phi^{-1}(\alpha)\). Sendo o nosso valor encontrado na tabela normal padrão: \[ Z_{\alpha}=\phi^{-1}(0.46)=-0.1004337 \]
Finalmente encontrado o valor na forma padrão basta realizar a transformação:
\[ t= Z_{\alpha}\times\sigma + \mu=\frac{-0.1004337 \times 19}{\sqrt{130}}+19=18.83264 \]
#item g
Z_alpha <- qnorm(p = 0.46)
t<- Z_alpha*S+(1/lambda)
t
## [1] 18.83264
X é a v.a.c. que mede a quantidade em milhares de milhas por ano de um passageiro, esta tem distribuição normal parâmetros \(\mu_x=18\)(em milhares de milhas por ano) e \(\sigma_X=9\)(em milhares de milhas por ano) \[X \sim \mathcal{N}(\mu_X, \sigma_X)\] Amostra
O bônus é concedido a uma amostra aleatória da população, sendo seu tamanho \(n=50\). Seja uma B uma v.a.c definida como segue:
\[B = 10X_1+10X_2+ \dots + 10X_{50}= \sum_{i=1}^{50}{10X_i}\] Uma somatória de variáveis aleatórias contínuas de distribuição normal também tem uma distribuição normal, logo: \[B \sim \mathcal{N}(\mu_B, \sigma_B)\] Sendo: \[\mu_B= \mathbb{E}[B]=\mathbb{E}\Big[\sum_{i=1}^{50}{10X_i}\Big]\\ =10\sum_{i=1}^{50}{\mathbb{E}[X_i}]=10\times 50 \times \mu_X=9000\\ \therefore \mu_X=9000\]
\[\sigma_B^2= \mathbb{Var}[B]=\mathbb{Var}\Big[\sum_{i=1}^{50}{10X_i}\Big]\\ =10^2\sum_{i=1}^{50}{\mathbb{Var}[X_i}]=10^2\times 50 \times \sigma_X^2=10^2(25^22)9^2\\ \therefore \sigma_X=450\sqrt{2}\] Vamos converter na normal padrão nosso intervalo para uso da tabela: \[\mathbb{P}(8500 \le B \le 9000)= \mathbb{P}\Big(\frac{8500-9000}{450\sqrt{2}} \le Z \le \frac{9000-9000}{450\sqrt{2}} \Big) =\\ =\mathbb{P}(-0.7856742 \le Z \le 0)=\phi(0)-\phi(-0.7856742)=\\ 0.5-0.2160292=0.2839708\\ \therefore \mathbb{P}(8500 \le B \le 9000)=0.2839708\]
mu <- 9000
sigma <- 450*sqrt(2)
Binf <- 8500
Bsup <- 9000
Zinf <- (Binf-mu)/sigma
Zsup <- (Bsup-mu)/sigma
pnorm(Zsup)- pnorm(Zinf)
## [1] 0.2839708
Analogamente:
\[\mathbb{P}(B \ge 10500)= \mathbb{P}\Big( Z \ge \frac{10500-9000}{450\sqrt{2}} \Big) =\\ =\mathbb{P}(Z \ge 2.357023)=1-\mathbb{P}(Z \le 2.357023)=\\ =1-\phi(2.357023)=1-0.9907889= 0.009211063\\ \therefore \mathbb{P}(B \ge 10500)=0.2839708\]
mu <- 9000
sigma <- 450*sqrt(2)
B <- 10500
Z <- (B-mu)/sigma
#1° Forma
1-pnorm(Z)
## [1] 0.009211063
#2° Forma
pnorm(Z,lower.tail = FALSE)
## [1] 0.009211063
A esperença da média amostral é igual a média da população, logo:
\[\mathbb{E}[\overline{X}]=\mu_X\\ X \sim Unif(a=40, b=57) \implies\\ \implies \mathbb{E}[X]=\mu_x= \frac{b+a}{2}=\frac{57+40}{2}\\ \therefore \mu_X=48.5\;\;\;\;\;\;\;\therefore\mathbb{E}[X]=48.5 \]O desvio padrão amostral, \(S_{\overline{X}}\), será:
\[ S_{\overline{X}}=\sqrt{\mathbb{Var}[\overline{X}]}=\sqrt{\frac{\sigma_X^2}{n}}=\frac{\sigma_X}{\sqrt{n}}\] Onde n é o tamanho da amostra, neste caso n=100.O desvio padrão populacional, \(\sigma_X\), será na uniforme contínua:
\[\sigma_X^2=\mathbb{Var}[X]=\frac{(b-a)^2}{12}=\frac{(57-40)^2}{12}\\ \sigma_X^2=24.08333 \implies \sigma_X=\sqrt{24.08333}=4.907477\]Finalmente, subtituindo:
\[ S_{\overline{X}}=\frac{\sigma_X}{\sqrt{n}}=\frac{4.907477}{\sqrt{100}}=0.490748\]
Se você coletar uma amostra aleatória de tamanho 500 dentre os alunos do primeiro ano e calcular a média, qual o valor esperado desta média amostral? Arredonde para 2 casas decimais.
95% dos alunos estão a uma distância de no máximo C da Unicamp. Qual o valor de C?
Você coleta uma amostra aleatoria de tamanho 120 dentre os alunos do primeiro ano e calcula a média. Você repete este procedimento 500 vezes e o histograma representando a distribuição dessas médias amostrais é apresentado a seguir. O desvio padrão destas 500 médias amostrais será próximo a qual valor? Arredonde para 2 casas decimais.
Considere uma amostra aleatória de 120 alunos do primeiro ano. Qual o percentil 95 da distribuição da média amostral da distância de casa até a Unicamp?
\(X\) é uma v.a.c. com distribuição exponencial de parâmetro \(\lambda=1/\mu_X=1/4\). Podendo ser escrito:
\[X \sim Exp(\lambda=0.25)\\ \mathbb{E}[X]= 1/\lambda= \mu_X=4\]\(\overline{X}\) é uma v.a.c. definido como média amostral. A esperança dela é exatamente igual a média populacional, logo:
\[\mathbb{E}[\overline{X}]=\mathbb{E}\Big[\frac{1}{n}\sum^n_{i=1}{X_i}\Big]=\\=\frac{1}{n}\sum^n_{i=1}\mathbb{E}[{X_i}]=\frac{1}{n}\sum^n_{i=1}\mu_X=\\=\frac{n}{n}\mu_X=\mu_X\\ \therefore \mathbb{E}[\overline{X}]=\mu_X=4\]
Como X tem distribuição exponencial vamos integrar a função densidade de probalidade \(f(x)\) para encontrar sua acumulada, \(F(C)\), assim:
\[f(x)= \lambda e^{-\lambda x}\\ F(C)= \int_{0}^{C}f(x)dx=\int_{0}^{C}\lambda e^{-\lambda x}dx= \\ =-e^{-\lambda x}\Big|_{x=0}^C=-e^{-\lambda C}-(-e^0)=1-e^{-\lambda C}=0.95\\ e^{-\lambda C}=1-0.95 \implies -\lambda C= ln(0.05)\\ \therefore C= \frac{-1}{\lambda}ln(0.05)=11.98293\]Para a amostra podemos usar o fato que a média amostral tem distribuição normal, usando o TLC, com parâmetros \(\mu_{\overline{X}}=\mu_X=1/\lambda\) e \(S=\sigma_{\overline{X}}=\frac{\sigma_{X}}{\sqrt{n}}=\frac{1}{\lambda\sqrt{n}}\)(advindos da distribuição exponencial). Assim:
\[\overline{X} \sim \mathcal{N}(\mu_{\overline{X}}=1/\lambda, \sigma_{\overline{X}}=1/\lambda\sqrt{n})\\ \mathbb{P}(\overline{X} \le C) = 0.95 \] Da normal padrão sabemos:
qnorm(0.95)
## [1] 1.644854
Assim, realimos a transformação: \[Z=\frac{C-\mu}{\sigma/\sqrt{n}} \implies C= \mu+Z\frac{\sigma}{\sqrt{n}}\\ C= 4+1.644854\times \frac{4}{\sqrt{120}}=4.600616\]
Um importante indicador da função pulmonar é o volume expiratório forçado (VEF): o volume de ar que uma pessoa consegue expirar em um segundo. A Dra. Roseli deseja medir o VEF em uma amostra aleatória de mulheres de uma certa população de interesse e usar a média obtida na amostra para estimar a média da população de interesse.
Seja 𝐸 o evento indicando que a média amostral está entre ±88 ml da média da população. Suponha que o VEF na população de interesse segue a distribuição normal com média 2750 ml e desvio padrão 350 ml.Dado:
População
X é uma v.a.c. de distribuição normal que mede o volume expiratório forçado(VEF, em ml) em um certa população. \[X \sim \mathcal{N}(\mu_X=2750, \sigma_X=350)\]Amostra A(\(n_A=16\))
A média amostral A será:
\[\overline{X}_A \sim N\Big(\mu_X, \frac{\sigma_X}{n_A}\Big)\]A margem de erro(\(ME=\)±88ml) pode ser expressa:
\[ME = Z_A\frac{\sigma_X}{\sqrt(n_A)}\]Sendo \(Z_A\):
\[ Z_A = \frac{\Big(\mu_X- \overline{X} \Big)}{\sigma_{\overline{X}}} = \frac{ME}{\sigma_X/\sqrt{n_A}} \\ Z_A=1.005714\]
Logo: \[\mathbb{P}(|Z| \le Z_A)= \mathbb{P}(-Z_A \le Z \le Z_A)=\\ =\mathbb{P}(Z_A)- \mathbb{P}(-Z_A)= \mathbb{P}(Z_A)-(1-\mathbb{P}(Z_A)=\\ =2\mathbb{P}(Z_A)-1\\ \mathbb{P}(|Z| \le Z_A)=2 \times 0.8427235-1=0.685447\]
sigma_X <- 350
n_A <- 16
sigma_Xbar_A <- sigma_X/sqrt(n_A)
ME <- 88
Z_A <-ME/(sigma_Xbar_A)
Z_A
## [1] 1.005714
2*pnorm(Z_A)-1
## [1] 0.685447
Amostra B(\(n_B=39\))
A média amostral B será: \[\overline{X}_B \sim N\Big(\mu_X, \frac{\sigma_X}{\sqrt{n_B}}\Big)\] Analogamente ao item anterior:
A margem de erro(\(ME=\)±88ml) pode ser expressa:
\[ME = Z_B\frac{\sigma_X}{\sqrt{n_B}}\]Sendo \(Z_B\):
\[Z_B= \frac{\Big(\mu_X- \overline{X} \Big)}{\sigma_{\overline{X}}}=\frac{ME}{\sigma_X/\sqrt{n_B}}\\ Z_B=1.570171\]
Logo:
\[\mathbb{P}(|Z| \le Z_B)= \mathbb{P}(-Z_B \le Z \le Z_B)=\\ =\mathbb{P}(Z_B)- \mathbb{P}(-Z_B)= \mathbb{P}(Z_B)-(1-\mathbb{P}(Z_B))=\\ =2\mathbb{P}(Z_B)-1\\ \mathbb{P}(|Z| \le Z_B)=2 \times0.9418123 -1=0.8836246\]
sigma_X <- 350
n_B <- 39
sigma_Xbar_B <- sigma_X/sqrt(n_B)
ME <- 88
Z_B <-ME/(sigma_Xbar_B)
Z_B
## [1] 1.570171
2*pnorm(Z_B)-1
## [1] 0.8836246
2: não precisa, mas pode ser usado. Sem ele podemos derivar o resultado uma vez que nossa variável aleatória contínua média amostral(\(\overline{X}\)) depende de outras variáveis aleatórias contínuas, \(X_i\) tal que para qualquer \(i\)-ésimo da população que componha nossa amostra, ele tem distribuição normal. Logo, uma soma de v.a.c. de distribuição normal produz outra v.a.c. de distribuição normal.
O TLC é bastante forte e usado quando a distribuição da população original não é normal. Assim, para uma amostra de tamanho suficientemente grande, temos assintoticamente que a média amostral é uma variável aletória contínua de distribuição normal com parâmetro(\(\mu_X, \sigma_X/\sqrt{n}\)).
1: aumenta, pois como a probabilidade buscada depende do valor de Z(\(\mathbb{P}(|Z| \le Z_c)= 2\mathbb{P}(Z_c)-1\)), quanto maior ele for maior será a probabilidade. Logo se aumentamos o tamanho da amostra, consequentemente dimunuimos o denominador que por suas vez aumenta o valor de Z.
Como a expressão da margem de erro independe da média, temos que a resposta é igual ao item a:
\[ Z_E=Z_A \\ \mathbb{P}(|Z| \le Z_E)=0.685447 \]Como a expressão da margem de erro independe da média, temos que a resposta é igual ao item b:
\[ Z_F=Z_B \\ \mathbb{P}(|Z| \le Z_F)=0.8836246 \]3: permanece constante, pois como vimos indenpende da média populacional.
Temos a proporção amostral, tamanho da amostra e o grau de confiança:
\[ \hat{p}=0.57\:\;\;\;n=627\:\;\;\; \gamma = 99\% \]Sabemos que:
\[ \hat{p} \sim \mathcal{N}\Big(p, \sqrt{\frac{p(1-p)}{n}}\Big) \]Para o intervalo de confiança usamos a proporção amostral(\(\hat{p}\)) como uma estimativa para nosso parâmetro populacional(proporção da população, \(p\)).
\[ \alpha= 1 - \gamma \rightarrow \alpha/2 = \frac{1-\gamma}{2}\\ IC(p= \hat{p} ,\gamma) = \Big[\hat{p}- z^{\star}_{\alpha/2}\frac{s}{\sqrt{n}};\;\; \hat{p}+ z^{\star}_{\alpha/2}\frac{s}{\sqrt{n}}\Big] \\ \alpha= 1 - .99 \rightarrow \alpha/2 = 0.005\\ IC(p= \hat{p} , 0.99) = \Big[\hat{p}- z^{\star}_{0.005}\sqrt{\frac{p(1-p)}{n}};\;\; \hat{p}+ z^{\star}_{0.005}\sqrt{\frac{p(1-p)}{n}}\Big] \]Assim:
\[ p_{inf}= \hat{p}-z^{\star}_{0.005}\times \frac{s}{\sqrt{n}} \\ p_{inf}= \hat{p}-z^{\star}_{0.005}\times \sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\\ p_{inf}= 0.57-2.575829 \times \sqrt{\frac{0.57 \times(1-0.57)}{627}}\\ \therefore p_{inf}=0.5190722 \]Assim:
\[ p_{sup}= \hat{p}+z^{\star}_{0.005}\times \frac{s}{\sqrt{n}} \\ p_{sup}= \hat{p}+z^{\star}_{0.005}\times\sqrt{\frac{\hat{p}(1-\hat{p})}{n}}\\ p_{sup}= 0.57+2.575829 \times \sqrt{\frac{0.57 \times(1-0.57)}{627}}\\ \therefore p_{sup}=0.5952131 \]No R ficaria:
#dados do enunciado
p_hat <- 0.57
n <- 627
gama <- .99 #grau de confiança
p_d <-.52 #item d
#resolução
alpha <- 1 - gama
s <- sqrt(p_hat*(1-p_hat)) #desvio padrão amostral
z_star <- qnorm(alpha/2+gama)
ME <- z_star*s/sqrt(n)
p_inf <- p_hat - ME
p_sup <- p_hat + ME
p_inf #item a
## [1] 0.5190722
p_sup #item b
## [1] 0.6209278
ME
## [1] 0.05092781
ME*100 #item c em %
## [1] 5.092781
ifelse(p_d >= p_inf & p_d <= p_sup, 1, 0) #item d
## [1] 1
Algumas incosistências foram encontradas no gabarito oficial
Suponha que você esteja interessado em estimar a proporção de funcionários fumantes em uma empresa. Você coletou uma amostra aleatória de 100 funcionários, dentre os quais 26 fumam.
Para a nova margem de erro, o tamanho da amostra será: \[ n = \frac{z_{\alpha/2}^2\hat{p}(1-\hat{p})}{ME^2}\\ n = \Big\lceil\frac{1.644854^2 \times 0.26\times(1-0.26)}{(0.06)^2}\Big\rceil\\ \therefore n = 145 \]
gama <-.90 # grau de confiança
alpha <- 1- gama
phat <-26/100 # proporção amostral
ME <-0.06 # Margem de Erro
n <- qnorm(gama+alpha/2)^2*phat*(1-phat)/ME^2
ceiling(n)
## [1] 145
Neste item não temos uma amostra inicial que permita ser usada como estimativa para a proporção populacional, logo vamos usar uma estimativa conservadora(\(p_{\dagger}=1/2\)), assim: \[ n = \frac{z_{\alpha/2}^2p_{\dagger}(1-p_{\dagger})}{ME^2}\\ n = \Big\lceil\frac{1.644854^2 \times 0.5\times(1-0.5)}{(0.06)^2}\Big\rceil\\ \therefore n_{\dagger} = 188 \]
gama <-.90 # grau de confiança
alpha <- 1- gama
pcon <-0.5 # proporção amostral
ME <-0.06 # Margem de Erro
ncon <- qnorm(gama+alpha/2)^2*pcon*(1-pcon)/ME^2
ceiling(ncon) # n conservador
## [1] 188
Não conhecemos o desvio padrão populacional, logo usamos a distribuição t-student. Contudo, como o tamanho da amostra é grande, podemos aproximar pela distribuição normal: \[\bar{X} \sim \mathcal{N}\Big(\hat{x}=107, \frac{s}{\sqrt{n}}=\frac{20.64}{\sqrt{481}}\Big)\] \[IC(\mu, \gamma)= \Big[\hat{x} \pm \frac{s}{\sqrt{n}}\Big]\]
xhat <- 107
s <- 20.64
n <- 481
conf.level <- .99
list(
xhat-qnorm(conf.level+(1-conf.level)/2)*s/sqrt(n),
xhat+qnorm(conf.level+(1-conf.level)/2)*s/sqrt(n))
## [[1]]
## [1] 104.5759
##
## [[2]]
## [1] 109.4241
Para se adequar a padrões internacionais, o engenheiro de processo em uma indústria de papéis quer assegurar que a produção de papelão esteja sob controle, produzindo folhas de papelão com peso médio de 720 Dentre as opções listadas, qual a hipótese alternativa apropriada para indicar o processo de produção fora do controle? Responda 1, 2, 3 ou 4.