ME414 - Estatística para Experimentalistas

Intervalo de Confiança

Relembrando…

Vimos na aula passada como construir um intervalo de confiança a média populacional \(\mu\).

Um intervalo de \(100(1-\alpha)\%\) de confiança para \(\mu\) é dado por: \[IC(\mu, 1-\alpha) = \left[ \bar{x} - z_{\alpha/2} \frac{\sigma}{\sqrt{n}},\bar{x} +z_{\alpha/2}\frac{\sigma}{\sqrt{n}}\right]\]

Um intervalo de confiança fornece um conjunto de valores plausíveis para o parâmetro de interesse.

Na aula de hoje, o parâmetro de interesse é a proporção populacional \(p\). Ou seja, a proporção da população que apresenta uma certa característca.

Relembrando…

Parâmetro populacional de interesse: \(\theta\).

Um intervalo de confiança (IC) para \(\theta\) é sempre da forma:

\[ \mbox{estimativa} \pm \mbox{margem de erro}\]

\[\hat \theta \pm \mbox{margem de erro}\]

Sendo:

\(\hat \theta\) uma estimativa pontual de \(\theta\)

margem de erro: quantidade que depende da distribuição amostral do estimador pontual de \(\theta\), do grau de confiança pré-estabelecido e do erro-padrão da estimativa

Intervalo de Confiança para Proporção \(p\)

Considere \(X\) a variável aleatória que representa a presença (ou não) de determinada característica na população e a probabilidade de um determinado elemento da população ter essa característica é \(p\). \[X \sim Bernoulli(p)\]

Sabemos que \(E(X)=p\) e \(Var(X)=p(1-p)\).

Coletamos uma amostra dessa população, \(X_1, X_2, \ldots, X_n\), tal que:

\[X_i = \begin{cases} 1, & \mbox{ se uma característica de interesse está presente} \\ 0, & \mbox{ caso contrário} \end{cases} \] para \(i=1,\ldots,n\).

Qual seria uma estimativa da proporção de pessoas na amostra com a característica de interesse?

Intervalo de Confiança para Proporção \(p\)

Temos uma amostra aleatória \(X_1, X_2, \ldots, X_n\), tal que: \[X_i \sim Bernoulli(p), \qquad i=1,\ldots,n.\]

A proporção de pessoas na amostra com a característica de interesse é: \[\hat p = \bar X_n = \frac{1}{n} \sum_{i=1}^n X_i.\]

Portanto, \(\hat p\) é uma estimativa pontual de \(p\).

Sabemos de resultados anteriores para \(\bar X_n\) que: \[E(\hat p) = p \qquad \mbox{e} \qquad Var(\hat p) = \frac{p(1-p)}{n}\]

Intervalo de Confiança para Proporção \(p\)

Pelo Teorema do Limite Central: \[\hat p \sim N \left( p, \frac{p(1-p)}{n} \right) \qquad \Longleftrightarrow \qquad Z = \frac{\hat p - p}{\sqrt{\frac{p(1-p)}{n}}} \sim N(0,1)\]

Logo, \[ \begin{aligned} 1-\alpha &= P(-z_{\alpha/2} \leq Z \leq z_{\alpha/2}) \\ &= P\left(-z_{\alpha/2} < \frac{\hat p - p}{\sqrt{p(1-p)/n}} < z_{\alpha/2} \right) \\ &= P\left(\hat p - z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}} < p < \hat p + z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}} \right) \end{aligned} \]

Intervalo de Confiança para Proporção \(p\)

Portanto, um intervalo de \(100(1-\alpha)\%\) de confiança para \(p\) é dado por: \[IC(p, 1-\alpha) = \left[ \hat p - z_{\alpha/2} \sqrt{\frac{p(1-p)}{n}}, \hat p + z_{\alpha/2}\sqrt{\frac{p(1-p)}{n}}\right]\]

Note que \(p\) é desconhecido, ou seja, a variância \(p(1-p)\) é desconhecida e o IC acima não pode ser calculado diretamente.

Duas alternativas:

Estimar a variância usando \(\hat p(1- \hat p)\). E então, um IC para \(p\) seria: \[IC(p, 1-\alpha) = \left[ \hat p - z_{\alpha/2} \sqrt{\frac{\hat p(1- \hat p)}{n}}, \hat p + z_{\alpha/2}\sqrt{\frac{\hat p(1- \hat p)}{n}}\right]\]

Intervalo de Confiança para Proporção p

Método conservador: \(p\) é desconhecido, mas veja o comportamento de \(p(1-p)\) no seguinte gráfico:

\(p(1-p)\) atinge o valor máximo quando \(p=1/2\), ou seja, \(p(1-p) \leq \frac{1}{4}\).

Intervalo de Confiança para Proporção \(p\)

Vimos que \(p(1-p)\leq \frac{1}{4}\), então erro-padrão da estimativa é maximizado por: \[\sqrt{\frac{p(1-p)}{n}}\leq \sqrt{\frac{1}{4n}} \quad \Longleftrightarrow \quad -\sqrt{\frac{p(1-p)}{n}}\geq -\sqrt{\frac{1}{4n}}\]

Portanto, \[1-\alpha \leq P\left(\hat p - z_{\alpha/2}\sqrt{\frac{1}{4n}} \leq p \leq \hat p + z_{\alpha/2} \sqrt{\frac{1}{4n}}\right).\]

Então, um IC de \(100(1-\alpha)\%\) conservador para \(p\) é dado por: \[IC(p, 1-\alpha) = \left[\hat p - z_{\alpha/2} \sqrt{\frac{1}{4n}}, \hat p + z_{\alpha/2} \sqrt{\frac{1}{4n}} \right]\]

Relembrando: Como encontrar \(z_{\alpha/2}\)

\[P(|Z|\leq z_{\alpha/2})=P(-z_{\alpha/2}\leq Z \leq z_{\alpha/2})=1-\alpha\]

Relembrando

Encontrar \(z_{0.05}\) tal que \(0.90 = P\left(-z_{0.05}\leq Z\leq z_{0.05}\right)\).

Pela tabela, \(z_{0.05} = 1.64\)

Relembrando: Como encontrar \(z_{\alpha/2}\)

\[P(|Z|\leq z_{\alpha/2})=P(-z_{\alpha/2}\leq Z \leq z_{\alpha/2})=1-\alpha\]

Exemplo: Pesquisa de Mercado

Numa pesquisa de mercado, \(n=400\) pessoas foram entrevistadas (usando amostra aleatória) sobre preferência do produto da marca A, e \(60\%\) destas pessoas preferiam a marca A.

Encontre um \(IC\) de \(95\%\) para a proporção de pessoas que preferem a marca A.

Pelo resultado da pesquisa, \(\hat p =0.6\).

Usando o método conservador, um \(IC\) de \(95\%\) é dado por: \[\begin{aligned} IC(p, 0.95) &= \left[0.6 - 1.96\frac{1}{\sqrt{1600}}, 0.6 + 1.96\frac{1}{\sqrt{1600}}\right] \\ &=\left[0.551, 0.649\right] \end{aligned} \]

Exemplo: Pesquisa de Mercado

Suponha que em \(n=400\) entrevistados, \(80\) pessoas responderam que preferem a marca A.

Vamos obter um intervalo de confiança para \(p\), com grau de confiança de \(90\%\):

\(\hat p =\frac{80}{400}=0.2\)

\(1-\alpha=0.90\). Então \(\alpha/2=0.05\) e \(z_{\alpha/2}=z_{0.05}=1.64\)

Usando o método conservador, um \(IC\) de \(90\%\) é dado por: \[ \begin{aligned} IC_1(p, 0.90) &= \left[0.2 - 1.64\frac{1}{\sqrt{1600}}, 0.2 + 1.64\frac{1}{\sqrt{1600}}\right] \\ &=[0.159, 0.241] \end{aligned} \]

Exemplo: Pesquisa de Mercado

E se usarmos a estimativa \(\hat p\) para também estimar o erro-padrão \(\sqrt{\frac{p(1-p)}{n}}\)?

Por esse método, temos o seguinte \(IC\) de \(100(1-\alpha)\%\): \[IC(p, 1-\alpha)= \left[\hat p - z_{\alpha/2} \sqrt{\frac{\hat p (1-\hat p)}{n}}, \hat p + z_{\alpha/2}\sqrt{\frac{\hat p (1-\hat p )}{n}}\right]\]

Votando no exemplo anterior: \[ \begin{aligned} IC_2(p, 0.90) &= \left[0.2 - 1.64\sqrt{\frac{(0.2)(0.8)}{400}}, 0.2 + 1.64 \sqrt{\frac{(0.2)(0.8)}{400}} \right] \\ &=[0.167, 0.233] \end{aligned} \]

Exemplo: Pesquisa de Mercado

O intervalo que utiliza \(\hat p\) também para estimar o erro-padrão tem menor amplitude do que o intervalo que utiliza o fato de \(p(1-p) \leq \frac{1}{4}\). Por isso esse último é chamado de conservador.

Veja as amplitudes dos \(IC\)'s de \(90\%\) que encontramos anteriormente:

\(IC_1(p, 0.90) = [0.159, 0.241] \quad \Rightarrow \quad A_1=0.241-0.159=0.082\)
\(IC_2(p, 0.90) = [0.167, 0.233] \quad \Rightarrow \quad A_2=0.233-0.167=0.066\)

Intervalo de Confiança para p

Em resumo, os intervalos de \(100 (1-\alpha)\%\) de confiança para \(p\) podem então ser de duas formas:

Usando \(\hat p\) para estimar o erro-padrão \[IC(p, 1-\alpha)=\left[\hat p -z_{\alpha/2}\sqrt{\frac{\hat p (1-\hat p )}{n}}, \hat p +z_{\alpha/2}\sqrt{\frac{\hat p (1-\hat p )}{n}}\right]\]
Método Conservador \[IC(p, 1-\alpha)=\left[\hat p -z_{\alpha/2}\sqrt{\frac{1}{4n}}, \hat p +z_{\alpha/2}\sqrt{\frac{1}{4n}}\right]\]

Veja que nos dois casos, os \(IC\)'s são da forma \(\hat p \pm \mbox{margem de erro}\)

Exemplo: Universitários Não Fumantes

De uma amostra aleatória de 100 alunos de uma universidade, 82 afirmaram ser não fumantes.

Construa um intervalo de confiança de 99% para a proporção de não fumantes entre todos os alunos da universidade.

\(\hat p =0.82, \quad n=100, \quad \alpha=0.01 \quad\) e \(\quad z_{0.005}=2.58\)

\[ \begin{aligned} IC_1(p, 0.99) &= \left[\hat p - z_{0.005}\sqrt{\frac{\hat p (1-\hat p)}{n}}, \hat p + z_{0.005}\sqrt{\frac{\hat p (1-\hat p )}{n}}\right] \\ &= \left[ 0.82 -2.58\sqrt{\frac{(0.82)(0.18)}{100}}, 0.82 + 2.58\sqrt{\frac{(0.82)(0.18)}{100}}\right] \\ &= [0.72, 0.92] \end{aligned} \]

Exemplo: Universitários Não Fumantes

Podemos também calcular o \(IC\) de 99% pelo método conversador: \[ \begin{aligned} IC_2(p, 0.99) &= \left[\hat p - z_{\alpha/2}\sqrt{\frac{1}{4n}}; \hat p + z_{\alpha/2}\sqrt{\frac{1}{4n}}\right] \\ &= \left[0.82 - 2.58\sqrt{\frac{1}{400}}; 0.82 + 2.58\sqrt{\frac{1}{400}}\right] \\ &= [0.69; 0.95] \end{aligned} \]

Interpretação: Com um grau de confiança de 99%, estimamos que a proporção de não fumantes entre os alunos está entre 72% e 92% (resultado do slide anterior).

E pelo método conservador, com um grau de confiança de 99%, estimamos que a proporção de não fumantes entre os alunos está entre 69% e 95%.

Exemplo: A esposa deve sacrificar a carreira?

Pesquisa do GSS. Você concorda ou não com a seguinte frase: "é mais importante para uma esposa ajudar a carreira do marido do que ter uma carreira própria."

A última vez que esta pergunta foi incluída no GSS foi em 1998 onde 1823 pessoas responderam e 19% concordaram.

Calcule e interprete o \(IC\) de 95% para a proporção na população que concorda com a frase.

Encontre e interprete a margem de erro do \(IC\) de 95%.

Exemplo: A esposa deve sacrificar a carreira?

Calcule e interprete o \(IC\) de 95% para a proporção na população que concorda com a frase.

\(\hat p=0.19, \quad n=1823, \quad \alpha=0.05 \quad\) e \(\quad z_{0.025}=1.96\)

Então, \[ \begin{aligned} IC(p, 0.95) &= \left[\hat p -1.96 \sqrt{\frac{\hat p (1-\hat p )}{n}} , \hat p + 1.96 \sqrt{\frac{\hat p (1-\hat p )}{n}}\right] \\ &= \left[0.19-1.96 \sqrt{\frac{0.19(1-0.19)}{1823}}, 0.19+1.96 \sqrt{\frac{0.19(1-0.19)}{1823}}\right] \\ &= [0.17, 0.21] \end{aligned} \]

Interpretação do Intervalo de Confiança

Interpretação: Se várias amostras forem retiradas da população e calcularmos um \(IC\) de 95% para cada amostra, cerca de 95% desses intervalos irão conter a verdadeira proporção na população, \(p\).

INCORRETO: Dizer que "a probabilidade de que \(p\) esteja dentro do intervalo é 95%"

Por que incorreto? \(p\) é uma constante, não é variável aleatória. Ou \(p\) está no intervalo ou não está. O intervalo é que é aleatório.

Interpretação do Intervalo de Confiança

Exemplo (continuação)

Um \(IC\) de 95% para \(p\) é: \([0.17, 0.21]\)

A margem de erro (metade do comprimento do IC) é:

\[ME=1.96\sqrt{\frac{0.19(1-0.19)}{1823}}=0.02\]

\[P(|\hat p -p|<0.02)=0.95\]

Interpretação: Com probabilidade 0.95, o erro ao usar a proporção amostral para estimar a proporção populacional não excede 0.02.

Curiosidade: em 1977 a pergunta foi feita pela primeira vez no GSS. \(\hat p =0.57\) e \(IC\) de 95% foi \([0.55, 0.59]\).

Você pagaria mais para um produto em favor ao meio-ambiente?

Exemplo: Na teoria, muita gente se considera "eco-friendly". Mas e na prática?

Em 2000, GSS perguntou: "Você estaria disposto a pagar mais pela gasolina para proteger o ambiente?"

Entre \(n=1154\) participantes, 518 responderam que sim.

Encontre IC 95% para a proporção da população que concorda.
Interprete.

Exemplo (continuação)

Estimativa: \(\hat p =518/1154=0.45\)

Desvio-padrão da estimativa (erro-padrão): \(\sqrt{\frac{0.45(1-0.45)}{1154}}=0.015\)

\[\begin{aligned} IC(p, 0.95) &= \left[0.45-1.96 \sqrt{\frac{(0.45)(0.55)}{1154}}, 0.45+1.96 \sqrt{\frac{(0.45)(0.55)}{1154}}\right] \\ &= \left[0.45-1.96\times0.015, 0.45+1.96\times0.015\right] \\ &= [0.42, 0.48] \end{aligned} \]

Interpretação: Com grau de confiança de 95%, estimamos que a proporção populacional que concorda em pagar mais está entre 0.42 e 0.48. A estimativa pontual, 0.45, tem margem de erro de 3%.

Exemplo (continuação)

E se estivéssemos interessados na proporção que não pagaria mais?

Estimativa: \(\hat p =1-518/1154=0.55\)

Desvio-padrão da estimativa (erro-padrão): \(\sqrt{\frac{0.55(1-0.55)}{1184}}=0.015\)

\[\begin{aligned} IC(p, 0.95) &= \left[0.55-1.96 \sqrt{\frac{(0.55)(0.45)}{1154}}, 0.55+1.96 \sqrt{\frac{(0.55)(0.45)}{1154}}\right] \\ &= \left[0.55-1.96(0.015), 0.55+1.96(0.015)\right] \\ &= [0.52, 0.58] \end{aligned} \]

Interpretação: Com grau de confiança de 95%, estimamos que a proporção populacional que não pagaria mais está entre 0.52 e 0.58. A estimativa pontual, 0.55, tem margem de erro de 3%.

Exemplo: Se a esposa quer ter um filho, mas o marido não, é justo que ele se recuse a ter um filho?

GSS: 598 responderam, 366 acham justo. Encontre um \(IC\) de 99%.

Estimativa: \(\hat p =366/598=0.61\)

Desvio-padrão da estimativa (erro-padrão): \(\sqrt{\frac{\hat p (1-\hat p )}{n}}=0.02\)

\[\begin{aligned} IC(p, 0.99) &= \left[0.61-2.58(0.02), 0.55 + 2.58(0.02)\right]= \left[0.56, 0.66\right] \end{aligned} \]

Com grau de confiança igual a 99%, estimamos que a proporção populacional que concorda está entre 0.56 e 0.66. A estimativa pontual, 0.61, tem margem de erro de 5%.

Exemplo (continuação)

E o \(IC\) de 95%?

\[\begin{aligned} IC(p, 0.95) &= \left[0.61 - 1.96(0.02), 0.55 + 1.96 (0.02)\right] \\ &= \left[0.57, 0.65\right] \end{aligned} \]

Com grau de confiança igual a 95%, estimamos que a proporção populacional que concorda está entre 0.57 e 0.65. A estimativa pontual, 0.61, tem margem de erro de 4%.

Com maior grau de confiança, temos uma margem de erro um pouco maior.

Tamanho da amostra para estimar \(p\)

Exemplo: Datafolha

A Datafolha quer fazer uma pesquisa de boca-de-urna para predizer o resultado de uma eleição com apenas dois candidatos.

Seleciona então uma a.a. de eleitores e pergunta em quem cada um votou. Para esta pesquisa, o Datafolha quer uma margem de erro de 4%. Qual o tamanho de amostra necessário?

O grau de confiança é 95% e \(IC(p, 0.95) = \hat p \pm 1.96\times EP(\hat p )\)

Erro-padrão de \(\hat p\) é \(EP(\hat p) = \sqrt{p(1-p)/n}\)

Margem de erro: \(1.96 \times EP(\hat p )=1.96\sqrt{p(1-p)/n}\)

Margem de erro desejada é 0.04. Então, o tamanho amostral necessário \(n\) é:

\[1.96\sqrt{\frac{p(1-p)}{n}}=0.04 \qquad \Rightarrow \qquad n=\frac{1.96^2p(1-p)}{0.04^2}\]

Tamanho da Amostra

Problema: o cálculo do tamanho da amostra depende de \(p\), que não conhecemos.

Assim como para encontrar os \(IC\)'s, podemos usar o método conservador ou então usar informações obtidas em pesquisas anteriores (caso existam).

Método Conservador:

Lembre que \(Var(\hat p) = p(1-p)/n\) e já vimos que \(p(1-p)\leq 1/4\).

Então, \[n=\frac{1.96^2 (1/4)}{0.04^2}=600\]

Exemplo

Outra alternativa

O Datafolha fez uma pesquisa na semana passada e o resultado foi 58% votariam no candidato \(A\) e 42% no \(B\).

Podemos usar então estas estimativas: \[n=\frac{1.96^2\hat p (1-\hat p )}{0.04^2}=\frac{1.96^2(0.58)(0.42)}{0.04^2}=585\]

Uma a.a. de tamanho 585 deverá resultar numa margem de erro de 4% para um IC de 95% para a proporção da população que vota no candidato \(A\).

Exemplo: Campeonato Brasileiro

Uma firma de propaganda está interessada em estimar a proporção de domicílios que estão assistindo a final do campeonato brasileiro de futebol. Para isso, está planejando ligar para os domicílios selecionados aleatoriamente a partir de uma lista. Qual o tamanho da amostra necessário se a firma quer 90% de confiança de que a estimativa obtida tenha uma margem de erro igual a 0.02?

Exemplo: Campeonato Brasileiro

\[IC(p, 1-\alpha) = \left[ \hat p -z_{\alpha/2}\sqrt{\frac{1}{4n}}, \hat p +z_{\alpha/2}\sqrt{\frac{1}{4n}}\right]\]

Margem de erro 0.02:\(\quad z_{\alpha/2}\sqrt{\frac{1}{4n}}=0.02\)

Como eles querem 90% de confiança, \(\alpha=0.10\) e \(z_{0.05}=1.645\)

\[1.645\sqrt{1/4n}=0.02 \quad \Longleftrightarrow \quad 1/4n=(0.02/1.645)^2 \quad \Rightarrow \quad n=1691.3\]

Tamanho amostral: 1692.

Em geral, para uma margem de erro \(m\): \[n=\left(\frac{z_{\alpha/2}}{2m}\right)^2\]

Exemplo: Proporção de Estudantes Mulheres

Suponha que \(p=30\%\) dos estudantes de uma escola sejam mulheres.

Coletamos uma amostra aleatória simples de \(n=10\) estudantes e calculamos a proporção de mulheres na amostra, ou seja, \(\hat p\).

Qual a probabilidade de que \(\hat p\) difira de \(p\) em menos de \(0.01\)? E se \(n=50\)?

Adaptado de: Morettin & Bussab, Estatística Básica \(5^a\) edição, pág 276.

Solução: Temos que a probabilidade que desejamos encontrar é dada por

\[P \left( |\hat p - p| < 0.01 \right) = P \left( -0.01 < \hat p - p < 0.01 \right )\]

onde \(p\) é o valor verdadeiro da proporção de mulheres, e \(\hat p\) a proporção observada na amostra.

Exemplo - Solução

Seja \(X_i\) a v.a. indicando se a pessoa \(i\) é mulher ou não. Temos que \[X_i\sim\mbox{Bernoulli}(p),\] com \(p=0.3\).

Então sabemos que \(\mathbb E(X_i)=p\) e \(Var(X_i)=p(1-p)\).

Coletamos uma amostra de tamanho \(n\): \(X_1,\ldots,X_n\). Calculamos a proporção de mulheres na amostra: \[\hat p = \bar{X}_n=\frac{S_n}{n}=\frac{X_1+\ldots+X_n}{n}\]

Exemplo - Solução

Pelo TCL, quando \(n\) é grande: \(\hat p \sim N \left( p, p(1-p)/n \right)\)

Como \(p=0.3\) e \(n=10\), temos que: \(Var\left( \hat p \right) = \frac{(0.3)(0.7)}{10} = 0.021\)

\[ \begin{aligned} P \left( |\hat p -p| < 0.01 \right) &= P \left( -0.01 < \hat p - p < 0.01 \right ) \\ &= P \left( -\frac{0.01}{\sqrt{Var(\hat p )}} < \frac{\hat p - p}{Var(\hat p)} < \frac{0.01}{Var(\hat p)} \right ) \\ &= P \left( \frac{-0.01}{\sqrt{0.021}} < Z < \frac{0.01}{\sqrt{0.021}} \right) \\ &= P(-0.07 < Z < 0.07) = 0.056 \end{aligned} \]

Mas \(n=10\) é grande? Podemos comparar essa probabilidade com o resultado exato.

Exemplo - Solução

Não sabemos a distribuição exata de \(\hat p\), mas \[P(\hat p = \gamma) = P\left(\frac{1}{n}\sum_{i=1}^nX_i = \gamma \right) = P\left( \sum_{i=1}^n X_i = n \gamma \right) = P(S_n = n \gamma),\] onde \(X_i\) são v.a. independentes e identicamente distribuidas Bernoulli\((0.3)\).

Portanto, \(S_n = \sum_{i=1}^n X_i \sim Bin(10,0.3)\).

O evento \(\{|\hat p -p| < 0.01 \}\) é igual ao evento \(\{|\sum X_i - 10 (0.3)| < 0.1 \}\).

Como \(\sum X_i\) assume somente valores inteiros, temos que \[\left\{ \left |\sum_{i=1}^{10} X_i-10 (0.3) \right| < 0.1 \right \} = \left \{ \sum_{i=1}^{10} X_i - 3 =0 \right \} = \left \{ \sum_{i=1}^{10} X_i = 3 \right \}.\]

Exemplo - Solução

Portanto, \[P \left( \sum_{i=1}^{10} X_i = 3 \right) = {\binom{10}{3}}(0.3)^3 (0.7)^7 = 0.267.\]

Temos uma probabilidade que é 5 vezes maior que a aproximação.

Exemplo - Solução

Tome \(n=50\), agora. Podemos modificar rapidamente as contas da aproximação normal. A variância agora é \(\frac{p(1-p)}{n}=0.0042\), e portanto: > \[P \left( \frac{-0.01}{\sqrt{0.0042}} < Z < \frac{0.01}{\sqrt{0.0042}} \right) = P(-0.154 < Z < 0.154) = 0.12239\]

A probabilidade exata agora é dada pelo evento \(\sum_{i=1}^{50} X_i = 15\).

\[P \left( \sum_{i=1}^{50} X_i = 15 \right) = {\binom{50}{15}}(0.3)^{15} (0.7)^{50-15} = 0.12237\]

A diferença agora é muito menor. À medida que \(n \rightarrow \infty\) ela tende a 0.

É preciso contudo ter em mente que a aproximação só é válida para grandes tamanhos de amostra.

Intervalo de Confiança para Proporção

Exercício

Suponha que estejamos interessados em estimar a porcentagem de consumidores de um certo produto. Se a amostra de tamanho 300 forneceu 100 indivíduos que consomem o dado produto, determine:

Um intervalo de confiança de \(95\%\) para \(p\). Interprete o resultado.
O tamanho da amostra para que o erro da estimativa não exceda 0.02 unidades com probabilidade de \(95\%\).

Fonte: Morettin & Bussab, Estatística Básica \(5^a\) edição, pág 309.

Leituras

Ross: capítulo 8.
OpenIntro: seção 4.2.
Magalhães: seção 7.4.

Slides produzidos pelos professores:

Samara Kiihl
Tatiana Benaglia
Benilton Carvalho