A ideia central deste tópico é construir estimativas significativas especificando um intervalo de valores em um intervalo real juntamente com a afirmação de quão confiante você está de que seu intervalo contém o parâmetro populacional.
Uma estimativa intervalar é um intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional. Assim, a estimativa intervalar consiste na fixação de dois valores (limites de confiança) tais que c seja a probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro.
Neste tópico vamos aprender como usar amostras estatísticas para fazer a estimativa do parâmetro populacional \(\mu\) quando
Caso I: o tamanho da amostra for de pelo menos 30 (amostras grandes),
Caso II: a população é normalmente distribuída e o desvio padrão \(\sigma\) é conhecido,
Caso III: a população é normalmente distribuída e o desvio padrão \(\sigma\) é desconhecido ou quando temos amostras pequenas.
Neste tópico vamos aprender como usar amostras estatísticas para fazer a estimativa do parâmetro populacional \(\mu\) quando o tamanho da amostra for de pelo menos 30 (amostras grandes) (Caso I) ou quando a população é normalmente distribuída e o desvio \(\sigma\) é conhecido (Caso II).
Lembre-se que em ambos os casos recaímos nas hipóteses do Teorema do Limite Central (TLC) e, portanto, a distribuição de amostragem das médias amostrais segue uma distribuição normal. Assim, o nível de confiança (c) é definido como a área sob a curva normal padrão (região central) entre os valores críticos \(-z_c\) e \(z_c\).
Fig. 1: Distribuição Normal Padrão
Dessa forma, o IC para a média populacional \(\mu\) é dado por \[IC(\mu; 1-\alpha): (\overline x - E; \overline x + E)\]
em que o erro máximo amostral E é calculado por \[E = z_c \frac{\sigma}{\sqrt n}\].
Obs.: Para amostras grandes, caso o desvio padrão populacional não seja conhecido, poderemos utilizar o desvio amostral \(s\).
Em uma amostra aleatória do número de erros de impressão em 50 livros publicados por uma editora, calculou-se \(\overline x = 12,4\). Construa um intervalo de confiança (IC) de 95% para a média do número de erros de impressão em todos os livros publicados. Assuma que o desvio padrão da amostra seja de aproximadamente 5,0.
– Passo 1: Calcular a média amostral
Neste caso já é dado no enunciado do problema.
– Passo 2: Encontrar o valor crítico \(z_c\) a partir da distribuição normal padrão
## [1] 1.959964
– Passo 3: Calcular o erro máximo amostral
## [1] 1.385904
– Passo 4: Calcular o IC
## [1] 11.0141
## [1] 13.7859
– Passo 5: Interpretar o IC
Com 95% de confiança, podemos afirmar que a média populacional do número de erros de impressão está entre 11.0141 e 13.7859.
Refaça o exemplo anterior considerando um nível de confiança de 99%.
Considere uma população que é normalmente distribuída da qual é extraída uma amostra aleatória \(X_1, X_2, X_3, ..., X_n\). Se \(\mu\) e \(\sigma\) são desconhecidos, então a v. a.
\[T = \frac{\overline x - \mu}{s / \sqrt n} \]
possui uma distribuiçao de probabilidades denominada t (de Student) com n-1 graus de liberdade.
Nesse caso, o IC para \(\mu\) é dado por
\[IC(\mu; 1-\alpha): (\overline x - E; \overline x + E)\]
em que o erro máximo amostral E é calculado por \[E = t_{(n-1; \alpha/2)} \times \frac{s}{\sqrt n}\].
São selecionadas aleatoriamente 16 cafeterias e medidas a temperatura do café vendido em cada uma delas. A média de temperatura da amostra é 74 °C com desvio padrão da amostra de 10°C. Encontre um intervalo de confiança de 95% para a temperatura média. Assuma que as temperaturas são normalmente distribuídas.
– Passo 1: Como a amostra é pequena, \(\sigma\) é desconhecido e a população é normalmente distribuída, vamos usar a distribuição t para resolver este exemplo. O valor crítico \(t_c\) é
## [1] 2.13145
– Passo 2: Calcular o erro máximo amostral
## [1] 5.328624
– Passo 3: Calcular o IC
## [1] 68.67138
## [1] 79.32862
– Passo 4: Interpretar o IC
Com 95% de confiança, podemos dizer que a média da temperatura está entre 68.6714 e 79.3286.
Refaça o exemplo anterior considerando um nível de confiança de 99%.
Resposta: (66.6332; 81.3668)
Suponha que uma amostra aleatória \(X\) de tamanho \(n\) seja retirada de uma população e que o número de sucessos seja ugual a \(x\). Nesse caso, uma estimativa pontual (\(\widehat{p}\)) para a proporção populacional \(p\) é dada por
\[\widehat{p} = \frac{x}{n}\]
Se forem satisfeitas as condições \(np \geq 10\) e \(nq \geq 10\) então \(X\) possui uma distribuição aproximadamente normal e um intervalo de confiança para a proporção populacional \(p\) é dado por
\[IC(p; 1-\alpha): (\widehat{p} - E; \widehat{p} + E)\]
em que o erro máximo amostral E é calculado por
\[E = z_{\alpha/2} \times \sqrt {\frac{\widehat{p} \widehat{q}}{n}}\].
Em uma pesquisa com 4.431 brasileiros adultos, descobriu-se que 2.938 estavam acima do peso. Usando esta estatística amostral, construa um intevalo de confiança de \(95\%\) para a proporção populacional de brasileiros adultos que estão acima do peso.
– Passo 1: Calcular a proporção amostral
## [1] 0.6630557
– Passo 2: Encontrar o valor crítico \(z_{\alpha/2}\) a partir da distribuição normal padrão
## [1] 1.959964
– Passo 3: Calcular o erro máximo da amostra
## [1] 0.01391718
– Passo 4: Calcular o IC
## [1] 0.6491386
## [1] 0.6769729
– Passo 5: Interpretar o IC
Com 95% de confiança, podemos afirmar que a proporção populacional de brasileiros adultos que estão acima do peso está entre 0.6491 e 0.677.
Refaça o exemplo anterior considerando um nível de confiança de 99%.
Teorema: Considere uma população que é normalmente distribuída com parâmetros \(\mu\) e \(\sigma\) e que seja extraída uma amostra aleatória \(X_1, X_2, X_3, ..., X_n\). A v. a.
\[\chi ^2 = \frac{(n-1)s^2}{\sigma ^2} \] possui distribuição de probabilidade qui-quadrado para amostras de qualquer tamanho n > 1.
Nesse caso, o IC para a variância \(\sigma ^2\) de uma população normal é dado por
\[IC(\sigma ^2; 1-\alpha): \left( \frac{(n-1)s^2}{\chi ^2_{sup}}; \frac{(n-1)s^2}{\chi ^2_{inf}} \right ) \]
Enquanto que o IC para o desvio padrão \(\sigma\) é dado por
\[IC(\sigma; 1-\alpha): \left( \sqrt \frac{(n-1)s^2}{\chi ^2_{sup}}; \sqrt \frac{(n-1)s^2}{\chi ^2_{inf}} \right ) \]
São anotados os pesos de 30 amostras selecionadas aleatoriamente de um medicamento. O desvio padrão da amostra é 1,20 miligramas. Supondo que os pesos são normalmente distribuídos, construa intervalos de confiança de 99% para a variância e para o desvio padrão da população.
– Passo 1: Encontrar os valores críticos de \(\chi ^2_{sup}\) e \(\chi ^2_{inf}\)
## [1] 13.12115
## [1] 52.33562
– Passo 2: Calcular os limites do IC
## [1] 0.797927
## [1] 3.182648
– Passo 3: Interpretar o IC
Com 99% de confiança podemos afirmar que a variância populacional dos pesos do medicamento está entre 0.7979 e 3.1826 miligramas e que o desvio padrão está entre 0.8933 e 1.784 miligramas.
Refaça o exemplo anterior considerando um nível de confiança de 95%.
Em construção…