1 Introdução

A ideia central deste tópico é construir estimativas significativas especificando um intervalo de valores em um intervalo real juntamente com a afirmação de quão confiante você está de que seu intervalo contém o parâmetro populacional.

1.1 - Conceitos básicos

Uma estimativa intervalar é um intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional. Assim, a estimativa intervalar consiste na fixação de dois valores (limites de confiança) tais que c seja a probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro.

  • Definição: O nível de confiança c é a probabilidade de que o intervalo estimado contenha o verdadeiro valor do parâmetro populacional. Portanto, (1 – c) nos dá a medida da incerteza desta inferência (nível de significância).

2 Intervalo de Confiança (IC) para a média

Neste tópico vamos aprender como usar amostras estatísticas para fazer a estimativa do parâmetro populacional \(\mu\) quando

2.1 Casos I e II

Neste tópico vamos aprender como usar amostras estatísticas para fazer a estimativa do parâmetro populacional \(\mu\) quando o tamanho da amostra for de pelo menos 30 (amostras grandes) (Caso I) ou quando a população é normalmente distribuída e o desvio \(\sigma\) é conhecido (Caso II).
Lembre-se que em ambos os casos recaímos nas hipóteses do Teorema do Limite Central (TLC) e, portanto, a distribuição de amostragem das médias amostrais segue uma distribuição normal. Assim, o nível de confiança (c) é definido como a área sob a curva normal padrão (região central) entre os valores críticos \(-z_c\) e \(z_c\).

Fig. 1: Distribuição Normal Padrão

Fig. 1: Distribuição Normal Padrão

Dessa forma, o IC para a média populacional \(\mu\) é dado por \[IC(\mu; 1-\alpha): (\overline x - E; \overline x + E)\]

em que o erro máximo amostral E é calculado por \[E = z_c \frac{\sigma}{\sqrt n}\].

Obs.: Para amostras grandes, caso o desvio padrão populacional não seja conhecido, poderemos utilizar o desvio amostral \(s\).

2.1.1 Exemplo

Em uma amostra aleatória do número de erros de impressão em 50 livros publicados por uma editora, calculou-se \(\overline x = 12,4\). Construa um intervalo de confiança (IC) de 95% para a média do número de erros de impressão em todos os livros publicados. Assuma que o desvio padrão da amostra seja de aproximadamente 5,0.

Passo 1: Calcular a média amostral

Neste caso já é dado no enunciado do problema.

Passo 2: Encontrar o valor crítico \(z_c\) a partir da distribuição normal padrão

## [1] 1.959964

Passo 3: Calcular o erro máximo amostral

## [1] 1.385904

Passo 4: Calcular o IC

## [1] 11.0141
## [1] 13.7859

Passo 5: Interpretar o IC

Com 95% de confiança, podemos afirmar que a média populacional do número de erros de impressão está entre 11.0141 e 13.7859.

2.1.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 99%.

2.2 Caso III

Considere uma população que é normalmente distribuída da qual é extraída uma amostra aleatória \(X_1, X_2, X_3, ..., X_n\). Se \(\mu\) e \(\sigma\) são desconhecidos, então a v. a.

\[T = \frac{\overline x - \mu}{s / \sqrt n} \]

possui uma distribuiçao de probabilidades denominada t (de Student) com n-1 graus de liberdade.

Nesse caso, o IC para \(\mu\) é dado por

\[IC(\mu; 1-\alpha): (\overline x - E; \overline x + E)\]

em que o erro máximo amostral E é calculado por \[E = t_{(n-1; \alpha/2)} \times \frac{s}{\sqrt n}\].

2.2.1 Exemplo

São selecionadas aleatoriamente 16 cafeterias e medidas a temperatura do café vendido em cada uma delas. A média de temperatura da amostra é 74 °C com desvio padrão da amostra de 10°C. Encontre um intervalo de confiança de 95% para a temperatura média. Assuma que as temperaturas são normalmente distribuídas.

Passo 1: Como a amostra é pequena, \(\sigma\) é desconhecido e a população é normalmente distribuída, vamos usar a distribuição t para resolver este exemplo. O valor crítico \(t_c\) é

## [1] 2.13145

Passo 2: Calcular o erro máximo amostral

## [1] 5.328624

Passo 3: Calcular o IC

## [1] 68.67138
## [1] 79.32862

Passo 4: Interpretar o IC

Com 95% de confiança, podemos dizer que a média da temperatura está entre 68.6714 e 79.3286.

2.2.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 99%.

Resposta: (66.6332; 81.3668)

3 Intervalo de Confiança (IC) para a proporção

Suponha que uma amostra aleatória \(X\) de tamanho \(n\) seja retirada de uma população e que o número de sucessos seja ugual a \(x\). Nesse caso, uma estimativa pontual (\(\widehat{p}\)) para a proporção populacional \(p\) é dada por

\[\widehat{p} = \frac{x}{n}\]

Se forem satisfeitas as condições \(np \geq 10\) e \(nq \geq 10\) então \(X\) possui uma distribuição aproximadamente normal e um intervalo de confiança para a proporção populacional \(p\) é dado por

\[IC(p; 1-\alpha): (\widehat{p} - E; \widehat{p} + E)\]

em que o erro máximo amostral E é calculado por

\[E = z_{\alpha/2} \times \sqrt {\frac{\widehat{p} \widehat{q}}{n}}\].

3.0.1 Exemplo

Em uma pesquisa com 4.431 brasileiros adultos, descobriu-se que 2.938 estavam acima do peso. Usando esta estatística amostral, construa um intevalo de confiança de \(95\%\) para a proporção populacional de brasileiros adultos que estão acima do peso.

Passo 1: Calcular a proporção amostral

## [1] 0.6630557

Passo 2: Encontrar o valor crítico \(z_{\alpha/2}\) a partir da distribuição normal padrão

## [1] 1.959964

Passo 3: Calcular o erro máximo da amostra

## [1] 0.01391718

Passo 4: Calcular o IC

## [1] 0.6491386
## [1] 0.6769729

Passo 5: Interpretar o IC

Com 95% de confiança, podemos afirmar que a proporção populacional de brasileiros adultos que estão acima do peso está entre 0.6491 e 0.677.

3.0.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 99%.

4 Intervalo de Confiança (IC) para a variância e desvio padrão

Teorema: Considere uma população que é normalmente distribuída com parâmetros \(\mu\) e \(\sigma\) e que seja extraída uma amostra aleatória \(X_1, X_2, X_3, ..., X_n\). A v. a.

\[\chi ^2 = \frac{(n-1)s^2}{\sigma ^2} \] possui distribuição de probabilidade qui-quadrado para amostras de qualquer tamanho n > 1.

Nesse caso, o IC para a variância \(\sigma ^2\) de uma população normal é dado por

\[IC(\sigma ^2; 1-\alpha): \left( \frac{(n-1)s^2}{\chi ^2_{sup}}; \frac{(n-1)s^2}{\chi ^2_{inf}} \right ) \]

Enquanto que o IC para o desvio padrão \(\sigma\) é dado por

\[IC(\sigma; 1-\alpha): \left( \sqrt \frac{(n-1)s^2}{\chi ^2_{sup}}; \sqrt \frac{(n-1)s^2}{\chi ^2_{inf}} \right ) \]

4.0.1 Exemplo

São anotados os pesos de 30 amostras selecionadas aleatoriamente de um medicamento. O desvio padrão da amostra é 1,20 miligramas. Supondo que os pesos são normalmente distribuídos, construa intervalos de confiança de 99% para a variância e para o desvio padrão da população.

Passo 1: Encontrar os valores críticos de \(\chi ^2_{sup}\) e \(\chi ^2_{inf}\)

## [1] 13.12115
## [1] 52.33562

Passo 2: Calcular os limites do IC

## [1] 0.797927
## [1] 3.182648

Passo 3: Interpretar o IC

Com 99% de confiança podemos afirmar que a variância populacional dos pesos do medicamento está entre 0.7979 e 3.1826 miligramas e que o desvio padrão está entre 0.8933 e 1.784 miligramas.

4.0.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 95%.

5 Referências

Em construção…