1 Introdução
- 1.1 - Conceitos básicos
2 Intervalo de Confiança (IC) para a média
- 2.1 Casos I e II
  - 2.1.1 Exemplo
  - 2.1.2 Exercício
- 2.2 Caso III
  - 2.2.1 Exemplo
  - 2.2.2 Exercício
3 Intervalo de Confiança (IC) para a proporção
- 3.0.1 Exemplo
- 3.0.2 Exercício
4 Intervalo de Confiança (IC) para a variância e desvio padrão
- 4.0.1 Exemplo
- 4.0.2 Exercício
5 Referências

1 Introdução

A ideia central deste tópico é construir estimativas significativas especificando um intervalo de valores em um intervalo real juntamente com a afirmação de quão confiante você está de que seu intervalo contém o parâmetro populacional.

1.1 - Conceitos básicos

Uma estimativa intervalar é um intervalo, ou amplitude de valores, usado para estimar um parâmetro populacional. Assim, a estimativa intervalar consiste na fixação de dois valores (limites de confiança) tais que c seja a probabilidade de que o intervalo, por eles determinado, contenha o verdadeiro valor do parâmetro.

Definição: O nível de confiança c é a probabilidade de que o intervalo estimado contenha o verdadeiro valor do parâmetro populacional. Portanto, (1 – c) nos dá a medida da incerteza desta inferência (nível de significância).

2 Intervalo de Confiança (IC) para a média

Neste tópico vamos aprender como usar amostras estatísticas para fazer a estimativa do parâmetro populacional \(\mu\) quando

Caso I: o tamanho da amostra for de pelo menos 30 (amostras grandes),
Caso II: a população é normalmente distribuída e o desvio padrão \(\sigma\) é conhecido,
Caso III: a população é normalmente distribuída e o desvio padrão \(\sigma\) é desconhecido ou quando temos amostras pequenas.

2.1 Casos I e II

Neste tópico vamos aprender como usar amostras estatísticas para fazer a estimativa do parâmetro populacional \(\mu\) quando o tamanho da amostra for de pelo menos 30 (amostras grandes) (Caso I) ou quando a população é normalmente distribuída e o desvio \(\sigma\) é conhecido (Caso II).
Lembre-se que em ambos os casos recaímos nas hipóteses do Teorema do Limite Central (TLC) e, portanto, a distribuição de amostragem das médias amostrais segue uma distribuição normal. Assim, o nível de confiança (c) é definido como a área sob a curva normal padrão (região central) entre os valores críticos \(-z_c\) e \(z_c\).

Fig. 1: Distribuição Normal Padrão

Dessa forma, o IC para a média populacional \(\mu\) é dado por \[IC(\mu; 1-\alpha): (\overline x - E; \overline x + E)\]

em que o erro máximo amostral E é calculado por \[E = z_c \frac{\sigma}{\sqrt n}\].

Obs.: Para amostras grandes, caso o desvio padrão populacional não seja conhecido, poderemos utilizar o desvio amostral \(s\).

2.1.1 Exemplo

Em uma amostra aleatória do número de erros de impressão em 50 livros publicados por uma editora, calculou-se \(\overline x = 12,4\). Construa um intervalo de confiança (IC) de 95% para a média do número de erros de impressão em todos os livros publicados. Assuma que o desvio padrão da amostra seja de aproximadamente 5,0.

– Passo 1: Calcular a média amostral

Neste caso já é dado no enunciado do problema.

x = 12.4

– Passo 2: Encontrar o valor crítico \(z_c\) a partir da distribuição normal padrão

c = 0.95
zc <- qnorm(p = c + (1-c)/2, 
            mean = 0,
            sd = 1)
zc

## [1] 1.959964

– Passo 3: Calcular o erro máximo amostral

s = 5
n = 50
E = zc * s/ sqrt(n)
E

## [1] 1.385904

– Passo 4: Calcular o IC

x - E; x + E

## [1] 11.0141

## [1] 13.7859

– Passo 5: Interpretar o IC

Com 95% de confiança, podemos afirmar que a média populacional do número de erros de impressão está entre 11.0141 e 13.7859.

2.1.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 99%.

2.2 Caso III

Considere uma população que é normalmente distribuída da qual é extraída uma amostra aleatória \(X_1, X_2, X_3, ..., X_n\). Se \(\mu\) e \(\sigma\) são desconhecidos, então a v. a.

\[T = \frac{\overline x - \mu}{s / \sqrt n} \]

possui uma distribuiçao de probabilidades denominada t (de Student) com n-1 graus de liberdade.

Nesse caso, o IC para \(\mu\) é dado por

\[IC(\mu; 1-\alpha): (\overline x - E; \overline x + E)\]

em que o erro máximo amostral E é calculado por \[E = t_{(n-1; \alpha/2)} \times \frac{s}{\sqrt n}\].

2.2.1 Exemplo

São selecionadas aleatoriamente 16 cafeterias e medidas a temperatura do café vendido em cada uma delas. A média de temperatura da amostra é 74 °C com desvio padrão da amostra de 10°C. Encontre um intervalo de confiança de 95% para a temperatura média. Assuma que as temperaturas são normalmente distribuídas.

– Passo 1: Como a amostra é pequena, \(\sigma\) é desconhecido e a população é normalmente distribuída, vamos usar a distribuição t para resolver este exemplo. O valor crítico \(t_c\) é

x = 74
c = 0.95
n = 16
tc <- qt(p = c + (1-c)/2, 
         df = n-1)
tc

## [1] 2.13145

– Passo 2: Calcular o erro máximo amostral

s = 10
E = tc * s/ sqrt(n)
E

## [1] 5.328624

– Passo 3: Calcular o IC

x - E; x + E

## [1] 68.67138

## [1] 79.32862

– Passo 4: Interpretar o IC

Com 95% de confiança, podemos dizer que a média da temperatura está entre 68.6714 e 79.3286.

2.2.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 99%.

Resposta: (66.6332; 81.3668)

3 Intervalo de Confiança (IC) para a proporção

Suponha que uma amostra aleatória \(X\) de tamanho \(n\) seja retirada de uma população e que o número de sucessos seja ugual a \(x\). Nesse caso, uma estimativa pontual (\(\widehat{p}\)) para a proporção populacional \(p\) é dada por

\[\widehat{p} = \frac{x}{n}\]

Se forem satisfeitas as condições \(np \geq 10\) e \(nq \geq 10\) então \(X\) possui uma distribuição aproximadamente normal e um intervalo de confiança para a proporção populacional \(p\) é dado por

\[IC(p; 1-\alpha): (\widehat{p} - E; \widehat{p} + E)\]

em que o erro máximo amostral E é calculado por

\[E = z_{\alpha/2} \times \sqrt {\frac{\widehat{p} \widehat{q}}{n}}\].

3.0.1 Exemplo

Em uma pesquisa com 4.431 brasileiros adultos, descobriu-se que 2.938 estavam acima do peso. Usando esta estatística amostral, construa um intevalo de confiança de \(95\%\) para a proporção populacional de brasileiros adultos que estão acima do peso.

– Passo 1: Calcular a proporção amostral

n = 4431
x = 2938
p_amost = x/n
p_amost

## [1] 0.6630557

– Passo 2: Encontrar o valor crítico \(z_{\alpha/2}\) a partir da distribuição normal padrão

alpha = 0.05
zc <- qnorm(p = 1-alpha/2,
             mean = 0,
             sd = 1)
zc

## [1] 1.959964

– Passo 3: Calcular o erro máximo da amostra

E = zc * sqrt(p_amost*(1-p_amost) / n)
E

## [1] 0.01391718

– Passo 4: Calcular o IC

p_amost - E; p_amost + E

## [1] 0.6491386

## [1] 0.6769729

– Passo 5: Interpretar o IC

Com 95% de confiança, podemos afirmar que a proporção populacional de brasileiros adultos que estão acima do peso está entre 0.6491 e 0.677.

3.0.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 99%.

4 Intervalo de Confiança (IC) para a variância e desvio padrão

Teorema: Considere uma população que é normalmente distribuída com parâmetros \(\mu\) e \(\sigma\) e que seja extraída uma amostra aleatória \(X_1, X_2, X_3, ..., X_n\). A v. a.

\[\chi ^2 = \frac{(n-1)s^2}{\sigma ^2} \] possui distribuição de probabilidade qui-quadrado para amostras de qualquer tamanho n > 1.

Nesse caso, o IC para a variância \(\sigma ^2\) de uma população normal é dado por

\[IC(\sigma ^2; 1-\alpha): \left( \frac{(n-1)s^2}{\chi ^2_{sup}}; \frac{(n-1)s^2}{\chi ^2_{inf}} \right ) \]

Enquanto que o IC para o desvio padrão \(\sigma\) é dado por

\[IC(\sigma; 1-\alpha): \left( \sqrt \frac{(n-1)s^2}{\chi ^2_{sup}}; \sqrt \frac{(n-1)s^2}{\chi ^2_{inf}} \right ) \]

4.0.1 Exemplo

São anotados os pesos de 30 amostras selecionadas aleatoriamente de um medicamento. O desvio padrão da amostra é 1,20 miligramas. Supondo que os pesos são normalmente distribuídos, construa intervalos de confiança de 99% para a variância e para o desvio padrão da população.

– Passo 1: Encontrar os valores críticos de \(\chi ^2_{sup}\) e \(\chi ^2_{inf}\)

alpha = 0.01
n = 30
s = 1.2
qui2_inf <- qchisq(p = 1-alpha/2, df = n-1, lower.tail = F)
qui2_inf

## [1] 13.12115

qui2_sup <- qchisq(p = alpha/2,   df = n-1, lower.tail = F)
qui2_sup

## [1] 52.33562

– Passo 2: Calcular os limites do IC

lim_inf <- ((n-1)*s^2) / qui2_sup
lim_inf

## [1] 0.797927

lim_sup <- ((n-1)*s^2) / qui2_inf
lim_sup

## [1] 3.182648

– Passo 3: Interpretar o IC

Com 99% de confiança podemos afirmar que a variância populacional dos pesos do medicamento está entre 0.7979 e 3.1826 miligramas e que o desvio padrão está entre 0.8933 e 1.784 miligramas.

4.0.2 Exercício

Refaça o exemplo anterior considerando um nível de confiança de 95%.

5 Referências

Em construção…

Probabilidade e Estatística - BA011012

7 - Intervalos de confiança

Prof. Guilherme Goergen - Unipampa Campus Bagé

1 Introdução

1.1 - Conceitos básicos

2 Intervalo de Confiança (IC) para a média

2.1 Casos I e II

2.1.1 Exemplo

2.1.2 Exercício

2.2 Caso III

2.2.1 Exemplo

2.2.2 Exercício

3 Intervalo de Confiança (IC) para a proporção

3.0.1 Exemplo

3.0.2 Exercício

4 Intervalo de Confiança (IC) para a variância e desvio padrão

4.0.1 Exemplo

4.0.2 Exercício

5 Referências