1.Introdução

Um intervalo de confiança é uma estimativa de intervalo em que espera-se ter o verdadeiro valor de um determinado parâmetro populacional. Ao invés de estimar por um único valor, busca-se um intervalo de estimativas prováveis. Geralmente, utiliza-se intervalos de confiança de 90%, 95% ou 99%, a depender do nível de confiança desejado. Neste trabalho, utilizaremos nível de confiança de 95%. Isto significa que, se coletarmos uma grande quantidade de amostras e construirmos intervalos de confiança correspondentes à elas, cerca de 95% delas “cobrirão” o parâmetro. Levando em conta esta discussão, o objetivo deste trabalho se baseia em estimar a probabilidade de cobertura de intervalos de confiança para o caso de uma distribuição normal. Para tal, simularemos várias amostras de uma população; encontraremos para cada amostra seu respectivo intervalo de confiança e verificaremos a proporção de simulações onde o valor esta contido no intervalo. Deseja-se que a proporção obtida seja a mais próxima possível do nível de confiança definido para o intervalo.

2.Referencial teórico

Dentro da inferência estatística, uma técnica muito importante utilizada é a de estimação por intervalo de confiança. Estima-se desta forma pois, pelo estudo de estatística, sabe-se que uma estimação pontual tem probabilidade nula de acontecer. À medida que se aumenta a probabilidade esperada de encontrar uma estimativa que represente um valor do parâmetro populacional, cria-se um intervalo de valores em que esse valor desejado esteja contido. Assim, na técnica intervalar, predefine-se uma probabilidade desejada para que o valor esperado esteja no intervalo calculado. A esta probabilidade da-se o nome de nível de confiança. Poderíamos pensar, então, que seria bom fixar sempre uma probabilidade máxima, mas isso não acontece pois, num exemplo simples em que deseja-se a altura média dos brasileiros, poderíamos citar um intervalo em metros de \([0,3]\). Isso acontece 100% das vezes, no entanto, em nada contribui para um estudo. Assim, na maioria das vezes, fixa-se um nível de confiança \(\gamma\) de 90%, 95% e 99%. Bons intervalos de confiança apresentam nível de confiança e probabilidade de cobertura próximos. A probabilidade de cobertura de um estimador intervalar \([B(X),L(X)]\) é a probabilidade do intervalo conter o verdadeiro parâmetro \(\theta\). Ou seja, \(P(\theta \in [B(X),L(X)]|\theta)=\gamma_\theta\).

3.Resultados

No código a seguir calcularemos 100 intervalos de confiança para a média populacional de uma distribuição normal. Espera-se que, para um nível de confiança de 95%, a probabilidade de cobertura fique bem proxima a 95%

porcent.dentro <- function(n,m,v){
#contadores
ta.dentro <- 0
ta.fora <- 0


rep(1:1000)
for(intervalo in 1:500){
normal <- rnorm(n,m,v)
media <- mean(normal)
variancia <- var(normal)
intervalo1 <- media+qt(c(0.025),df=n-1)*sqrt(variancia/
length(normal))
intervalo2 <- media+qt(c(0.975),df=n-1)*sqrt(variancia/
length(normal))

#Vhecar se a media da distribuicao esta no intervalo:
if(m > intervalo1 & m < intervalo2){

ta.dentro <- ta.dentro + 1
}
else{
ta.fora <- ta.fora +1
}

}
print((ta.dentro/(ta.dentro + ta.fora))*100) #imprime a porcentagem de vezes que a media de entrada pertence aos intervalos.
}
porcent.dentro(100,2,2) #Tamanho amostral, media e variancia de entrada. A seguir, a porcentagem de intervalos com a verdadeira m攼㸹dia contida no intervalo, que se aproxima de 95%.
## [1] 94.8
par(mfrow=c(1,1))
r<-rnorm(100,2,2)
hist(r, xlab= "Valores da normal", ylab= "Frequencia", col = 'gray21',freq=F, main="Histograma");
legend("topleft", legend="media", lty=1, col="red", lwd=2, bty="n")
abline(v = mean(r), col = "red", lwd = 2);

plot(r,col = 'gray0', main="Dispersao")

4.Conclusão

A probabilidade de cobertura é um assunto pouco comentado entre os autores brasileiros,além disso nota-se que há uma certa carência de material na lingua portuguesa. Talvez porque suas informações são tão esperadas, se feitas corretamente, pelo nível de confiança que se fixa. Assim, neste trabalho, criamos um código para contar quantos intervalos de confiança contêm o parâmetro populacional e verificamos a probabilidade de cobertura. Assim, conseguimos concluir a eficiência da probabilidade de cobertura em problemas estatísticos.

Bibliografia

\([1]\) Mood, Alexander McFarlane, 1913-Introduction to The Theory of Statistics.

\([2]\) Wasserman, Larry A. (Larry Alan) 1959-All of Statistics: a conscise course in Statistical Inference / Larry a. Wasserman

\([3]\) Revista da Estatística UFOP, Vol IV, 2015, ISSN 2237-8111