Dois problemas clássicos da inferência Estatística , cujo objetivo é fazer generalizações sobre uma população com base nos dados de uma amostra são a estimação de parâmetros e os testes de hipóteses sobre parâmetros (Bussab & Morettin, 2017).
Intervalos de confiança são parte das ferramentas desenvolvidas para o enfrentamento do primeiro problema. São construídos a partir de estimadores pontuais e suas distribuições amostrais e permitem julgar a magnitude do erro que se comete ao se estimar um parâmetro populacional por meio do estimador selecionado. Essa magnitude é indicada pelo nível de confiança arbitrado.
Neste documento são expostos intervalos de confiança para subgrupos de uma amostra de 2000 observações do Sistema de Avaliação da Educação Básica (SAEB) para estudantes do quinto ano. O sistema é conduzido pelo Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP) desde 1990 com a finalidade de fornecer insumos para elaboração e monitoramente de políticas públicas de educação.
Para todas as variáveis expostas a seguir, os intervalos foram construídos com 95% de confiança para o parâmetro, o que significa que é esperado que 95% das sub amostras geradas compreendam o parâmetro. As expressões a seguir indicam a base de cálculo para os intervalos de confiança para \(\mu\) e \(\pi\) respectivamente:
\[IC\left(\mu;\gamma\right) = \left] \bar{X} - z_{\gamma}\sigma_{\bar{x}} ; \bar{X} + z_{\gamma}\sigma_{\bar{x}} \right[\]
\[IC\left(\pi;\gamma\right) = \left] \hat{p} - z_{\gamma}\sqrt{\frac{\hat{p}\hat{q}}{n}} ; \hat{p} + z_{\gamma}\sqrt{\frac{\hat{p}\hat{q}}{n}} \right[\]
Por fim, os subgrupos gerados para exposição a seguir foram obtidos por amostragens aleatórias de 30 ou 100 observações, selecionadas com reposição, da amostra de 2000 observações obtida do banco de dados do SAEB. As diferentes cores indicam se o intervalo de confiança gerado compreende o parâmetro estimado, indicado pela barra cinza vertical.
Essas observações foram selecionadas de acordo com a Área registrada para o estudante, que poderia indicar uma região de capital ou interiorana. Os estudantes selecionados pertencem à categoria “interior”.
Figura 1: Intervalo de Confiança para alunos do interior, n = 30
Figura 2: Intervalo de Confiança para alunos do interior, n = 100
Os intervalos confiança a seguir foram construídos para a proporção de alunas, evidentemente do sexo feminino.
Figura 3: Intervalo de Confiança para alunas, n = 30
Figura 4: Intervalo de Confiança para alunas, n = 100
Os intervalos de confiança a seguir foram construídos a partir das médias amostrais das notas em língua portuguesa.
Figura 5: Intervalo de Confiança para língua portuguesa, n = 30
Figura 6: Intervalo de Confiança para língua portuguesa, n = 100
Os intervalos de confiança a seguir foram construídos a partir das médias amostrais das notas em matemática.
Figura 7: Intervalo de Confiança para matemática, n = 30
Figura 8: Intervalo de Confiança para matemática, n = 100
Esta é a segunda atividade realizada para a disciplina de Métodos Estatísticos 2 da Universidade de Brasília em 2021. A atividade 1 pode ser verificada aqui: https://rpubs.com/caspgalvao/me2_saeb
BRASIL. Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira (INEP). Escalas de proficiência do SAEB. Brasília, DF: INEP, 2020.
MORETTIN, Pedro Alberto; BUSSAB, Wilton de Oliveira. Estatística básica. Editora Saraiva, 2017 (9ª Edição).