4 O desempenho dos cotistas é equivalente ao dos não-cotistas?

Apresentamos algumas estatísticas descritivas por cota e o box-plot do IRA por cota e campus.

Testaremos a hipótese de que diferença entre o IRA médio de cotistas e não cotistas é estatisticamente nula. O teste t para duas amostras (cada uma com 500 observações obtidas por amostragem aleatória simples) apresenta um valor-p próximo de zero, o que nos leva a rejeitar a hipótese de igualdade das médias.

## 
##  Welch Two Sample t-test
## 
## data:  n_cotistas_boot and cotistas_boot
## t = 3.5868, df = 596.69, p-value = 0.0003622
## alternative hypothesis: true difference in means is not equal to 0
## 95 percent confidence interval:
##   3.394531 11.610586
## sample estimates:
## mean of x mean of y 
##  57.94739  50.44483

Para testar a hipótese de igualdade das médias, utilizaremos o seguinte procedimento bootstrap:

considere duas amostras independentes

  • \(\{x_{obs,1}, x_{obs,2}, \ldots, x_{obs,n}\}\) e a média \(\bar{x}_{obs}\)
  • \(\{y_{obs,1}, y_{obs,2}, \ldots, y_{obs,n}\}\) e a média \(\bar{y}_{obs}\)
  • Diferença das médias observadas: \(t^*_{obs} = \bar{x}_{obs} - \bar{y}_{obs}\)

O procedimento consiste em

  1. Juntar as duas amostras observadas em uma única amostra de \((m+n)\) observações;
  2. Sortear uma amostra de \((m+n)\) observações com reposição da amostra obtida no passo anterior;
  3. Calcular a médias das primeiras \(n\) observações \(\bar{x}^*\) e a médias das \(m\) observações restantes \(\bar{y}^*\) e obter a estatística \[t^* = \bar{x}^* - \bar{y}^*\]
  4. Repetir os passos 2 e 3 por \(B\) vezes e obter \(B\) estatísticas de teste;
  5. O valor-p estimado será dado por \[p \approx \frac{Número \, de \, vezes\, em \, que \, \{t^* > t^*_{obs}\}}{B}\]

A vantagem deste procedimento é que ele não parte de nenhum pressuposto de normalidade das amostras, como faz o teste t. O teste bootstrap forneceu um valor-p de \(0.002\), o que também fornece pouca evidência a favor da hipótese de igualdade de médias entre as duas amostras:

## [1] 0.002

5 Extra: Avaliação dos reingressantes

Filtrando os dados para obter os cpf’s ligados a mais de uma matrícula, podemos obter a movimentação dos reingressantes entre os cursos de graduação. No total, existem 3130 cpf’s nesta situação. Cabe observar que os alunos formados em BCT são considerados ingressantes nos cursos de engenharia, portanto os seus cpf’s estão ligados a duas matrículas na Universidade. É possível contruir uma matriz de adjacência dos cursos, cujas primeiras linhas são apresentadas abaixo:

## [1] 3130

Podemos representar a matriz de adjacência como um grafo interativo que mostra os fluxos de reingressantes entre os cursos:

 

Desenvolvido por Kássio Camelo

kassio.silva@ufersa.edu.br