Banco de dados

Ingressantes no ano de 2010 na Universidade de São Paulo (USP) nos cursos de Estatística, Física e Matemática totalizaram 458 alunos, distribuídos conforme segue: 82 em Estatística, 163 em Física e 213 em Matemática.

Não houve entrada por reserva de vagas; dos ingressantes, apenas um aluno possuía deficiência física. No total, 10 alunos receberam algum tipo de apoio social da universidade: 7 com auxílio alimentação, 6 com auxílio moradia e 1 com auxílio transporte.

Quanto à forma de ingresso, 379 alunos foram aprovados pelo vestibular da USP, 71 por outra modalidade de seleção e 8 por outras vias de admissão.

No ano de ingresso, somente dois alunos participaram de atividades complementares: um em projeto de extensão e outro em monitoria, sendo um aluno do curso de Matemática e o outro de Física.

##       CO_ALUNO CO_CURSO SITUACAO2010 SITUACAO2011 SITUACAO2012 SITUACAO2013
## 1 400011252716     2889            2            2            2            2
## 2 400011254824     2889            2            2            2            2
## 3 400011255766     2889            4            4            4            4
## 4 400011267532     2889            2            2            2            5
## 5 400007273912     2889            2            2            2            2
## 6 400007310413     2889            2            2            2            6
##   SITUACAO2014 SITUACAO2015 SITUACAO2016 SITUACAO2017 Tempo censura
## 1            3            3            3            4     8       1
## 2            3            3            3            3     8       0
## 3            4            4            4            4     1       1
## 4            5            5            5            5     4       1
## 5            2            2            6            6     7       1
## 6            6            6            6            6     4       1
##   DS_COR_RACA_ALUNO DS_SEXO_ALUNO NU_IDADE_ALUNO CO_TURNO_ALUNO CO_TURNO_ALUNO1
## 1           Amarela      Feminino             22              1        Matutino
## 2            Branca      Feminino             19              1        Matutino
## 3            Branca     Masculino             22              1        Matutino
## 4            Branca     Masculino             19              1        Matutino
## 5           Amarela     Masculino             19              1        Matutino
## 6             Parda     Masculino             20              1        Matutino
##   SITUACAO2012_1 SITUACAO2013_1 SITUACAO2014_1 SITUACAO2015_1 SITUACAO2016_1
## 1          Ativo          Ativo          Ativo          Ativo          Ativo
## 2          Ativo          Ativo          Ativo          Ativo          Ativo
## 3        Evadido        Evadido        Evadido        Evadido        Evadido
## 4          Ativo        Evadido        Evadido        Evadido        Evadido
## 5          Ativo          Ativo          Ativo          Ativo       Concluso
## 6          Ativo       Concluso       Concluso       Concluso       Concluso
##   SITUACAO2017_1      sexo    raca idade turno   turno1 Evento raca1 turno2
## 1        Evadido  Feminino Amarela    22     1 Matutino      2     0      0
## 2          Ativo  Feminino  Branca    19     1 Matutino      0     1      0
## 3        Evadido Masculino  Branca    22     1 Matutino      2     1      0
## 4        Evadido Masculino  Branca    19     1 Matutino      2     1      0
## 5       Concluso Masculino Amarela    19     1 Matutino      1     0      0
## 6       Concluso Masculino   Parda    20     1 Matutino      1     0      0

Análise Descritiva

• Por sexo

Entre os ingressantes, aproximadamente 28,17% eram do sexo feminino, enquanto 71,83% pertenciam ao sexo masculino.

## 
##  Feminino Masculino 
## 0.2816594 0.7183406

• Raça por sexo

Observe-se que, entre os ingressantes da raça amarela, a proporção entre os sexos é relativamente equilibrada, diferentemente das demais categorias, que apresentam uma predominância de alunos do sexo masculino. Ressalta-se que não houve ingressantes indígenas do sexo feminino.

##                
##                    Feminino   Masculino
##   Amarela       0.039301310 0.045851528
##   Branca        0.185589520 0.475982533
##   Indígena      0.000000000 0.004366812
##   Não declarado 0.010917031 0.069868996
##   Parda         0.032751092 0.093886463
##   Preta         0.013100437 0.028384279

• Por idade

As tabelas e os gráficos apresentam estatísticas descritivas da idade de todos os ingressantes, independentemente do sexo. A média de idade é de aproximadamente 24,3 anos, com um desvio padrão de 7,55 anos, o que indica uma variação específica em torno da média. O primeiro quartil (Q1) é de 19 anos, e o terceiro quartil (Q3) é de 26 anos, indicando que metade dos ingressantes tem entre 19 e 26 anos. A idade mínima registrada é de 17 anos e a máxima é de 73 anos, indicando um grupo diverso em termos de idade.

##   Idade_média Idade_desvio Idade_Q1 Idade_Q3 Idade_minima Idade_maxima
## 1    24.29694     7.552532       19       26           17           73

○ Idade - Feminino

Das estatísticas descritivas da idade das ingressantes do sexo feminino. A idade média é de aproximadamente 22,8 anos, com um desvio padrão de 6,54 anos. O primeiro quartil (Q1) é de 19 anos, e a mediana é de 21 anos, diminuindo que metade das alunas têm até 21 anos. O terceiro quartil (Q3) é de 24 anos. A idade mínima é 17 anos, e a máxima é 58 anos, refletindo uma faixa etária menos extensa em comparação com o grupo geral.

##   Idade_média Idade_desvio Idade_Q1 Idade_mediana Idade_Q3 Idade_minima
## 1    22.78295     6.538302       19            21       24           17
##   Idade_maxima
## 1           58

○ Idade - Masculino

Acerca das estatísticas descritivas da idade dos ingressantes do sexo masculino. A média de idade dos homens é de aproximadamente 24,9 anos, com um desvio padrão de 7,84 anos, o que indica uma variação mínima maior em comparação com o grupo feminino. O primeiro quartil (Q1) é de 19 anos, a mediana é de 23 anos, e o terceiro quartil (Q3) é de 27 anos, diminuindo que metade dos ingressantes têm entre 19 e 27 anos. A idade mínima é 17 anos e a máxima chega a 73 anos, refletindo uma distribuição de idade mais ampla do que a observada entre as mulheres.

##   Idade_média Idade_desvio Idade_Q1 Idade_mediana Idade_Q3 Idade_minima
## 1    24.89058     7.844538       19            23       27           17
##   Idade_maxima
## 1           73

• Por Turno

Integral : Apenas 5 ingressantes estão matriculados no período integral, representando aproximadamente 0,6% do total. Matutino : 207 alunos estão no período matutino, o que corresponde a cerca de 26,5% do total. Noturno : A maioria dos ingressantes, 246, estão matriculados no período noturno, representando aproximadamente 72,9% do total.

Esses valores indicam uma clara preferência ou predominância de ingressos no período noturno, seguido pelo matutino, com uma participação mínima no período integral.

## 
## Integral Matutino  Noturno 
##        5      207      246

Temos a seguir tabelas com algumas medidas resumo do tempo em anos, segundo o evento de interesse.

É possível notar que o tempo médio entre os alunos que evadiram foi de 3,37 anos, e que 75% deles evadiram até 4 anos de curso. Para a conclusão, temos que o tempo médio foi de 5,19 anos, sendo que, dos alunos que formaram, apenas 25% deles concluíram até 4 anos.

• Tempos para conclusão

##   Tempo_média Tempo_desvio Tempo_Q1 Tempo_mediana Tempo_Q3 Tempo_minimo
## 1    5.198113       1.5145        4             5        6            2
##   Tempo_maximo
## 1            8

• Tempos para evasão

##   Tempo_média Tempo_desvio Tempo_Q1 Tempo_mediana Tempo_Q3 Tempo_minimo
## 1    3.371542     1.895143        2             3        4            1
##   Tempo_maximo
## 1            8

Abaixo algumas tabelas e cruzamentos com covariáveis sobre os tempos até os eventos de interesse: Conclusão e Evasão.

## # A tibble: 6 × 4
## # Groups:   SITUACAO2017_1 [3]
##   SITUACAO2017_1 sexo          n    por
##   <chr>          <chr>     <int>  <dbl>
## 1 Ativo          Feminino     28 0.0611
## 2 Ativo          Masculino    71 0.155 
## 3 Concluso       Feminino     42 0.0917
## 4 Concluso       Masculino    64 0.140 
## 5 Evadido        Feminino     59 0.129 
## 6 Evadido        Masculino   194 0.424
## # A tibble: 16 × 4
## # Groups:   SITUACAO2017_1 [3]
##    SITUACAO2017_1 Tempo     n     por
##    <chr>          <int> <int>   <dbl>
##  1 Ativo              8    99 0.216  
##  2 Concluso           2     4 0.00873
##  3 Concluso           3    11 0.0240 
##  4 Concluso           4    20 0.0437 
##  5 Concluso           5    24 0.0524 
##  6 Concluso           6    26 0.0568 
##  7 Concluso           7    14 0.0306 
##  8 Concluso           8     7 0.0153 
##  9 Evadido            1    30 0.0655 
## 10 Evadido            2    73 0.159  
## 11 Evadido            3    53 0.116  
## 12 Evadido            4    47 0.103  
## 13 Evadido            5     7 0.0153 
## 14 Evadido            6    19 0.0415 
## 15 Evadido            7    11 0.0240 
## 16 Evadido            8    13 0.0284

• Situação dos Alunos em 2017

Ativos : 99 alunos estavam ativos, o que representa aproximadamente 21,6% do total. Concluídos : 106 alunos concluíram o curso, correspondendo a cerca de 23,1% do total. Evadidos : 253 alunos foram evadidos, representando 55,2% do total.

Esses dados mostram que mais da metade dos alunos deixaram o curso sem conclusão (evadidos), enquanto 21,6% estavam ativos em 2017. A taxa de conclusão foi apenas de aproximadamente 23,1%.

Os maiores percentuais de alunos que evadiram são vistos nos quatro primeiros anos. A conclusão apresenta percentuais pequenos ou zerados nos primeiros anos, mostrando aumento mais significativo em torno do quarto ano, o que é esperado dado que se faz necessário cursar disciplinas antes de estar apto a concluir o curso, exceto para os alunos reingressantes ou transferidos com parte das disciplinas já cursadas.

## # A tibble: 3 × 3
##   SITUACAO2017_1 count percentage
##   <chr>          <int>      <dbl>
## 1 Ativo             99       21.6
## 2 Concluso         106       23.1
## 3 Evadido          253       55.2

FIAs

A Função de Incidência Acumulada (FIA) representa a probabilidade acumulada de ocorrência de falhas atribuídas à causa k até um determinado tempo, levando em consideração a possibilidade de eventos concorrentes. Essa função fornece uma visão descritiva inicial sobre a distribuição temporal dos eventos concorrentes, evidenciando como cada causa contribui para a incidência ao longo do tempo.

As curvas da FIA para os dois eventos sugerem que os alunos têm maior propensão a experimentar a evasão antes da conclusão. Nos primeiros anos, espera-se que a FIA permaneça próxima de zero, considerando que os cursos tem uma duração típica de 4 anos. Ao final de 8 anos, a probabilidade de conclusão foi estimada em aproximadamente 0,21, enquanto a probabilidade de evasão já era superior a isto nos primeiros anos.

• FIA geral

Para analisar como as características dos alunos estão associadas ao evento de interesse, utilizou-se a Função de Incidência Acumulada (FIA) para estimar a probabilidade de ocorrência dos desfechos de conclusão e evasão de acordo com as categorias e foi utilizado o teste de Gray para verificar se duas categorias das covariáveis consideradas eram significativamente diferentes para cada eventos deinteresse ao nível de significância de 10%.

A hipótese alternativa é de que pelo menos uma categoria difere das demais. Por exemplo, para a variável sexo e para o evento conclusão as hipóteses (nula e alternativa) são:

Hipótese Nula (H0): As curvas de incidência cumulativa são iguais entre os grupos (isto é, H0: conclusão_feminino = conclusão_masculino)

Hipótese Alternativa (H1): As curvas de incidência cumulativa são diferentes entre os grupos (isto é, H1: conclusão_feminino ≠ conclusão_masculino)

As variáveis que possuíam mais de 2 categorias, foram dicotomizadas para serem analisadas, de acordo com uma categoria de interesse, como por exemplo, idade (maior e menor que a mediana), turno que frequenta (noturno e não noturno) e raça (branca e não branca).

A seguir as curvas das FIAs e seus respectivos testes de acordo com as covariáveis consideradas.

• FIA por sexo

##       stat          pv df
## 1 8.274424 0.004020741  1
## 2 5.906479 0.015085292  1

• FIA por raça

##        stat           pv df
## 1 11.044326 0.0008895906  1
## 2  5.849172 0.0155843834  1

• FIA por idade

##       stat          pv df
## 1 9.351636 0.002227865  1
## 2 6.993058 0.008182645  1

• FIA por turno

##       stat         pv df
## 1 6.093203 0.01357029  1
## 2 3.327201 0.06814276  1

Conforme analisado acima, para todas as variáveis, as curvas de incidência são diferentes ao nível de significância de 10% (valor-p < 0,1), o que permite traçar o perfil dos alunos com maior probabilidade de conclusão ou evasão, considerando essas características.

Os resultados indicam que as mulheres, pessoas não brancas, com idade abaixo da mediana (mais novas) e matriculadas em cursos diurnos apresentam maior propensão à conclusão dos cursos (representadas pelas linhas pretas). Em contrapartida, os homens, pessoas brancas, com idade acima da mediana (mais velhos) e matriculados em cursos noturnos são mais propensos à evasão (representados pelas linhas vermelhas).

Modelagem

Abordagem clássica

Ajuste clássico do modelo de causa específica com distribuição de linha de base Weibull.

O parâmetro \(\lambda\) controla a taxa basal de risco do evento. Um valor de menor indica uma taxa de risco mais baixa, enquanto valores maiores indicam uma taxa basal de risco mais alta. Ele se ajusta à posição da curva da função de risco, mas não altera sua forma. Nos nossos modelos, o lambda do modelo Evasão é 0,0344, maior do que o observado no modelo de conclusão (0.0080), revelando uma taxa basal de risco de evasão mais alta em comparação com a de conclusão.

Em ambos os modelos \(\alpha>1\) o que indica que o risco basal é crescente ao longo do tempo, isso sugere que, conforme o tempo passa, a probabilidade de conclusão/evasão aumenta, ou que é consistente com a expectativa de que os alunos tendem a concluir/evadir o curso conforme avançam nos estudos.

Os valores de \(exp(\beta)\) fornecem as razões de risco associadas às covariáveis do modelo. A seguir interpretamos cada modelo separadamente.

• Modelo Conclusão

O modelo de Conclusão revela que a taxa de conclusão nos cursos de Estatística, Física e Matemática da USP é 28% menor para homens em comparação com mulheres. Para alunos da raça branca, a taxa de conclusão é 40% inferior em relação aos alunos não brancos. Além disso, observe-se que, para cada ano adicional de idade, a taxa de conclusão reduz-se em 4,7%. Por fim, para alunos matriculados no período noturno, a taxa de conclusão é 28% menor em comparação com a dos alunos dos demais turnos.

## Estimação de lambda: 0.008082733
## Estimação de alpha: 2.928962
## Estimação de exp(beta): 0.7203619 0.6021471 0.9536952 0.7236352

• Modelo Evasão

O modelo de Evasão indica que a taxa de evasão nos cursos de Estatística, Física e Matemática da USP é 1,38 vezes maior para homens em comparação com mulheres. Para alunos da raça branca, a taxa de evasão é 27% superior em relação aos alunos não brancos. Além disso, observe-se que, para cada ano adicional de idade, a taxa de evasão aumenta em 0,3%. Por fim, para alunos matriculados no período noturno, a taxa de evasão é 8% maior em comparação com os alunos dos demais turnos.

## Estimação de lambda: 0.03435324
## Estimação de alpha: 1.384853
## Estimação de exp(beta): 1.385622 1.274394 1.003506 1.089917

Apó fazermos o diagnóstico do modelo, através dos residuos, a seguir temos a comparação da FIA empirica e ajustada pelo modelo causa especifica Weibull.

Previsão

Com base na modelagem considerada e parâmetros estimados, considerando dois perfis, vamos comparar as FIAs estimada de acordo com cada covariavel fixada e as demais fixas:

• Sexo

comparação de dois alunos de 19 anos, de raça branca e turno noturno.

• Raça

comparação de dois alunos do sexo masculino, idade de 19 anos e turno noturno.

• Idade

comparação de dois alunos do sexo masculino, da raça branca e turno noturno.

• Turno

comparação de dois alunos do sexo masculino, da raça branca e idade de 19 anos.

Nas predições acima das FIAs para comparar indivíduos com dois perfis diferentes, corroboramos as informações das análises descritivas e identificamos reforçamos os perfis mais propensos aos eventos de interesse.