Ingressantes no ano de 2010 na Universidade de São Paulo (USP) nos cursos de Estatística, Física e Matemática totalizaram 458 alunos, distribuídos conforme segue: 82 em Estatística, 163 em Física e 213 em Matemática.
Não houve entrada por reserva de vagas; dos ingressantes, apenas um aluno possuía deficiência física. No total, 10 alunos receberam algum tipo de apoio social da universidade: 7 com auxílio alimentação, 6 com auxílio moradia e 1 com auxílio transporte.
Quanto à forma de ingresso, 379 alunos foram aprovados pelo vestibular da USP, 71 por outra modalidade de seleção e 8 por outras vias de admissão.
No ano de ingresso, somente dois alunos participaram de atividades complementares: um em projeto de extensão e outro em monitoria, sendo um aluno do curso de Matemática e o outro de Física.
## CO_ALUNO CO_CURSO SITUACAO2010 SITUACAO2011 SITUACAO2012 SITUACAO2013
## 1 400011252716 2889 2 2 2 2
## 2 400011254824 2889 2 2 2 2
## 3 400011255766 2889 4 4 4 4
## 4 400011267532 2889 2 2 2 5
## 5 400007273912 2889 2 2 2 2
## 6 400007310413 2889 2 2 2 6
## SITUACAO2014 SITUACAO2015 SITUACAO2016 SITUACAO2017 Tempo censura
## 1 3 3 3 4 8 1
## 2 3 3 3 3 8 0
## 3 4 4 4 4 1 1
## 4 5 5 5 5 4 1
## 5 2 2 6 6 7 1
## 6 6 6 6 6 4 1
## DS_COR_RACA_ALUNO DS_SEXO_ALUNO NU_IDADE_ALUNO CO_TURNO_ALUNO CO_TURNO_ALUNO1
## 1 Amarela Feminino 22 1 Matutino
## 2 Branca Feminino 19 1 Matutino
## 3 Branca Masculino 22 1 Matutino
## 4 Branca Masculino 19 1 Matutino
## 5 Amarela Masculino 19 1 Matutino
## 6 Parda Masculino 20 1 Matutino
## SITUACAO2012_1 SITUACAO2013_1 SITUACAO2014_1 SITUACAO2015_1 SITUACAO2016_1
## 1 Ativo Ativo Ativo Ativo Ativo
## 2 Ativo Ativo Ativo Ativo Ativo
## 3 Evadido Evadido Evadido Evadido Evadido
## 4 Ativo Evadido Evadido Evadido Evadido
## 5 Ativo Ativo Ativo Ativo Concluso
## 6 Ativo Concluso Concluso Concluso Concluso
## SITUACAO2017_1 sexo raca idade turno turno1 Evento raca1 turno2
## 1 Evadido Feminino Amarela 22 1 Matutino 2 0 0
## 2 Ativo Feminino Branca 19 1 Matutino 0 1 0
## 3 Evadido Masculino Branca 22 1 Matutino 2 1 0
## 4 Evadido Masculino Branca 19 1 Matutino 2 1 0
## 5 Concluso Masculino Amarela 19 1 Matutino 1 0 0
## 6 Concluso Masculino Parda 20 1 Matutino 1 0 0
• Por sexo
Entre os ingressantes, aproximadamente 28,17% eram do sexo feminino, enquanto 71,83% pertenciam ao sexo masculino.
##
## Feminino Masculino
## 0.2816594 0.7183406
• Raça por sexo
Observe-se que, entre os ingressantes da raça amarela, a proporção entre os sexos é relativamente equilibrada, diferentemente das demais categorias, que apresentam uma predominância de alunos do sexo masculino. Ressalta-se que não houve ingressantes indígenas do sexo feminino.
##
## Feminino Masculino
## Amarela 0.039301310 0.045851528
## Branca 0.185589520 0.475982533
## Indígena 0.000000000 0.004366812
## Não declarado 0.010917031 0.069868996
## Parda 0.032751092 0.093886463
## Preta 0.013100437 0.028384279
• Por idade
As tabelas e os gráficos apresentam estatísticas descritivas da idade de todos os ingressantes, independentemente do sexo. A média de idade é de aproximadamente 24,3 anos, com um desvio padrão de 7,55 anos, o que indica uma variação específica em torno da média. O primeiro quartil (Q1) é de 19 anos, e o terceiro quartil (Q3) é de 26 anos, indicando que metade dos ingressantes tem entre 19 e 26 anos. A idade mínima registrada é de 17 anos e a máxima é de 73 anos, indicando um grupo diverso em termos de idade.
## Idade_média Idade_desvio Idade_Q1 Idade_Q3 Idade_minima Idade_maxima
## 1 24.29694 7.552532 19 26 17 73
○ Idade - Feminino
Das estatísticas descritivas da idade das ingressantes do sexo feminino. A idade média é de aproximadamente 22,8 anos, com um desvio padrão de 6,54 anos. O primeiro quartil (Q1) é de 19 anos, e a mediana é de 21 anos, diminuindo que metade das alunas têm até 21 anos. O terceiro quartil (Q3) é de 24 anos. A idade mínima é 17 anos, e a máxima é 58 anos, refletindo uma faixa etária menos extensa em comparação com o grupo geral.
## Idade_média Idade_desvio Idade_Q1 Idade_mediana Idade_Q3 Idade_minima
## 1 22.78295 6.538302 19 21 24 17
## Idade_maxima
## 1 58
○ Idade - Masculino
Acerca das estatísticas descritivas da idade dos ingressantes do sexo masculino. A média de idade dos homens é de aproximadamente 24,9 anos, com um desvio padrão de 7,84 anos, o que indica uma variação mínima maior em comparação com o grupo feminino. O primeiro quartil (Q1) é de 19 anos, a mediana é de 23 anos, e o terceiro quartil (Q3) é de 27 anos, diminuindo que metade dos ingressantes têm entre 19 e 27 anos. A idade mínima é 17 anos e a máxima chega a 73 anos, refletindo uma distribuição de idade mais ampla do que a observada entre as mulheres.
## Idade_média Idade_desvio Idade_Q1 Idade_mediana Idade_Q3 Idade_minima
## 1 24.89058 7.844538 19 23 27 17
## Idade_maxima
## 1 73
• Por Turno
Integral : Apenas 5 ingressantes estão matriculados no período integral, representando aproximadamente 0,6% do total. Matutino : 207 alunos estão no período matutino, o que corresponde a cerca de 26,5% do total. Noturno : A maioria dos ingressantes, 246, estão matriculados no período noturno, representando aproximadamente 72,9% do total.
Esses valores indicam uma clara preferência ou predominância de ingressos no período noturno, seguido pelo matutino, com uma participação mínima no período integral.
##
## Integral Matutino Noturno
## 5 207 246
Temos a seguir tabelas com algumas medidas resumo do tempo em anos, segundo o evento de interesse.
É possível notar que o tempo médio entre os alunos que evadiram foi de 3,37 anos, e que 75% deles evadiram até 4 anos de curso. Para a conclusão, temos que o tempo médio foi de 5,19 anos, sendo que, dos alunos que formaram, apenas 25% deles concluíram até 4 anos.
• Tempos para conclusão
## Tempo_média Tempo_desvio Tempo_Q1 Tempo_mediana Tempo_Q3 Tempo_minimo
## 1 5.198113 1.5145 4 5 6 2
## Tempo_maximo
## 1 8
• Tempos para evasão
## Tempo_média Tempo_desvio Tempo_Q1 Tempo_mediana Tempo_Q3 Tempo_minimo
## 1 3.371542 1.895143 2 3 4 1
## Tempo_maximo
## 1 8
Abaixo algumas tabelas e cruzamentos com covariáveis sobre os tempos até os eventos de interesse: Conclusão e Evasão.
## # A tibble: 6 × 4
## # Groups: SITUACAO2017_1 [3]
## SITUACAO2017_1 sexo n por
## <chr> <chr> <int> <dbl>
## 1 Ativo Feminino 28 0.0611
## 2 Ativo Masculino 71 0.155
## 3 Concluso Feminino 42 0.0917
## 4 Concluso Masculino 64 0.140
## 5 Evadido Feminino 59 0.129
## 6 Evadido Masculino 194 0.424
## # A tibble: 16 × 4
## # Groups: SITUACAO2017_1 [3]
## SITUACAO2017_1 Tempo n por
## <chr> <int> <int> <dbl>
## 1 Ativo 8 99 0.216
## 2 Concluso 2 4 0.00873
## 3 Concluso 3 11 0.0240
## 4 Concluso 4 20 0.0437
## 5 Concluso 5 24 0.0524
## 6 Concluso 6 26 0.0568
## 7 Concluso 7 14 0.0306
## 8 Concluso 8 7 0.0153
## 9 Evadido 1 30 0.0655
## 10 Evadido 2 73 0.159
## 11 Evadido 3 53 0.116
## 12 Evadido 4 47 0.103
## 13 Evadido 5 7 0.0153
## 14 Evadido 6 19 0.0415
## 15 Evadido 7 11 0.0240
## 16 Evadido 8 13 0.0284
• Situação dos Alunos em 2017
Ativos : 99 alunos estavam ativos, o que representa aproximadamente 21,6% do total. Concluídos : 106 alunos concluíram o curso, correspondendo a cerca de 23,1% do total. Evadidos : 253 alunos foram evadidos, representando 55,2% do total.
Esses dados mostram que mais da metade dos alunos deixaram o curso sem conclusão (evadidos), enquanto 21,6% estavam ativos em 2017. A taxa de conclusão foi apenas de aproximadamente 23,1%.
Os maiores percentuais de alunos que evadiram são vistos nos quatro primeiros anos. A conclusão apresenta percentuais pequenos ou zerados nos primeiros anos, mostrando aumento mais significativo em torno do quarto ano, o que é esperado dado que se faz necessário cursar disciplinas antes de estar apto a concluir o curso, exceto para os alunos reingressantes ou transferidos com parte das disciplinas já cursadas.
## # A tibble: 3 × 3
## SITUACAO2017_1 count percentage
## <chr> <int> <dbl>
## 1 Ativo 99 21.6
## 2 Concluso 106 23.1
## 3 Evadido 253 55.2
A Função de Incidência Acumulada (FIA) representa a probabilidade acumulada de ocorrência de falhas atribuídas à causa k até um determinado tempo, levando em consideração a possibilidade de eventos concorrentes. Essa função fornece uma visão descritiva inicial sobre a distribuição temporal dos eventos concorrentes, evidenciando como cada causa contribui para a incidência ao longo do tempo.
As curvas da FIA para os dois eventos sugerem que os alunos têm maior propensão a experimentar a evasão antes da conclusão. Nos primeiros anos, espera-se que a FIA permaneça próxima de zero, considerando que os cursos tem uma duração típica de 4 anos. Ao final de 8 anos, a probabilidade de conclusão foi estimada em aproximadamente 0,21, enquanto a probabilidade de evasão já era superior a isto nos primeiros anos.
• FIA geral
Para analisar como as características dos alunos estão associadas ao evento de interesse, utilizou-se a Função de Incidência Acumulada (FIA) para estimar a probabilidade de ocorrência dos desfechos de conclusão e evasão de acordo com as categorias e foi utilizado o teste de Gray para verificar se duas categorias das covariáveis consideradas eram significativamente diferentes para cada eventos deinteresse ao nível de significância de 10%.
A hipótese alternativa é de que pelo menos uma categoria difere das demais. Por exemplo, para a variável sexo e para o evento conclusão as hipóteses (nula e alternativa) são:
Hipótese Nula (H0): As curvas de incidência cumulativa são iguais entre os grupos (isto é, H0: conclusão_feminino = conclusão_masculino)
Hipótese Alternativa (H1): As curvas de incidência cumulativa são diferentes entre os grupos (isto é, H1: conclusão_feminino ≠ conclusão_masculino)
As variáveis que possuíam mais de 2 categorias, foram dicotomizadas para serem analisadas, de acordo com uma categoria de interesse, como por exemplo, idade (maior e menor que a mediana), turno que frequenta (noturno e não noturno) e raça (branca e não branca).
A seguir as curvas das FIAs e seus respectivos testes de acordo com as covariáveis consideradas.
• FIA por sexo
## stat pv df
## 1 8.274424 0.004020741 1
## 2 5.906479 0.015085292 1
• FIA por raça
## stat pv df
## 1 11.044326 0.0008895906 1
## 2 5.849172 0.0155843834 1
• FIA por idade
## stat pv df
## 1 9.351636 0.002227865 1
## 2 6.993058 0.008182645 1
• FIA por turno
## stat pv df
## 1 6.093203 0.01357029 1
## 2 3.327201 0.06814276 1
Conforme analisado acima, para todas as variáveis, as curvas de incidência são diferentes ao nível de significância de 10% (valor-p < 0,1), o que permite traçar o perfil dos alunos com maior probabilidade de conclusão ou evasão, considerando essas características.
Os resultados indicam que as mulheres, pessoas não brancas, com idade abaixo da mediana (mais novas) e matriculadas em cursos diurnos apresentam maior propensão à conclusão dos cursos (representadas pelas linhas pretas). Em contrapartida, os homens, pessoas brancas, com idade acima da mediana (mais velhos) e matriculados em cursos noturnos são mais propensos à evasão (representados pelas linhas vermelhas).
Ajuste clássico do modelo de causa específica com distribuição de linha de base Weibull.
O parâmetro \(\lambda\) controla a taxa basal de risco do evento. Um valor de menor indica uma taxa de risco mais baixa, enquanto valores maiores indicam uma taxa basal de risco mais alta. Ele se ajusta à posição da curva da função de risco, mas não altera sua forma. Nos nossos modelos, o lambda do modelo Evasão é 0,0344, maior do que o observado no modelo de conclusão (0.0080), revelando uma taxa basal de risco de evasão mais alta em comparação com a de conclusão.
Em ambos os modelos \(\alpha>1\) o que indica que o risco basal é crescente ao longo do tempo, isso sugere que, conforme o tempo passa, a probabilidade de conclusão/evasão aumenta, ou que é consistente com a expectativa de que os alunos tendem a concluir/evadir o curso conforme avançam nos estudos.
Os valores de \(exp(\beta)\) fornecem as razões de risco associadas às covariáveis do modelo. A seguir interpretamos cada modelo separadamente.
• Modelo Conclusão
O modelo de Conclusão revela que a taxa de conclusão nos cursos de Estatística, Física e Matemática da USP é 28% menor para homens em comparação com mulheres. Para alunos da raça branca, a taxa de conclusão é 40% inferior em relação aos alunos não brancos. Além disso, observe-se que, para cada ano adicional de idade, a taxa de conclusão reduz-se em 4,7%. Por fim, para alunos matriculados no período noturno, a taxa de conclusão é 28% menor em comparação com a dos alunos dos demais turnos.
## Estimação de lambda: 0.008082733
## Estimação de alpha: 2.928962
## Estimação de exp(beta): 0.7203619 0.6021471 0.9536952 0.7236352
• Modelo Evasão
O modelo de Evasão indica que a taxa de evasão nos cursos de Estatística, Física e Matemática da USP é 1,38 vezes maior para homens em comparação com mulheres. Para alunos da raça branca, a taxa de evasão é 27% superior em relação aos alunos não brancos. Além disso, observe-se que, para cada ano adicional de idade, a taxa de evasão aumenta em 0,3%. Por fim, para alunos matriculados no período noturno, a taxa de evasão é 8% maior em comparação com os alunos dos demais turnos.
## Estimação de lambda: 0.03435324
## Estimação de alpha: 1.384853
## Estimação de exp(beta): 1.385622 1.274394 1.003506 1.089917
Apó fazermos o diagnóstico do modelo, através dos residuos, a seguir temos a comparação da FIA empirica e ajustada pelo modelo causa especifica Weibull.
Com base na modelagem considerada e parâmetros estimados, considerando dois perfis, vamos comparar as FIAs estimada de acordo com cada covariavel fixada e as demais fixas:
• Sexo
comparação de dois alunos de 19 anos, de raça branca e turno noturno.
• Raça
comparação de dois alunos do sexo masculino, idade de 19 anos e turno noturno.
• Idade
comparação de dois alunos do sexo masculino, da raça branca e turno noturno.
• Turno
comparação de dois alunos do sexo masculino, da raça branca e idade de 19 anos.
Nas predições acima das FIAs para comparar indivíduos com dois perfis diferentes, corroboramos as informações das análises descritivas e identificamos reforçamos os perfis mais propensos aos eventos de interesse.