Análise descritiva das taxas de retenção e indice de níveis negativos.

POAT/PIICIE

Introdução

Nesta seção serão apresentados os resultados obtidos através da análise descritiva a partir de tabelas, quadros e gráficos descrevendo de maneira resumida o comportamento dos dados de taxa de retenção nos períodos de 2017 a 2019.

1. Análise descritiva das taxas de retenção

Tabela 1 - Medidas de resumo dos dados de taxa de retenção nos períodos de 2017 a 2019.

Medidas Valor
MINIMO 0,00
1º QUARTIL 3,20
MEDIANA 6,70
MÉDIA 7,9
DESVIO 6,04
3º QUARTIL 11,50
MÁXIMO 40,70
NÃO IDENTIFICADOS 185,00

Na tabela 1 o menor valor da taxa de retenção identificado foi igual a 0 entre os períodos de 2017 a 2019. Em seguida temos no 1º quartil 3,2 de taxa de retenção, o que indica que 25% das escolas analisadas nos períodos citadas anteriormente retem apenas uma taxa de 3,2 dos alunos. Por seguinte, temos a mediana, que não apresenta nos seus resultados influência de valores extremos, possuindo uma taxa de retenção menor que a média, indicando uma assimetria negativa, ou seja, existe uma maior concentração de valores na zona de valores mais elevados significando maiores taxas de retenção nos períodos de 2017 a 2019. Além disso, temos que em média a taxa de retenção é igual a 7,9 com desvio de 6,04 nos mostrando que em média teremos uma taxa de retenção entre 1,86 e 13,94. Também se obteve outras medidas como o 3º quartil, representando a taxa de retenção em 75% das escolas igual a 11,5; o máximo com retenção igual a 40,7 e por fim, os não identificados, que são dados coletados em que não houveram informações que possibilitassem o cálculo. Dessa forma, temos que das 2.502 observações 185 não apresentavam informação, representando menos de 8% dos dados.

2. Medidas separatrizes

Figura 1 – Dados da taxa de retenção nos períodos de 2017 a 2019.

lustrando os dados do Quadro 1 na figura 1 percebe-se que a vantagem do boxplot em relação as medidas de resumos é a detecção dos outliers. Assim, percebe-se a presença de muito outliers à direita, ou seja, muito valores altos em relação a média dos dados, indicando possibilidade de erro nas taxas de retenção que apresentam valores altos. Por fim, temos a linha tracejada de vermelho indicando a média.

3. Histogramas e gráficos de densidade

Figura 2 – Histograma e densidade dos dados de taxa de retenção nos períodos de 2017 a 2019.

Na figura 2 verifica-se que os dados possuem distribuições não normais assimétricas, com maior quantitativo de valores para as menores taxas de retenção e menor quantitativo de valores para as menores taxas de retenção, indicando que nos períodos de 2017 a 2019 poucas escolas atingiram altas taxas de retenção.

4. Quantitativo de escolas por período e ciclo

Tabela 2 – Quantitativo de escolas por ciclo nos períodos de 2017 a 2019.

Na tabela 1identificamos que as observações foram coletadas de forma uniforme nos três ciclos e períodos, representando assim por ciclo e período 33% das observações totais.

Tabela 3 – Quantitativo de escolas por taxa de retenção e município nos períodos de 2017 a 2019.

Na tabela 3 identificamos que o município com maior taxa de retenção nos períodos de 2017 a 2019 é Albufeira com 140,1 e o menor Castela de Vide com 4,4. A partir da mesma identifica-se que 50% dos dados apresentam taxa de retenção total maior que 76,8. Entretanto, ao analisarmos o rank de forma individual por período temos dados diferenciados. Assim para 2017 a maior taxa de retenção é obtida pelo município de Cadaval com 62,6; em 2018 o município de Amadora com 52,7 e por fim em 2019 o município de Golegã com 48,2.

5. Análise descritiva sobre os níveis negativos

Tabela 4 - Medidas de resumo dos dados de níveis negativos nos períodos de 2014 a 2019.

Medidas Valor
MINIMO 0,00
1º QUARTIL 21,00
MEDIANA 37,00
MÉDIA 39,88
3º QUARTIL 56,00
MÁXIMO 166,00

Na tabela 4 o menor valor do índice de níveis negativos identificado foi igual a 0 entre os períodos de 2014 e 2019…

Após as análises serem feitas, identificamos certos padrões em relação aos níveis negativos. Segue:

Figura 3 – Gráfico de dispersão do índice de níveis negativos em comparação com a quantidade de matrícula.

# Diagrama de dispersão Níveis Negativos X Matrículas
ggplot(data = niveisNegativos, 
       aes(x = nn, y = matricula, color=ciclo)) +
  geom_point(shape=16,size=1) +
  geom_smooth(method = lm,size=0.5) +
  labs(y = "Matrícula", x = "Níveis Negativos", color = "Ciclo")

Na figura 3 observamos que há uma relação linear positiva entre a quantidade de matrículas e o índice de níveis negativos. Além disso, percebe-se que o ciclo “cb2” tende a ter menores valores de níveis negativos em relação ao ciclo “cb3”.

Figura 4 – Gráfico de dispersão do índice de níveis negativos em comparação com os municípios da área metropolitana do Porto.

# Diagrama de dispersão Níveis Negativos X Municípios
ggplot(data = niveisNegativos, 
       aes(x = nn, y = Município, color=ciclo)) +
  geom_point(size=1) +
  labs(y = "Município", x = "Níveis Negativos", color = "Ciclo")

Na figura 4 vê-se que em grande parte dos municípios a quantidade de níveis negativos é menor no ciclo “cb2”, em comparação com “cb3”. Um exemplo claro disso são os municípios de Santa Maria de Feira, Oliveira de Azeméis, Santo Tirso e Espinho.

Figura 5 – Box Plot do índice de níveis negativos em comparação com os anos escolares.

# Box plot Ano escolar X Níveis Negativos
ggplot(data = niveisNegativos) +
  geom_boxplot(aes(x = ANOESCOLAR, y = nn)) +
  labs(y = "Níveis Negativos", x = "Ano Escolar")

Na figura 5, levando em consideração as medianas, observa-se leve queda na distribuição dos dados dos índices negativos entre os anos de 2014 e 2019. Outra característica importante a ser notada é em relação a quantidade de outliers presentes, em sua maioria com valores acima de 100, mas com queda leve ao passar dos anos.

Figura 6 – Box Plot do índice de níveis negativos em comparação com os anos curriculares.

# Box plot Ano escolar X Níveis Negativos
ggplot(data = niveisNegativos) +
  geom_boxplot(aes(x = anocurricular, y = nn))+
  labs(y = "Níveis Negativos", x = "Ano Curricular")

Na figura 6 nota-se que há uma moderada diferença entre os alunos dos anos 5 e 6 em relação aos alunos dos anos 7, 8 e 9. Isso ocorre devido ao fato de que podemos dividir os alunos dos referidos anos acima e classificar como sendo dos ciclos “cb2” e “cb3”, respectivamente. Logo, pode-se confirmar o que a figura 4 nos mostra. Nota-se também que há valores extremos em ambos os anos escolares.

Figura 7 – Box Plot dos índices de níveis negativos em comparação com os municípios da área metropolitana do Porto.

# Box plot Municípios X Níveis Negativos
ggplot(data = niveisNegativos) +
  geom_boxplot(aes(x = Município, y = nn)) +
  theme(axis.text = element_text(size = 8, angle=45)) +
  labs(y = "Níveis Negativos", x = "Município")

Na figura 7 podemos ver detalhadamente como estão distribuídos os índices de níveis negativos em cada município da área metropolitana do Porto. Logo, vê-se que os municípios com menor índice são: Santo Tirso, Vale de Cambra, Espinho e São João da Madeira, devido suas distribuições estarem abaixo dos demais e possuírem poucos ou quase nenhum valor extremo. Por outro lado, também percebemos que Maia, Vila Nova de Gaia, Paredes e Matosinhos são os municípios que possuem os maiores índices negativos dessa região.

Figura 8 – Box Plot dos índices de níveis negativos em comparação com os ciclos de ensino.

# Box plot Ciclos X Níveis Negativos
ggplot(data = niveisNegativos) +
  geom_boxplot(aes(x = ciclo, y = nn)) +
  labs(y = "Níveis Negativos", x = "Ciclo")

A figura 8 mostra que mesmo obtendo valores extremos em ambos os ciclos, a mediana e a distribuição dos dados do ciclo “cb2” possuem níveis negativos menores em comparação com o ciclo “cb3”.

Figura 9 – Gráfico de dispersão da média dos índices de níveis negativos em comparação com os municípios da área metropolitana do Porto e intervalos de confiança.

# Gráfico de médias e intervalos de confiança

pacman::p_load(ggpubr)

# Níveis Negativos X Município
niveisNegativos |> filter(ciclo %in% c("cb2","cb3")) |> 
  ggplot(aes(x = nn, y = Município, color = ciclo)) +
  geom_point(stat = "summary", fun = "mean", 
             position = position_dodge(0.4)) +
  geom_errorbar(stat = "summary", fun.data = "mean_ci", 
              width = 0.3, position = position_dodge(0.4)) +
  labs(y = "Município", x = "Níveis Negativos", color = "Ciclo")

Na figura 9 utilizou-se como medida de tendência central a média dos níveis negativos em cada município, comparando com os ciclos de ensino e obtendo os intervalos de confiança para cada um. Nota-se que em média, mais de 94% dos municípios tendem a ter maiores índices de níveis negativos no ciclo “cb3”. Outrora, observa-se também que os municípios de Oliveira de Azeméis e São João da Madeira possuem em média, os menores valores de níveis negativos em ambos os ciclos de ensino.

Figura 10 – Gráfico de dispersão da média dos índices de níveis negativos em comparação com os municípios da área metropolitana do Porto e intervalos de confiança.

# Níveis Negativos X Ano Escolar
niveisNegativos |> filter(ciclo %in% c("cb2","cb3")) |> 
  ggplot(aes(x = nn, y = ANOESCOLAR, color = ciclo)) +
  geom_point(stat = "summary", fun = "mean", 
             position = position_dodge(0.4)) +
  geom_errorbar(stat = "summary", fun.data = "mean_ci", 
                width = 0.3, position = position_dodge(0.4)) +
  labs(y = "Ano Escolar", x = "Níveis Negativos", color = "Ciclo")

Na figura 10 pode-se observar que há uma queda no índice de níveis negativos em média, comparando os anos de 2014 a 2019. E acentuadamente, a média de diminuição de NN do ciclo “cb2” obteve maior êxito quando comparada ao ciclo “cb3”.