REGRESSÃO LOGÍSTICA
REGRESSÃO LOGÍSTICA PARA ANÁLISE DOS FATORES DETERMINANTES NO CONSUMO DE ÁLCOOL DOS ESTUDANTES DE MATEMÁTICA EM DIAS DE AULA
Biblioteca e Pacotes necessários para realização da análise
Chamando a base de dados
dados = read_excel("C:/Users/Denilson/Desktop/8° Periodo/MODELOS LINEARES GENERALIZADOS/Trabalho de MLG/Denilson - Trabalho final/Trabalho 1/Base de dados/Base de dados final/Trabalho_Final_de_Mlg.xlsx")
attach(dados)Colocando no lugar de 0 e 1 - não e sim na variável resposta
Colocando as variáveis qualitativas como factor
variaveis_para_factor <- c(
'Suporte Educacional extra',
'Apoio educacional familiar',
'Atividades extrascurriculares',
'Frequentou creche',
'Tem acesso a internet em casa?',
'Está em um relacionamento?',
'Escola',
'Sexo',
'Endereço',
'Tamanho da família',
'Estado civil dos pais',
'Escolaridade da mãe',
'Escolaridade do pai',
'Trabalho da mãe',
'Trabalho do pai',
'Tutor do aluno',
'Tempo de viagem de casa para a escola',
'Tempo de estudo semanal',
'Qualidade das relações famíliares',
'Tempo livre depois da escola',
'Sair com os amigos',
'Consumo de álcool no final de semana',
'Estado de saúde',
'Consumo de álcool em dia de aula')Resumo
O consumo de álcool entre estudantes do ensino médio é uma questão relevante, tanto para a educação quanto para a saúde pública, especialmente no contexto escolar. Este estudo buscou entender esse comportamento, com foco em alunos de matemática, utilizando a regressão logística como ferramenta analítica para classificar e prever o comportamento dos alunos em relação ao consumo de álcool durante os dias letivos. A regressão logística é amplamente utilizada em estudos em que a variável de interesse é binária, como neste caso, no os alunos são classificados entre aqueles que consomem ou não álcool nos dias de aula.
Introdução
O consumo de álcool entre adolescentes tem sido uma preocupação crescente, especialmente devido aos impactos negativos que podem afetar tanto a saúde quanto o desempenho acadêmico (OMS, 2018). No ambiente escolar, em que os jovens estão em fase de formação, o consumo de bebidas pode ter consequências graves, afetando o comportamento, o rendimento escolar e as relações sociais (Silva & Ferreira, 2019). A adolescência é uma fase de descobertas e, muitas vezes, de exposição a comportamentos de risco, como o consumo precoce de álcool, que pode ser influenciado por uma série de fatores pessoais, sociais e familiares (Carlson & Johnson, 2017). No Brasil, estudos mostram que o consumo de álcool entre estudantes tem aumentado, evidenciando a necessidade de uma maior conscientização e intervenção preventiva. Segundo o IBGE (2019), aproximadamente 55% dos adolescentes no país já experimentaram algum tipo de bebida alcoólica antes dos 18 anos, o que levanta preocupações sobre os efeitos a longo prazo. O ambiente familiar, as relações com colegas e o desempenho acadêmico são fatores que podem tanto incentivar quanto inibir o consumo de álcool entre os jovens. Como afirma Silva e Costa (2020), “as influências sociais desempenham um papel crucial nas decisões de consumo entre adolescentes”. Para se conseguir identificar quais fatores influenciam no consumo de álcool entre os estudantes de matemática. Será aplicada a regressão logística, uma técnica estatística que permite prever resultados binários, como a presença ou ausência de consumo de álcool em dias de aula. Segundo Hosmer, Lemeshow e Sturdivant (2013), “a regressão logística é uma ferramenta eficaz para modelar a probabilidade de eventos binários”.
Objetivos
Investigar os fatores associados ao consumo de álcool em dias de aula entre estudantes, identificando grupos de maior risco e padrões de comportamento, com a intenção de subsidiar políticas educacionais e estratégias de intervenção para reduzir esse consumo.
Avaliar como variáveis independentes (como escolaridade dos pais, apoio educacional, e qualidade das relações familiares) influenciando o consumo de álcool no dia de aula. Isso pode ajudar a identificar grupos em maior risco.
Metodologia
1.1. Materias
Como o intuito deste estudo é avaliar como diversas variáveis influenciam o consumo de álcool em dias de aula entre estudantes de matemática. Para isso, utilizaremos um banco de dados reais obtidos no kaggle , contendo 395 observações e 27 variáveis descritas em anexo. As variáveis idade, número de faltas escolares e, entre outras quantitativas, já a escola, o estado civil dos pais e o suporte educacional extra, as demais são variáveis categóricas.
1.2. Função de ligação
A função de ligação é uma função matemática que conecta a média da variável de resposta com os preditores, sendo essencial para modelar a relação entre eles. Ela transforma a escala da resposta variável, permitindo que o modelo seja configurado corretamente. Existem diferentes tipos de função de ligação, dependendo da natureza dos dados:
Logit : Usado para dados binários, como comprar ou não um determindado produto, onde a variável resposta tem dois valores possíveis.
Log : Aplicada a dados de contagem, como o número de pacientes atendidos em um hospital ou quantidade de vendas de um produto, onde a variável resposta é um número inteiro positivo.
Identidade : Utilizada para dados contínuos, especialmente quando a variável resposta não é simétrica, como peso de recém-nasciddos, em uma população, tempo de recuperação após uma cirurgia ou gastos mensais de famílias com alimentação.
Além disso, o componente sistemático inclui os preditores, que são as variáveis independentes usadas para modelar a média da resposta, ou seja, elas explicam como as mudanças nos preditores afetam o comportamento da variável resposta.
1.3. Modelo logístico
O modelo nos proporciona informações valiosas sobre os determinantes no consumo de álcool dos estudantes de matemática, que é composto por:
\[ \text{Logit}(p) = \ln\left(\frac{p}{1-p}\right) = \beta_0 + \beta_1\chi_1 + \ldots + \beta_i\chi_i + \varepsilon_i \]
Em que:
- \(p\): a probabilidade do consumo de álcool em dia de aula;
- \(\frac{p}{1-p}\): a razão de chance do consumo de álcool em dias de aula;
- \(\beta_0\): o intercepto;
- \(\beta_1, \beta_2, \ldots, \beta_n\): os coeficientes das variáveis independentes \(\chi_1, \chi_2, \ldots, \chi_n\);
- \(\varepsilon_i\): o erro aleatório.
1.4. Métricas de ajustes para o modelo
O método stepwise é uma técnica de seleção de variáveis amplamente utilizada em análises de regressão. Que consiste na inclusão ou exclusão de variáveis em etapas, passando a identificar o modelo mais adequado com base nos dados disponíveis. Existem três principais abordagens desse método: seleção progressiva “forward stepwise”, seleção regressiva “backward stepwise”, e uma combinação de ambas “both stepwise” ( DRAPER & SMITH, 1998).
Pseudo \(R^2\), Uma métrica comumente utilizada para avaliar o ajuste de modelos em contextos de regressão logística é o pseudo R², sendo o índice de McFadden um dos mais populares. Esse índice varia de 0 a 1, onde valores mais próximos de 1 indicam um melhor ajuste do modelo (McFadden, 1974; Long, 1997).
A Curva ROC, é um gráfico amplamente utilizado para avaliar o desempenho de modelos de classificação binária, especialmente na análise de modelos preditivos. Essa curva é gerada ao plotar a taxa de verdadeiros positivos (sensibilidade) contra a taxa de falsos positivos (1 - especificidade) em vários limiares de decisão, facilitando a visualização da capacidade discriminatória do modelo. A área Sob a Curva ROC, que é o(AUC) representa uma métrica quantitativa que indica a precisão geral do modelo, onde valores mais próximos de 1 indicam melhor desempenho (HANLEY e MCNEIL, 1982).
Critério de Informação de Akaike (AIC) é uma ferramenta estatística utilizada para avaliar a qualidade de um modelo, levando em consideração tanto o ajuste do modelo aos dados quanto à sua complexidade. Ele penaliza modelos mais complexos, favorecendo aqueles que descrevem os dados de forma eficiente com um menor número de parâmetros. A AIC é amplamente empregada na seleção de modelos, onde valores mais baixos indicam uma melhor qualidade do modelo, e mensura a qualidade de um modelo estatístico visando também a sua simplicidade (AKAIKE, 1973).
Matriz de confusão é amplamente utilizada na prática, pois não permite apenas avaliar o desempenho global do modelo, mas também identificar tipos específicos de erros, o que pode fornecer insights detalhados para melhorias futuras. Em suma, ela é uma ferramenta indispensável para entender a eficácia de modelos de classificação em diversas aplicações (SUGIYAMA et al., 2012), dado por:
| Preditos | ||
|---|---|---|
| Reais | Verdadeiros Positivos | Falsos Negativos |
| Falsos Positivos | Verdadeiros Negativos | |
Em que:
Verdadeiros Positivos: Número de instâncias que foram corretamente previstas como positivas.
Falsos Negativos: Número de instâncias que são realmente positivas, mas foram previstas como negativas.
Falsos Positivos: Número de instâncias que são realmente negativas, mas foram previstas como positivas.
Verdadeiros Negativos: Número de instâncias que foram corretamente previstas como negativas.
Análise descritiva
Obtendo as medidas descritivas. Para as variáveis quantitativas.
Inicialmente, de acordo com a análise descritiva das variáveis, podemos analisar alguns pontos interessantes.
## Idade Número.de.reprovação.em.classes.anteriores
## nobs 395.000 395.000
## NAs 0.000 0.000
## Minimum 15.000 0.000
## Maximum 22.000 3.000
## 1. Quartile 16.000 0.000
## 3. Quartile 18.000 0.000
## Mean 16.696 0.334
## Median 17.000 0.000
## Sum 6595.000 132.000
## SE Mean 0.064 0.037
## LCL Mean 16.570 0.261
## UCL Mean 16.822 0.408
## Variance 1.628 0.553
## Stdev 1.276 0.744
## Skewness 0.463 2.369
## Kurtosis -0.031 4.886
## Números.de.faltas.escolares
## nobs 395.000
## NAs 0.000
## Minimum 0.000
## Maximum 75.000
## 1. Quartile 0.000
## 3. Quartile 8.000
## Mean 5.709
## Median 4.000
## Sum 2255.000
## SE Mean 0.403
## LCL Mean 4.917
## UCL Mean 6.501
## Variance 64.050
## Stdev 8.003
## Skewness 3.644
## Kurtosis 21.307
Os resultados, indicam que a maioria dos estudantes tem entre 15 e 22 anos, com uma média de 16 anos e uma variação significativa nas idades. Em relação ao número de reprovações nas classes anteriores, a grande maioria dos alunos não teve reprovações, refletindo um desempenho acadêmico positivo, com uma média de 0,34 reprovações. Por outro lado, as faltas escolares mostram uma média de 5,71 ausências, mas a alta variância indica que, enquanto muitos alunos aparecem regularmente, alguns apresentam um número elevado de faltas, indicando a necessidade de atenção a esses casos extremos.
para as quantitativas
Podemos observar, graficamente
Obtendo medidas descritivas. Para as variáveis Categóricas
As Figuras a seguir, apresentam os resultados da descritiva para as variáveis categóricas. Esses dados fornecem uma visão abrangente da distribuição e variabilidade das variáveis verificadas.
Com uma função para gerar tabelas de frequência para cada variável categórica a partir do for
##
## Attaching package: 'gridExtra'
## The following object is masked from 'package:dplyr':
##
## combine
Logo abaixo, examinamos as relações entre as variáveis independente e a variável dependente (Consumo de álcool em dia de aula). resumindo os coeficientes de regressão estimados para cada variável independente, juntamente com outras estatísticas relevantes, como p-valor, e o valor z.
Ajutando o modelo inicial, com todas as variáveis.
1°: Modelo inicial
Curva ROC e gráfico de envelope - Para o modelo inicial
## Binomial model
## [1] "AUC = 0.942"
Matriz de confusão - para o modelo inicial
## Real
## Predito Não Sim
## Não 249 24
## Sim 27 95
No modelo inicial a maioria das variáveis não foram significativas, ou seja, não contribuiu de forma relevante para o consumo de álcool em dias de aula. Por isso, precisamos aplicar um método de seleção de variáveis e verificar o Vif, para identificar quais variáveis são realmente importantes e quais devem ser removidas. A seleção de variáveis é importante porque melhora a precisão e a interpretabilidade do modelo, removendo variáveis irrelevantes. Aplicando esses métodos, podemos comparar diferentes modelos e escolher o que apresenta o melhor desempenho com o menor número de variáveis. Assim, garantimos que o modelo final seja eficiente e fácil de interpretar.
2°: Modelo, com base nas varíaveis que se demonstram aceitáveis pelo VIF.
2°: Segundo Modelo
Curva ROC e gráfico de envelope - Para o Segundo modelo
## Binomial model
## [1] "AUC = 0.723"
Matriz de confusão - para o Segundo modelo
## Real
## Predito Não Sim
## Não 262 88
## Sim 14 31
O modelo inicial e o modelo com base no critério de VIF apresentam problemas que afetam sua confiabilidade e interpretação. No modelo inicial, o gráfico de envelope mostra mais de 5% dos pontos fora, estabelece um mal ajuste, e o alto VIF em várias variáveis indicando multicolinearidade elevada.
Embora esses dois modelos apresentem análises de desempenho melhores como (Curva ROC, precisão e acurácia), o modelo ajustado pelo método stepwise, mostra-se mais parcimonioso, reduzindo a complexidade do modelo ao manter apenas as variáveis essenciais. Esse modelo não apenas minimiza a multicolinearidade, mas também melhorou a interpretabilidade e a robustez da análise, tornando-se uma escolha melhor para garantir confiabilidade nas interpretações dos coeficientes
3°: modelo atraves do metodo stepwise, afim de chegar uma combinação de variáveis adequada.
## Start: AIC=468.28
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Idade +
## Endereço + `Estado civil dos pais` + `Tutor do aluno` +
## `Tempo de estudo semanal` + `Número de reprovação em classes anteriores` +
## `Suporte Educacional extra` + `Apoio educacional familiar` +
## `Atividades extrascurriculares` + `Frequentou creche` + `Tem acesso a internet em casa?` +
## `Está em um relacionamento?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - `Tutor do aluno` 2 431.26 465.26
## - `Tempo de estudo semanal` 3 433.78 465.78
## - `Frequentou creche` 1 430.28 466.28
## - `Estado civil dos pais` 1 430.29 466.29
## - `Suporte Educacional extra` 1 430.29 466.29
## - `Apoio educacional familiar` 1 430.34 466.34
## - Idade 1 430.51 466.51
## - `Está em um relacionamento?` 1 430.59 466.59
## - Escola 1 430.85 466.85
## - `Tem acesso a internet em casa?` 1 431.55 467.55
## <none> 430.28 468.28
## - `Atividades extrascurriculares` 1 432.54 468.54
## - `Números de faltas escolares` 1 433.26 469.26
## - Endereço 1 433.80 469.80
## - `Número de reprovação em classes anteriores` 1 437.20 473.20
## - Sexo 1 445.25 481.25
##
## Step: AIC=465.26
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Idade +
## Endereço + `Estado civil dos pais` + `Tempo de estudo semanal` +
## `Número de reprovação em classes anteriores` + `Suporte Educacional extra` +
## `Apoio educacional familiar` + `Atividades extrascurriculares` +
## `Frequentou creche` + `Tem acesso a internet em casa?` +
## `Está em um relacionamento?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - `Tempo de estudo semanal` 3 434.80 462.80
## - `Frequentou creche` 1 431.26 463.26
## - `Suporte Educacional extra` 1 431.28 463.28
## - `Estado civil dos pais` 1 431.31 463.31
## - `Apoio educacional familiar` 1 431.32 463.32
## - Idade 1 431.40 463.40
## - `Está em um relacionamento?` 1 431.59 463.59
## - Escola 1 431.99 463.99
## - `Tem acesso a internet em casa?` 1 432.68 464.68
## <none> 431.26 465.26
## - `Atividades extrascurriculares` 1 433.55 465.55
## - `Números de faltas escolares` 1 433.98 465.98
## - Endereço 1 434.66 466.66
## - `Número de reprovação em classes anteriores` 1 438.21 470.21
## - Sexo 1 446.58 478.58
##
## Step: AIC=462.8
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Idade +
## Endereço + `Estado civil dos pais` + `Número de reprovação em classes anteriores` +
## `Suporte Educacional extra` + `Apoio educacional familiar` +
## `Atividades extrascurriculares` + `Frequentou creche` + `Tem acesso a internet em casa?` +
## `Está em um relacionamento?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - `Apoio educacional familiar` 1 434.82 460.82
## - `Frequentou creche` 1 434.82 460.82
## - `Suporte Educacional extra` 1 434.83 460.83
## - `Estado civil dos pais` 1 434.85 460.85
## - Idade 1 434.85 460.85
## - `Está em um relacionamento?` 1 435.27 461.27
## - `Tem acesso a internet em casa?` 1 435.90 461.90
## - Escola 1 435.96 461.96
## <none> 434.80 462.80
## - `Atividades extrascurriculares` 1 437.65 463.65
## - Endereço 1 437.73 463.73
## - `Números de faltas escolares` 1 438.49 464.49
## - `Número de reprovação em classes anteriores` 1 443.73 469.73
## - Sexo 1 458.11 484.11
##
## Step: AIC=460.82
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Idade +
## Endereço + `Estado civil dos pais` + `Número de reprovação em classes anteriores` +
## `Suporte Educacional extra` + `Atividades extrascurriculares` +
## `Frequentou creche` + `Tem acesso a internet em casa?` +
## `Está em um relacionamento?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - `Frequentou creche` 1 434.84 458.84
## - `Suporte Educacional extra` 1 434.85 458.85
## - `Estado civil dos pais` 1 434.87 458.87
## - Idade 1 434.87 458.87
## - `Está em um relacionamento?` 1 435.28 459.28
## - Escola 1 435.96 459.96
## - `Tem acesso a internet em casa?` 1 435.97 459.97
## <none> 434.82 460.82
## - `Atividades extrascurriculares` 1 437.67 461.67
## - Endereço 1 437.78 461.78
## - `Números de faltas escolares` 1 438.51 462.51
## - `Número de reprovação em classes anteriores` 1 443.75 467.75
## - Sexo 1 458.46 482.46
##
## Step: AIC=458.84
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Idade +
## Endereço + `Estado civil dos pais` + `Número de reprovação em classes anteriores` +
## `Suporte Educacional extra` + `Atividades extrascurriculares` +
## `Tem acesso a internet em casa?` + `Está em um relacionamento?` +
## `Números de faltas escolares`
##
## Df Deviance AIC
## - `Suporte Educacional extra` 1 434.87 456.87
## - Idade 1 434.89 456.89
## - `Estado civil dos pais` 1 434.89 456.89
## - `Está em um relacionamento?` 1 435.31 457.31
## - `Tem acesso a internet em casa?` 1 435.99 457.99
## - Escola 1 436.01 458.01
## <none> 434.84 458.84
## - `Atividades extrascurriculares` 1 437.68 459.68
## - Endereço 1 437.82 459.82
## - `Números de faltas escolares` 1 438.52 460.52
## - `Número de reprovação em classes anteriores` 1 443.87 465.87
## - Sexo 1 458.47 480.47
##
## Step: AIC=456.87
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Idade +
## Endereço + `Estado civil dos pais` + `Número de reprovação em classes anteriores` +
## `Atividades extrascurriculares` + `Tem acesso a internet em casa?` +
## `Está em um relacionamento?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - Idade 1 434.90 454.90
## - `Estado civil dos pais` 1 434.92 454.92
## - `Está em um relacionamento?` 1 435.35 455.35
## - `Tem acesso a internet em casa?` 1 436.02 456.02
## - Escola 1 436.03 456.03
## <none> 434.87 456.87
## - `Atividades extrascurriculares` 1 437.69 457.69
## - Endereço 1 437.85 457.85
## - `Números de faltas escolares` 1 438.59 458.59
## - `Número de reprovação em classes anteriores` 1 444.02 464.02
## - Sexo 1 458.84 478.84
##
## Step: AIC=454.9
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Endereço +
## `Estado civil dos pais` + `Número de reprovação em classes anteriores` +
## `Atividades extrascurriculares` + `Tem acesso a internet em casa?` +
## `Está em um relacionamento?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - `Estado civil dos pais` 1 434.96 452.96
## - `Está em um relacionamento?` 1 435.37 453.37
## - `Tem acesso a internet em casa?` 1 436.03 454.03
## - Escola 1 436.44 454.44
## <none> 434.90 454.90
## - `Atividades extrascurriculares` 1 437.77 455.77
## - Endereço 1 437.89 455.89
## - `Números de faltas escolares` 1 439.01 457.01
## - `Número de reprovação em classes anteriores` 1 444.81 462.81
## - Sexo 1 458.92 476.92
##
## Step: AIC=452.96
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Endereço +
## `Número de reprovação em classes anteriores` + `Atividades extrascurriculares` +
## `Tem acesso a internet em casa?` + `Está em um relacionamento?` +
## `Números de faltas escolares`
##
## Df Deviance AIC
## - `Está em um relacionamento?` 1 435.43 451.43
## - `Tem acesso a internet em casa?` 1 436.15 452.15
## - Escola 1 436.53 452.53
## <none> 434.96 452.96
## - `Atividades extrascurriculares` 1 437.77 453.77
## - Endereço 1 437.98 453.98
## - `Números de faltas escolares` 1 439.01 455.01
## - `Número de reprovação em classes anteriores` 1 444.89 460.89
## - Sexo 1 458.96 474.96
##
## Step: AIC=451.43
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Endereço +
## `Número de reprovação em classes anteriores` + `Atividades extrascurriculares` +
## `Tem acesso a internet em casa?` + `Números de faltas escolares`
##
## Df Deviance AIC
## - `Tem acesso a internet em casa?` 1 436.50 450.50
## - Escola 1 436.89 450.89
## <none> 435.43 451.43
## - `Atividades extrascurriculares` 1 438.35 452.35
## - Endereço 1 438.40 452.40
## - `Números de faltas escolares` 1 439.16 453.16
## - `Número de reprovação em classes anteriores` 1 445.03 459.03
## - Sexo 1 460.30 474.30
##
## Step: AIC=450.5
## `Consumo de álcool em dia de aula` ~ Escola + Sexo + Endereço +
## `Número de reprovação em classes anteriores` + `Atividades extrascurriculares` +
## `Números de faltas escolares`
##
## Df Deviance AIC
## - Escola 1 437.86 449.86
## <none> 436.50 450.50
## - Endereço 1 438.87 450.87
## - `Atividades extrascurriculares` 1 439.28 451.28
## - `Números de faltas escolares` 1 440.76 452.76
## - `Número de reprovação em classes anteriores` 1 445.76 457.76
## - Sexo 1 461.80 473.80
##
## Step: AIC=449.86
## `Consumo de álcool em dia de aula` ~ Sexo + Endereço + `Número de reprovação em classes anteriores` +
## `Atividades extrascurriculares` + `Números de faltas escolares`
##
## Df Deviance AIC
## <none> 437.86 449.86
## - `Atividades extrascurriculares` 1 441.20 451.20
## - Endereço 1 441.62 451.62
## - `Números de faltas escolares` 1 441.64 451.64
## - `Número de reprovação em classes anteriores` 1 447.25 457.25
## - Sexo 1 462.85 472.85
##
## Call: glm(formula = `Consumo de álcool em dia de aula` ~ Sexo + Endereço +
## `Número de reprovação em classes anteriores` + `Atividades extrascurriculares` +
## `Números de faltas escolares`, family = binomial(link = "logit"),
## data = dados)
##
## Coefficients:
## (Intercept)
## -1.17643
## SexoMasculino
## 1.17021
## EndereçoUrbano
## -0.52720
## `Número de reprovação em classes anteriores`
## 0.45344
## `Atividades extrascurriculares`sim
## -0.43112
## `Números de faltas escolares`
## 0.02723
##
## Degrees of Freedom: 394 Total (i.e. Null); 389 Residual
## Null Deviance: 483.4
## Residual Deviance: 437.9 AIC: 449.9
3°: Terceiro Modelo
Curva ROC e gráfico de envelope - Para o Terceiro modelo
## Binomial model
## [1] "AUC = 0.717"
Matriz de confusão - para o Terceiro modelo
## Real
## Predito Não Sim
## Não 259 95
## Sim 17 24
Conclusão
Com isso o modelo indica que fatores como o aluno ser do sexo masculino e o seu número de reprovações estão associados a uma maior probabilidade de consumo de álcool em dias de aula entre estudantes de matemática. Por outro lado, morar em uma área urbana e participar de atividades extracurriculares parece reduzir essa probabilidade, esses fatores sugerem que o consumo de álcool pode estar relacionado tanto a características individuais quanto a fatores ambientais e comportamentais, como o contexto familiar e social. Logo concluimos com os resultados obtidos pelo modelo stepwise, foram bastante satisfatórios na identificação das variáveis que influenciam o consumo de álcool em dias de aula dos estudantes de matemática. Esse estudo pode, orientar políticas escolares, municipais e estaduais para desenvolver programas de prevenção ao consumo de álcool que levem em conta as particularidades do público estudantil. Ao priorizar esses fatores, escolas e formuladores de políticas podem construir um ambiente educacional que não apenas previna o consumo de álcool, mas também melhore o bem-estar geral e o desempenho acadêmico dos estudantes.