0.1 Resumo

O desemprego é uma questão relevante tanto para o mercado de trabalho quanto para as políticas públicas. Este estudo buscou entender o comportamento de pessoas enfrentando o desemprego. A análise de sobrevivência foi utilizada para examinar e prever o tempo até que um indivíduo encontre seu primeiro emprego formal. Esse método é amplamente aplicado em estudos onde o tempo até a ocorrência de um evento é a variável de interesse, como neste caso, em que o evento é a obtenção de um emprego. A partir da análise os resultados indicaram que fatores como ter um salário médio ou baixo e a participação em programas de seguro-desemprego estão associados a uma maior probabilidade de períodos de desemprego. Além disso, a idade, especialmente na faixa de 50 a 61 anos, também influencia essa probabilidade, enquanto a faixa etária de 30 a 39 anos não mostrou impacto significativo. Esses resultados indicam que o desemprego está relacionado a características individuais e fatores econômicos, incluindo o acesso a programas de apoio, como o seguro-desemprego.

0.2 Introdução

O desemprego é uma condição em que um indivíduo, motivado pela necessidade de trabalho, enfrenta dificuldades para encontrar uma oportunidade de emprego. As causas do desemprego são multifacetadas e podem ser temporárias, como períodos de transição entre empregos, ou decorrentes de mudanças nas exigências do mercado de trabalho, que muitas vezes deixam os trabalhadores sem as qualificações permitidas para as novas demandas (OCDE, 2020). Essa situação não afeta apenas o indivíduo, mas também gera repercussões significativas na economia. Os efeitos do desemprego vão além da esfera pessoal, afetando o consumo e, consequentemente, o crescimento econômico.

0.3 Objetivo

Analisar os fatores que influenciam a duração do desemprego e a probabilidade de reintegração ao mercado de trabalho, considerando o impacto do seguro-desemprego, da expectativa salarial e da idade.

0.4 Metodologia

0.4.0.1 1.1. Materias

Como o intuito deste estudo é avaliar os fatores que influenciam no desemprego. Para isso, utilizaremos um banco de dados reais obtidos no kaggle , contendo 3343 observações e 5 variáveis. Com as seguintes variáveis idade, seguro desemprego, salário, e o evento e período de desemprego que é a variável resposta.

0.4.0.2 1.2. Análise de sobrevivência

De acordo com a literatura estatística, a análise de sobrevivência é uma técnica poderosa usada para estudar o tempo até a ocorrência de um evento específico, como a obtenção de emprego, a recuperação em tratamentos de saúde ou a falência de empresas. Essa abordagem é amplamente aplicada em diversas áreas, como medicina, economia e ciências sociais, onde o interesse está em compreender como variáveis preditoras influenciam a “sobrevivência” até o evento de interesse (Colosimo & Giolo, 2006; Klein & Moeschberger, 2003). Tambem temos a falha é considerada o evento de interesse em nossa análise, representando o desfecho que buscamos observar ao longo do período treinado. Em nosso trabalho, esse evento de interesse é definido pelo fato de uma pessoa conseguir ou não um emprego. Assim, o estudo se concentra em identificar os fatores associados à ocorrência desse evento, proporcionando uma melhor compreensão dos aspectos que influenciam a transição do desemprego para o emprego. Dado por:

\[ \delta = \begin{cases} 0, & \text{Censura} \\ 1, & \text{Falha} \end{cases} \]

0.4.0.3 1.3. Função de sobrevivência de Kaplan Meier

A análise de sobrevivência é um conjunto de técnicas estatísticas utilizadas para estudar dados cujo objetivo principal é avaliar o tempo até a ocorrência de um evento específico. Esses eventos podem variar, incluindo falecimento de um paciente, falha de um componente, recuperação de uma doença, entre outros. Neste trabalho, será utilizado o estimador da função de sobrevivência de Kaplan-Meier, proposta por Kaplan e Meier em 1958. A expressão matemática do estimador é uma função degrau, \(\hat{S}(t)\), que apresenta saltos nos tempos observados de falha é a seguinte:

\[ \hat{S}(t) = \frac{\text{número de observações que não falharam até o tempo } t}{\text{n total de observações}} \]

0.4.0.4 1.4. Função densidade de sobrevivência

A função de densidade de sobrevivência descreve a taxa de ocorrência de falhas ou eventos ao longo do tempo em uma análise de sobrevivência. É uma medida que indica a probabilidade instantânea de que o evento ocorra em um pequeno intervalo de tempo após um determinado ponto, dado que o indivíduo, ou item ainda não ocorreu o evento. Geralmente representado como (t), ela está relacionada com a função de sobrevivência Ŝ(t), pois descreve o tempo exato de falha ou evento. A densidade de sobrevivência é útil para entender a distribuição temporal dos eventos e calcular outras métricas, como a função de risco.

0.4.0.5 1.5. Estimador de Kaplan Meier

O estimado de Kaplan-Meier, desenvolvido por Edward L. Kaplan e Paul Meier em 1958, é uma das ferramentas mais utilizadas na análise de sobrevivência. Ele permite estimar a função de sobrevivência de uma população com base em uma amostra, especialmente quando há censuras (indivíduos que não tiveram o evento de interesse observado até o fim do estudo). A função de sobrevivência Ŝ(t), estimado por Kaplan-Meier, é uma função em degraus, onde cada degrau ocorre em um tempo de falha observada, sendo ajustado com base na quantidade de indivíduos em risco naquele instante. Para calcular o estimador, considera-se a probabilidade de sobrevivência acumulada até cada ponto de falha, multiplicando-se como probabilidades de sobrevivência de cada intervalo. O método é amplamente utilizado em medicina, engenharia e outras áreas para compreender o tempo até eventos como falhas ou mortes, dada por:

\[ \hat{S}(t) = \prod_{j:t_j < t} \left( \frac{n_j - d_j}{n_j} \right) = \prod_{j:t_j < t} \left( 1 - \frac{d_j}{n_j} \right) \]

Em que: \[ \text{} \begin{aligned} & t: \text{ tempos;} \\ & n_j: \text{ número de indivíduos em risco;} \\ & d_j: \text{ número de falhas.} \end{aligned} \]

0.4.0.6 1.6. Teste log rank e wilcoxon

O teste Log-Rank é uma ferramenta não paramétrica usada para comparar curvas de sobrevivência de dois ou mais grupos, focando em diferenças no tempo até a ocorrência de um evento. Ele assume que as curvas de sobrevivência devem ter diferenças constantes ao longo do tempo (Klein & Moeschberger, 2003; Collett, 2015). Já o teste de Wilcoxon, também compara curvas de sobrevivência, mas é mais sensível às diferenças iniciais entre as curvas, sendo influenciado principalmente pelos eventos que ocorrem no início do período de acompanhamento (Lee & Wang, 2013). Ambos os testes são amplamente utilizados em estudos médicos e experimentais para verificar se as funções de sobrevivência são significativamente diferentes entre grupos, com base em hipóteses que compartilham diferentes padrões de variação entre as curvas (Hosmer, Lemeshow & May, 2008). E as suas hipoteses são:

\[ \begin{aligned} & H_0: \mu_1 = \mu_2 \\ & H_1: \mu_1 \neq \mu_2 \end{aligned} \]

0.4.0.7 1.7. Modelo de riscos proporcionais de Cox (semi-paramétrico)

O modelo de riscos proporcional de Cox semi paramétrico, também conhecido como modelo de riscos proporcionais de Cox, é uma ferramenta popular na análise de sobrevivência. Proposto por David Cox em 1972, ele permite estimar o efeito de variáveis explicativas sobre o tempo até a ocorrência de um evento sem assumir uma distribuição específica para os tempos de falha. O modelo expressa a taxa de risco como uma função exponencial das covariáveis, assumindo que os riscos são proporcionais ao longo do tempo para diferentes grupos. Essa flexibilidade torna o modelo de Cox ideal para estudos onde se deseja avaliar o impacto de variáveis como idade, tratamento ou características demográficas sobre o risco de um evento. Dado por:

\[ \lambda(t \mid \mathbf{x}) = \lambda_0(t) \exp(x_1 \beta_1 + x_2 \beta_2 + \cdots + x_p \beta_p) = \lambda_0(t) \exp(\mathbf{x}\boldsymbol{\beta}) \]

em que:

Em que:

  • \(\lambda(t \mid \mathbf{x})\): representa a taxa de risco condicional no tempo \(t\), dado o vetor de covariáveis \(\mathbf{X}\);
  • \(\lambda_0(t)\): é a taxa de risco de base no tempo \(t\).
  • \(\exp\left(X\beta\right)\) : é a notação vetorial compacta para \(x_1\beta_1 + x_2\beta_2 + \cdots + x_p\beta_p\)

Agora iremos começar a análise, inicialmente iremos carregar a bibliotecas que ira ser utilizada

0.5 Bibliotecas utilizadas

## Warning: package 'survival' was built under R version 4.3.3
## Warning: package 'survminer' was built under R version 4.3.3
## Carregando pacotes exigidos: ggplot2
## Warning: package 'ggplot2' was built under R version 4.3.3
## Carregando pacotes exigidos: ggpubr
## 
## Attaching package: 'survminer'
## The following object is masked from 'package:survival':
## 
##     myeloma
## Warning: package 'readxl' was built under R version 4.3.3
## Warning: package 'dplyr' was built under R version 4.3.3
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Warning: package 'tidyverse' was built under R version 4.3.3
## Warning: package 'readr' was built under R version 4.3.3
## Warning: package 'stringr' was built under R version 4.3.3
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ lubridate 1.9.3     ✔ tibble    3.2.1
## ✔ purrr     1.0.2     ✔ tidyr     1.3.0
## ✔ readr     2.1.5
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Warning: package 'ggsurvfit' was built under R version 4.3.3
## Warning: package 'kableExtra' was built under R version 4.3.3
## 
## Attaching package: 'kableExtra'
## 
## The following object is masked from 'package:dplyr':
## 
##     group_rows
## 
## 
## Attaching package: 'MASS'
## 
## The following object is masked from 'package:dplyr':
## 
##     select

0.6 Carregando a Base de dados

## # A tibble: 6 × 7
##   `Período de desemprego` Evento `Seguro-desemprego` salário Idade
##                     <dbl>  <dbl>               <dbl>   <dbl> <dbl>
## 1                       5      1                   0    690.    41
## 2                      13      1                   1    529.    30
## 3                      21      1                   1    677.    36
## 4                       3      1                   1    598.    26
## 5                       9      0                   1    632.    22
## 6                      11      0                   1    685.    43
## # ℹ 2 more variables: `Idade categorizada` <chr>, Salário_cat <fct>

0.7 Definindo as Variáveis

time = `Período de desemprego`
event = Evento
idade = Idade
Salário = salário
Idade1= `Idade categorizada`
Grupo = `Seguro-desemprego`
Idade_cat = `Idade categorizada`

0.8 Medidas de posição

##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   1.000   2.000   5.000   6.248   9.000  28.000
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   5.273 524.175 562.762 533.607 601.250 754.592
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   20.00   27.00   34.00   35.44   43.00   61.00

Os dados mostram um grupo com idade variando entre 20 e 61 anos, com idade média de 35 anos e mediana de 34 anos, visando uma distribuição etária relativamente jovem, equipamentos em torno dos 30 - 40 anos. Em termos de salário que na base está como log do salário, os valores variam de R$ 5,27, o que pode ter sido um erro de digitação, a R$ 754,59, com uma média de R$ 533,61 e mediana de R$ 562,75, fazendo com que a maioria dos movimentos esteja entre esses valores centrais. O período de desemprego varia extensamente, de 1 a 28 meses, com uma média de 6,35 meses, mas a mediana de 5 meses sugere que metade das pessoas teve um tempo de desemprego até esse limite. O primeiro quartil indica que 25% dos indivíduos tiveram até 0 meses de desemprego, enquanto 75% tiveram até 1 mês, evidenciando um tempo de desemprego baixo para a maioria.

0.9 Variável resposta

## Warning: The dot-dot notation (`..count..`) was deprecated in ggplot2 3.4.0.
## ℹ Please use `after_stat(count)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

0.10 Curva de sobrevivência de kaplan meier para a variável resposta

a curva Kaplan-Meier mostra a probabilidade de uma pessoa permanecer desempregada ao longo do tempo. Inicialmente, todos estão desempregados, mas essa chance diminui conforme algumas pessoas encontram emprego. Cada queda na curva representa alguém que conseguiu trabalhar, enquanto o “número em risco” abaixo indica quantos ainda estão desempregados em momentos específicos. A curva revela que o desemprego diminuiu ao longo do tempo, embora algumas pessoas permaneçam desempregadas até ao final da observação.

0.11 kaplan meier Análise para o seguro desemprego

a curva Kaplan-Meier apresentada mostra a probabilidade de permanência no seguro-desemprego ao longo do tempo, comparando dois grupos: aqueles que não recebem (grupo 0) e aqueles que recebem (grupo 1). Observa-se que, inicialmente, ambos os grupos começam com a mesma probabilidade de sobrevivência. Com o passar do tempo, o grupo que não recebe (linha vermelha) apresenta uma redução mais acentuada na probabilidade de permanência no seguro-desemprego em comparação ao grupo que recebe (linha azul).

Ao final do período analisado, a probabilidade de não ter seguro-desemprego é visivelmente menor para o grupo que não recebe, diminuindo que aqueles que recebem o benefício tendem a permanecer mais tempo nele. Além disso, os números abaixo dos gráficos, o número de risco indica quantas pessoas de cada grupo permaneceram no estudo ao longo do tempo, com uma redução significativa nos participantes ativos após os 10 primeiros períodos.

0.12 Kaplan-Meier - Curva para Idade Categorizada

a curva Kaplan-Meier apresentada analisa a probabilidade das ao analisar as curvas por faixa etária, observamos que os trabalhadores mais jovens (20-29 anos e 30-39 anos) tendem a sair do desemprego mais rapidamente, pois suas probabilidades de permanecerem desempregados diminuem de forma mais acentuada ao longo dos períodos. Por outro lado, os trabalhadores mais velhos (40-49 anos e especialmente 50-61 anos) apresentam uma probabilidade de desemprego mais alta e estável, diminuindo que esses grupos permanecem desempregados por períodos mais longos. Isso sugere que a idade influencia a duração do desemprego, com os trabalhadores mais velhos possivelmente enfrentando maiores dificuldades para encontrar novas oportunidades de trabalho rapidamente, enquanto os trabalhadores mais jovens conseguem se reinserir no mercado com maior facilidade ao longo do tempo.

0.13 Kaplan-Meier - Curva para o Salário

podemos observar que os três grupos começam com probabilidades de desemprego semelhantes. No entanto, ao longo do tempo, o grupo de Salário-Baixo apresenta uma redução mais rápida na probabilidade de permanência desempregada, enquanto os grupos de Salário-Médio e Salário-Alto apresentam curvas mais próximas entre si.

Isso pode indicar que pessoas com períodos mais baixos têm uma probabilidade um pouco maior de sair do desemprego mais cedo, enquanto aquelas com períodos médios e altos tendem a permanecer desempregadas por períodos mais longos, embora as diferenças entre os três grupos sejam relativamente sutis. Os número em risco, mostram a quantidade de pessoas de cada nível salarial ainda desempregadas ao longo do tempo, com uma queda acentuada na quantidade de indivíduos nos períodos finais.

0.14 Teste log - rank e wilcoxon

## Call:
## survdiff(formula = Surv(time, event) ~ Grupo, data = df)
## 
##            N Observed Expected (O-E)^2/E (O-E)^2/V
## Grupo=0 1495      576      347     150.8       248
## Grupo=1 1848      497      726      72.1       248
## 
##  Chisq= 248  on 1 degrees of freedom, p= <2e-16
## Call:
## survdiff(formula = Surv(time, event) ~ Grupo, data = df, rho = 1)
## 
##            N Observed Expected (O-E)^2/E (O-E)^2/V
## Grupo=0 1495      516      300     154.6       298
## Grupo=1 1848      371      587      79.2       298
## 
##  Chisq= 298  on 1 degrees of freedom, p= <2e-16
## Call:
## survdiff(formula = Surv(time, event) ~ Idade_cat, data = dados)
## 
## n=3285, 58 observations deleted due to missingness.
## 
##                    N Observed Expected (O-E)^2/E (O-E)^2/V
## Idade_cat=20-29 1198      374      344     2.595      4.14
## Idade_cat=30-39 1033      356      328     2.390      3.71
## Idade_cat=40-49  679      219      234     0.945      1.30
## Idade_cat=50-61  375      101      144    12.849     15.92
## 
##  Chisq= 20.2  on 3 degrees of freedom, p= 2e-04
## Call:
## survdiff(formula = Surv(time, event) ~ Idade_cat, data = dados, 
##     rho = 1)
## 
## n=3285, 58 observations deleted due to missingness.
## 
##                    N Observed Expected (O-E)^2/E (O-E)^2/V
## Idade_cat=20-29 1198    313.2      291     1.771     3.318
## Idade_cat=30-39 1033    294.2      273     1.688     3.074
## Idade_cat=40-49  679    180.8      190     0.447     0.724
## Idade_cat=50-61  375     80.5      115    10.563    15.597
## 
##  Chisq= 18.5  on 3 degrees of freedom, p= 4e-04
## Call:
## survdiff(formula = Surv(time, event) ~ Salário, data = dados)
## 
## n=3309, 34 observations deleted due to missingness.
## 
##                  N Observed Expected (O-E)^2/E (O-E)^2/V
## Salário=Baixo 1115      296      350      8.19     13.05
## Salário=Médio 1117      369      350      1.06      1.68
## Salário=Alto  1077      394      360      3.27      5.29
## 
##  Chisq= 13.4  on 2 degrees of freedom, p= 0.001
## Call:
## survdiff(formula = Surv(time, event) ~ Salário, data = dados, 
##     rho = 1)
## 
## n=3309, 34 observations deleted due to missingness.
## 
##                  N Observed Expected (O-E)^2/E (O-E)^2/V
## Salário=Baixo 1115      246      290     6.674     12.46
## Salário=Médio 1117      304      290     0.646      1.21
## Salário=Alto  1077      326      296     3.098      5.87
## 
##  Chisq= 13  on 2 degrees of freedom, p= 0.001

Podemos observar que todos foram significativos p valor 0,05

0.15 Modelo de risco proporcional de cox - coeficientes e taxas de risco

## Call:
## coxph(formula = Surv(time, event) ~ Salário_cat + `Idade categorizada` + 
##     Grupo, method = "breslow")
## 
##   n= 3285, number of events= 1050 
##    (58 observations deleted due to missingness)
## 
##                               coef exp(coef) se(coef)       z Pr(>|z|)    
## Salário_catBaixo          -0.16706   0.84615  0.12701  -1.315  0.18841    
## Salário_catMédio          -0.58597   0.55656  0.07798  -7.515 5.71e-14 ***
## `Idade categorizada`30-39  0.05854   1.06029  0.07532   0.777  0.43702    
## `Idade categorizada`40-49 -0.08674   0.91691  0.08655  -1.002  0.31626    
## `Idade categorizada`50-61 -0.31599   0.72906  0.11410  -2.770  0.00561 ** 
## Grupo                     -1.01857   0.36111  0.06544 -15.565  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##                           exp(coef) exp(-coef) lower .95 upper .95
## Salário_catBaixo             0.8462     1.1818    0.6597    1.0853
## Salário_catMédio             0.5566     1.7967    0.4777    0.6485
## `Idade categorizada`30-39    1.0603     0.9431    0.9148    1.2290
## `Idade categorizada`40-49    0.9169     1.0906    0.7738    1.0864
## `Idade categorizada`50-61    0.7291     1.3716    0.5830    0.9118
## Grupo                        0.3611     2.7692    0.3176    0.4105
## 
## Concordance= 0.693  (se = 0.009 )
## Likelihood ratio test= 284.2  on 6 df,   p=<2e-16
## Wald test            = 282.7  on 6 df,   p=<2e-16
## Score (logrank) test = 296.2  on 6 df,   p=<2e-16

No modelo inicial 3 das variáveis não foi significativa, ou seja, não contribuiu de forma relevante para o desemprego. Por isso, precisamos aplicar um método de seleção de variáveis para identificar quais variáveis são realmente importantes e quais devem ser removidas. A seleção de variáveis é importante porque melhora a precisão e a interpretabilidade do modelo, removendo variáveis irrelevantes. Aplicando esses métodos, podemos comparar diferentes modelos e escolher o que apresenta o melhor desempenho com o menor número de variáveis. As sim, garantimos que o modelo final seja eficiente e fácil de interpretar.

0.16 Stepwise para o modelo

## Start:  AIC=15691.98
## Surv(time, event) ~ Salário_cat + Idade + `Seguro-desemprego`
## 
##                       Df   AIC
## <none>                   15692
## - Idade                1 15696
## - Salário_cat          2 15751
## - `Seguro-desemprego`  1 15928
## Call:
## coxph(formula = Surv(time, event) ~ Salário_cat + Idade + `Seguro-desemprego`, 
##     method = "breslow")
## 
##   n= 3343, number of events= 1073 
## 
##                          coef exp(coef)  se(coef)       z Pr(>|z|)    
## Salário_catBaixo    -0.132592  0.875822  0.124324  -1.067   0.2862    
## Salário_catMédio    -0.586829  0.556088  0.077233  -7.598    3e-14 ***
## Idade               -0.007590  0.992439  0.002998  -2.532   0.0114 *  
## `Seguro-desemprego` -1.005280  0.365942  0.064736 -15.529   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
##                     exp(coef) exp(-coef) lower .95 upper .95
## Salário_catBaixo       0.8758      1.142    0.6864    1.1175
## Salário_catMédio       0.5561      1.798    0.4780    0.6470
## Idade                  0.9924      1.008    0.9866    0.9983
## `Seguro-desemprego`    0.3659      2.733    0.3223    0.4154
## 
## Concordance= 0.688  (se = 0.009 )
## Likelihood ratio test= 279.9  on 4 df,   p=<2e-16
## Wald test            = 280.4  on 4 df,   p=<2e-16
## Score (logrank) test = 293.8  on 4 df,   p=<2e-16

Os resultados indicam que indivíduos com salário médio têm uma probabilidade significativamente menor de arrumar emprego rapidamente em comparação ao grupo de referência (salário alto), com um risco relativo (\(\exp(\beta)\)) de 0,5561, ou seja, uma redução na velocidade de conseguir emprego. Já aqueles com salário baixo apresentam um coeficiente não significativo, sugerindo que a associação entre esse grupo e o tempo para conseguir emprego é fraca (\(p = 0,2862\)).

A idade também mostrou uma associação significativa (\(p = 0,0114\)), mas com um efeito menor. Para cada ano adicional de idade, há uma leve redução na velocidade de arrumar emprego (\(\exp(\beta) = 0,9924\)). Por fim, a posse de seguro-desemprego apresentou um efeito expressivo e significativo (\(p < 0,001\)), reduzindo a velocidade de conseguir emprego (\(\exp(\beta) = 0,3659\)).

O modelo como um todo é significativo, conforme indicado pelos testes globais (Likelihood Ratio, Wald e Logrank), todos com \(p < 0,001\). A concordância de 0,688 sugere que o modelo possui uma boa capacidade preditiva. Em resumo, possuir seguro-desemprego e estar no grupo de salário médio estão associados a uma maior demora para arrumar emprego, enquanto a idade tem um efeito menor, mas relevante.

A análise gráfica mostra que os residuos estão distribuídos de forma desejada, sem qualquer organização ou padrão visível. No gráfico de resíduos de Cox-Shell, os pontos estão espalhados ao redor do eixo zero, indicando que o modelo ajustado funciona bem para os dados, sem apresentar problemas. Nos gráficos de resíduos de Martingale, os pontos também seguem uma distribuição sem ordem ou padrão, o que confirma que o modelo respeita os requisitos necessários. De forma geral, esses resultados mostram que o modelo é adequado e capturou bem as relações entre as variáveis, sem deixar erros importantes.

0.17 Conclusão

Esses resultados fornecem informações importantes para a formulação de políticas públicas e programas de apoio, que podem ser direcionados a grupos mais vulneráveis, como aqueles com estudos mais baixos ou que dependem de seguro-desemprego. Ao priorizar essas variáveis, políticas estaduais e municipais podem promover estratégias mais eficazes para reduzir o desemprego e apoiar a inclusão econômica dos cidadãos, melhorando, assim, o bem-estar e as oportunidades de emprego para diferentes faixas etárias e perfis socioeconômicos.