1. Pacotes e Leitura dos Dados

library(readr)
library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
library(ggplot2)
library(stringr)
library(tidyr)
library(gt)
library(gtExtras)
library(moments)

dados <- read_csv("C:/Users/Pichau/Downloads/PESQUISACLTMEI.csv")
## Rows: 31 Columns: 15
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (7): ESCOLARIDADE, SEXO, SALÁRIO BRUTO (CLT), SALÁRIO BRUTO (PÓS CLT), H...
## dbl (8): IDADE, HORAS TRABALHO (CLT), HORAS TRABALHO (PÓS-CLT), Econômico, P...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

2. Transformação dos Dados

base <- dados %>%
  transmute(
    Delta_Horas    = as.numeric(`HORAS TRABALHO (PÓS-CLT)`) - as.numeric(`HORAS TRABALHO (CLT)`),
    Qualidade_Vida = if_else(`MELHORIA NA QL. DE VIDA?` == "Sim", 1, 0),
    Otimismo       = if_else(`HÁ OTIMISMO?` == "Sim", 1, 0),
    Salario        = parse_number(`SALÁRIO BRUTO (PÓS CLT)`),
    Econ           = as.numeric(Econômico),
    Info           = as.numeric(`Acesso a informação`),
    Amigos         = as.numeric(`Amigos/Família`)
  )

3. Função Descritiva

descritiva <- function(v) {
  v <- na.omit(v)
  data.frame(
    Média = mean(v),
    Mediana = median(v),
    Moda = as.numeric(names(sort(table(v), decreasing = TRUE)[1])),
    Desvio = sd(v),
    Variância = var(v),
    Mínimo = min(v),
    Q1 = quantile(v, 0.25),
    Q3 = quantile(v, 0.75),
    Máximo = max(v),
    Assimetria = skewness(v),
    Curtose = kurtosis(v)
  )
}

4. ΔHoras x Qualidade de Vida

estat_qv_sim <- descritiva(base$Delta_Horas[base$Qualidade_Vida == 1])
estat_qv_nao <- descritiva(base$Delta_Horas[base$Qualidade_Vida == 0])

Gráfico 1

ggplot(base, aes(x = factor(Qualidade_Vida, labels = c("Não melhorou", "Melhorou")), y = Delta_Horas)) +
  geom_boxplot(fill = "#76B7B2") +
  geom_hline(yintercept = 0, linetype = "dashed", color = "red") +
  annotate("text", x = 1.5, y = 0.5, label = "0 = Mesma carga horária", color = "red", size = 3.5, hjust = 0) +
  labs(
    title = "Horas trabalhadas antes e depois do CLT",
    subtitle = "Valores negativos indicam redução na carga horária após saída do CLT",
    x = "Percepção de melhoria na qualidade de vida",
    y = "Horas trabalhadas (pós - antes)"
  ) +
  theme_minimal()

5. Salário x Otimismo

estat_otimista <- descritiva(base$Salario[base$Otimismo == 1])
estat_pessimista <- descritiva(base$Salario[base$Otimismo == 0])

Gráfico 2

ggplot(base, aes(x = factor(Otimismo, labels = c("Não otimista", "Otimista")), y = Salario)) +
  geom_boxplot(fill = "#4E79A7") +
  labs(
    title = "Salário pós-CLT entre otimistas e não otimistas",
    subtitle = "Visualização das diferenças salariais por percepção de futuro",
    x = "Otimismo",
    y = "Salário pós-CLT (R$)"
  ) +
  theme_minimal()

6. Importância dos Fatores

estat_econ <- descritiva(base$Econ)
estat_info <- descritiva(base$Info)
estat_amigos <- descritiva(base$Amigos)

base_long <- base %>%
  pivot_longer(cols = c(Econ, Info, Amigos),
               names_to = "Fator",
               values_to = "Nota") %>%
  mutate(Fator = recode(Fator,
                        "Econ" = "Econômico",
                        "Info" = "Acesso à informação",
                        "Amigos" = "Amigos ou família"))

7. Dificuldades Relatadas

dados_dificuldades <- data.frame(
  Palavra_Chave = c("Gestão", "Investimento", "Emocional", "Marketing", 
                    "Planejamento", "Burocracia", "Nenhuma"),
  Quantidade = c(19, 17, 16, 15, 11, 11, 1)
)

total_respondentes <- 31
dados_dificuldades$Percentual <- dados_dificuldades$Quantidade / total_respondentes * 100
dados_dificuldades$Label <- paste0(
  dados_dificuldades$Quantidade, " (", sprintf("%.1f", dados_dificuldades$Percentual), "%)"
)

Gráfico de Dificuldades

ggplot(dados_dificuldades, aes(x = reorder(Palavra_Chave, Quantidade), y = Quantidade)) +
  geom_col(fill = "#4E79A7", width = 0.6) +
  geom_text(aes(label = Label), hjust = -0.1, size = 4.2, color = "black") +
  coord_flip() +
  labs(
    title = "Dificuldades Relatadas após Sair do CLT",
    subtitle = "Quantidade de pessoas e percentual (base: 31 respondentes)",
    x = "Dificuldade (palavra-chave)",
    y = "Quantidade de Pessoas"
  ) +
  theme_minimal(base_size = 13) +
  theme(
    panel.background = element_rect(fill = "white", color = NA),
    plot.background  = element_rect(fill = "white", color = NA),
    plot.title       = element_text(face = "bold", hjust = 0.5),
    plot.subtitle    = element_text(hjust = 0.5),
    axis.title.y     = element_blank(),
    axis.text.y      = element_text(color = "black"),
    axis.text.x      = element_text(color = "black"),
    panel.grid.major.y = element_blank(),
    panel.grid.minor = element_blank()
  ) +
  scale_y_continuous(expand = expansion(mult = c(0, 0.15)))