Sumário

1 - Bibliotecas Utilizadas

2 - Leitura e Separação dos dados para Análise

3 - Análise Nível Nacional

3.1 - Contagem valores absolutos

3.2 - Ingresso

3.3 - Permanência

3.4 - Evasão

3.5 - Conclusão

4 - Análise Nível Paraíba

4.1 - Contagem valores absolutos

4.2 - Ingresso

4.3 - Permanência

4.4 - Evasão

4.5 - Conclusão

1 - Library

library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)
library(purrr)
## 
## Anexando pacote: 'purrr'
## O seguinte objeto é mascarado por 'package:base':
## 
##     %||%
#library(GGally)
#library(pscl)
library(broom)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.4.4     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ purrr::%||%()   masks base::%||%()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(modelr)
## 
## Anexando pacote: 'modelr'
## 
## O seguinte objeto é mascarado por 'package:broom':
## 
##     bootstrap
library(here)
## here() starts at /home/laryssa/Laryssa/Laryssa-penDrive/NiloPecanha-Laryssa
library(skimr)
library(gcookbook)
library(lubridate)
library(rio)
library(tidyr)

2 - Leitura e Separação dos dados para Análise

dado_2017 <- read_csv2("2017-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1031798 Columns: 25
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (18): Cor / Raça, Dt Data Fim Previsto, Data de Inicio do Ciclo, Dt Ocor...
## dbl  (7): Carga Horaria, Carga Horaria Minima, Co Ciclo Matricula, Co Matric...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2017 <- dado_2017 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2017", "Ingresso", `Situação de Matrícula`))%>%
  mutate(`Sg Sexo` = ifelse(`Sg Sexo`=="F", "Feminino", "Masculino"), ano = 2017) %>%
  rename(Sexo=`Sg Sexo`)

# Separando os dados entre mulheres e homens para o ano de 2017
fem17 <- dado_2017%>%
  filter(`Sexo` == "Feminino") 
#print(fem17)

## Separando as mulheres por curso para o ano de 2017
manu_mulher17 <- fem17%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher17)

infor_mulher17 <- fem17%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher17)

#Fazendo a parte masculina
mas17 <- dado_2017%>%
  filter(`Sexo` == "Masculino") 
#print(mas17)

## Separando os homens por curso para o ano de 2017
manu_homem17 <- mas17%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem17)

infor_homem17 <- mas17%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem17)

dado_2018 <- read_csv2("2018-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 964593 Columns: 35── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (25): Sexo, Renda Familiar, Cor / Raça, Faixa Etria, Data de Ocorrncia d...
## dbl (10): Idade, Cdigo da Matrcula, Cdigo do Ciclo Matrcula, Vagas Ofertadas...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2018 <- dado_2018 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2018", "Ingresso", `Situação de Matrícula`))%>%
  mutate(`Sexo` = ifelse(`Sexo`=="F", "Feminino", "Masculino"), ano = 2018) %>% 
  rename(Sexo=`Sexo`)

# Separando os dados entre mulheres e homens para o ano de 2018
fem18 <- dado_2018%>%
  filter(`Sexo` == "Feminino") 
#print(fem18)

## Separando as mulheres por curso para o ano de 2018
manu_mulher18 <- fem18%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher18)

infor_mulher18 <- fem18%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher18)

#Fazendo a parte masculina
mas18 <- dado_2018%>%
  filter(`Sexo` == "Masculino") 
#print(mas18)

## Separando os homens por curso para o ano de 2018
manu_homem18 <- mas18%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem18)

infor_homem18 <- mas18%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem18)

dado_2019 <- read_csv2("2019-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1023303 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (23): Categoria da Situação, Cor / Raça, Data de Inicio do Ciclo, Data d...
## dbl (31): Teste, Carga Horaria, Carga Horaria Minima, Código do Ciclo Matric...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2019 <- dado_2019 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2019", "Ingresso", `Situação de Matrícula`))%>%
  mutate(ano = 2019)

# Separando os dados entre mulheres e homens para o ano de 2019
fem19 <- dado_2019%>%
  filter(`Sexo` == "Feminino") 
#print(fem19)

## Separando as mulheres por curso para o ano de 2019
manu_mulher19 <- fem19%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher19)

infor_mulher19 <- fem19%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher19)

# Fazendo a parte masculina
mas19 <- dado_2019%>%
  filter(`Sexo` == "Masculino") 
#print(mas19)

## Separando os homens por curso para o ano de 2019
manu_homem19 <- mas19%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem19)

infor_homem19 <- mas19%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem19)

dado_2020 <- read_csv2("2020-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1507476 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (24): Categoria de Situação, Cor/Raça, Data de Fim Previsto do Ciclo, Da...
## dbl (30): Carga Horaria, Carga Horaria Minima, Cod Unidade, Código da Matríc...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2020 <- dado_2020 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2020", "Ingresso", `Situação de Matrícula`))%>%
  mutate(Sexo = ifelse(Sexo=="F", "Feminino", "Masculino"), ano = 2020)

# Separando os dados entre mulheres e homens para o ano de 2020
fem20 <- dado_2020%>%
  filter(`Sexo` == "Feminino") 
#print(fem20)

## Separando as mulheres por curso para o ano de 2020
manu_mulher20 <- fem20%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher20)

infor_mulher20 <- fem20%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher20)

#Fazendo a parte masculina
mas20 <- dado_2020%>%
  filter(`Sexo` == "Masculino") 
#print(mas20)

## Separando os homens por curso para o ano de 2020
manu_homem20 <- mas20%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem20)

infor_homem20 <- mas20%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem20)

dado_2021 <- read_csv2("2021-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1048575 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (24): Categoria de Situação, Cor/Raça, Data de Fim Previsto do Ciclo, Da...
## dbl (30): Carga Horaria, Carga Horaria Minima, Cod Unidade, Código da Matríc...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2021 <- dado_2021 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2021", "Ingresso", `Situação de Matrícula`))%>%
  mutate(ano = 2021)

# Separando os dados entre mulheres e homens para o ano de 2021
fem21 <- dado_2021%>%
  filter(`Sexo` == "Feminino") 
#print(fem21)

## Separando as mulheres por curso para o ano de 2021
manu_mulher21 <- fem21%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher21)

infor_mulher21 <- fem21%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher21)

#Fazendo a parte masculina
mas21 <- dado_2021%>%
  filter(`Sexo` == "Masculino") 
#print(mas21)

## Separando os homens por curso para o ano de 2021
manu_homem21 <- mas21%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem21)

infor_homem21 <- mas21%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem21)

#agrupando os dados e montando dos datasets por ano

dado <- bind_rows(dado_2017, dado_2018, dado_2019, dado_2020, dado_2021)
#print(dado)

write.csv2(dado, "dados_2017a2021.csv")

#Dataset com os dados femininos para dos os anos
dado_mulher <- bind_rows(fem17, fem18, fem19, fem20, fem21)
#print(dado_mulher)

write.csv2(dado_mulher, "dados_mulher2017a2021.csv")

#Dataset com os dados femininos para o curso de Manutenção e Suporte em informática para todos os anos
dado_mulher_manu <- bind_rows(manu_mulher17, manu_mulher18, manu_mulher19, manu_mulher20, manu_mulher21)
print(dado_mulher_manu)
## # A tibble: 4,241 × 92
##    `Carga Horaria` `Carga Horaria Minima` `Co Ciclo Matricula` `Co Matricula`
##              <dbl>                  <dbl>                <dbl>          <dbl>
##  1            4200                   1000              1979672       64153053
##  2            3720                   1000              1857567       60949323
##  3            3720                   1000              1857567       60949333
##  4            3720                   1000              1857567       60949343
##  5            3720                   1000              1857567       60949357
##  6            3720                   1000              1857567       60949373
##  7            3720                   1000              1857567       60949321
##  8            3720                   1000              1857567       60949339
##  9            3720                   1000              1857567       60949349
## 10            3720                   1000              1857567       60949351
## # ℹ 4,231 more rows
## # ℹ 88 more variables: `Cor / Raça` <chr>, `Dt Data Fim Previsto` <chr>,
## #   `Data de Inicio do Ciclo` <chr>, `Dt Ocorrencia Matricula` <chr>,
## #   `Eixo Tecnológico` <chr>, `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>, …
write.csv2(dado_mulher_manu, "dados_mulher_Manu2017a2021.csv")

#Dataset com os dados femininos para o curso de informática para todos os anos
dado_mulher_info <- bind_rows(infor_mulher17, infor_mulher18, infor_mulher19, infor_mulher20, infor_mulher21)
print(dado_mulher_info)
## # A tibble: 61,594 × 92
##    `Carga Horaria` `Carga Horaria Minima` `Co Ciclo Matricula` `Co Matricula`
##              <dbl>                  <dbl>                <dbl>          <dbl>
##  1            3366                   1000              1981201       64259816
##  2            3366                   1000              1981201       64259830
##  3            3366                   1000              1981201       64259834
##  4            3332                   1000              2007416       71304181
##  5            3390                   1000               811932       36222356
##  6            4450                   1000              2024022       66899611
##  7            4450                   1000              2024022       66899571
##  8            4450                   1000              2024022       66899565
##  9            4450                   1000              2024022       66899297
## 10            4134                   1000              2165967       72841310
## # ℹ 61,584 more rows
## # ℹ 88 more variables: `Cor / Raça` <chr>, `Dt Data Fim Previsto` <chr>,
## #   `Data de Inicio do Ciclo` <chr>, `Dt Ocorrencia Matricula` <chr>,
## #   `Eixo Tecnológico` <chr>, `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>, …
write.csv2(dado_mulher_info, "dados_mulher_info2017a2021.csv")

#dataset com os dados masculinos para todos os anos
dado_homem <- bind_rows(mas17, mas18, mas19, mas20, mas21)
#print(dado_homem)

write.csv2(dado_homem, "dados_homem2017a2021.csv")

#Dataset com os dados masculinos para o curso de Manutenção e Suporte em informática para todos os anos
dado_homem_manu <- bind_rows(manu_homem17, manu_homem18, manu_homem19, manu_homem20, manu_homem21)
#print(dado_homem_manu)

write_csv2(dado_homem_manu, "dados_homem_manu2017a2021.csv")

#Dataset com os dados masculinos para o curso de informática para todos os anos
dado_homem_info <- bind_rows(infor_homem17, infor_homem18, infor_homem19, infor_homem20, infor_homem21)
#print(dado_homem_info)

write_csv2(dado_homem_info, "dados_homem_info2017a2021.csv")

#Dataset para o curso de Manutenção e Suporte em Informática para os dois sexo e para todos os anos
dado_manu_total <- bind_rows(dado_mulher_manu, dado_homem_manu)
#print(dado_manu_total)

write_csv2(dado_manu_total, "dados_manu_total2017a2021.csv")

#Dataset para o curso de Informática para os dois sexo e para todos os anos
dado_info_total <- bind_rows(dado_mulher_info, dado_homem_info)
#print(dado_info_total)

write_csv2(dado_info_total, "dados_info_total2017a2021.csv")

3. Análise Nível Nacional

3.1. Realizando a contagem em valores absolutos e em percentuais Feminino e Masculino para os cursos Técnico em Manutenção e Suporte em Informática e Técnico em Informática

3.1.1. Curso Técnico em Manutenção e Suporte em Informática

#Fazendo a contagem por situação de matricula e por sexo para o curso de Manutenção e Suporte em Informática
#Contagem de Ingresso
contagem_manu_ingresso <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_ingresso)

# Contagem Em Curso
contagem_manu_emCurso <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_emCurso)

#Contagem Evasão
contagem_manu_evasao <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Evasão") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_evasao)

#Contagem Conclusão
contagem_manu_conclusao <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_conclusao)

contagem_manu <- bind_rows(contagem_manu_ingresso, contagem_manu_emCurso, contagem_manu_evasao, contagem_manu_conclusao)
print(contagem_manu)
## # A tibble: 16 × 5
##      ano `Situação de Matrícula` total_alunos total_mulheres total_homens
##    <dbl> <chr>                          <int>          <int>        <int>
##  1  2017 Ingresso                         935            297          638
##  2  2018 Ingresso                         823            288          535
##  3  2019 Ingresso                         795            299          496
##  4  2020 Ingresso                         799            306          493
##  5  2017 Em curso                        1260            436          824
##  6  2018 Em curso                        1366            452          914
##  7  2019 Em curso                        1273            420          853
##  8  2020 Em curso                        1674            580         1094
##  9  2017 Evasão                           309            106          203
## 10  2018 Evasão                           336            116          220
## 11  2019 Evasão                           279             84          195
## 12  2020 Evasão                           202             67          135
## 13  2017 Concluída                        730            267          463
## 14  2018 Concluída                        630            215          415
## 15  2019 Concluída                        648            223          425
## 16  2020 Concluída                        253             85          168
contagem_mulher_manu <- contagem_manu %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_mulheres = total_mulheres) %>%
  summarise(total_alunos, total_mulheres, percentual_alunas_manu = (total_mulheres / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_mulher_manu)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano `Situação de Matrícula` total_alunos total_mulheres
##    <dbl> <chr>                          <int>          <int>
##  1  2017 Concluída                        730            267
##  2  2017 Em curso                        1260            436
##  3  2017 Evasão                           309            106
##  4  2017 Ingresso                         935            297
##  5  2018 Concluída                        630            215
##  6  2018 Em curso                        1366            452
##  7  2018 Evasão                           336            116
##  8  2018 Ingresso                         823            288
##  9  2019 Concluída                        648            223
## 10  2019 Em curso                        1273            420
## 11  2019 Evasão                           279             84
## 12  2019 Ingresso                         795            299
## 13  2020 Concluída                        253             85
## 14  2020 Em curso                        1674            580
## 15  2020 Evasão                           202             67
## 16  2020 Ingresso                         799            306
## # ℹ 1 more variable: percentual_alunas_manu <dbl>
write_csv2(contagem_mulher_manu, "percentual_mulheres_manutencaoESuporteInfor_SituacaoMatricula.csv")

cores_rgb1 <- c("#DC143C", "#CD5C5C", "#FF0000", "#FFC0CB")

# Criação do gráfico com os valores absolutos do número de mulheres para Manutenção e Suporte em Informática
grafico_contagem_mulheres_manu <- ggplot(contagem_mulher_manu, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de mulheres para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_mulheres, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulheres_manu)

ggsave("contagem_mulher_manu.png", grafico_contagem_mulheres_manu)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de mulheres para Manutenção e Suporte em Informática
grafico_contagem_mulher_manu <- ggplot(contagem_mulher_manu, aes(x = as.factor(ano), y = percentual_alunas_manu, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de mulheres para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunas_manu, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_manu)

ggsave("percentual_mulher_manu.png", grafico_contagem_mulher_manu)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_Mulher_manu <- ggplot(contagem_mulher_manu, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunas por Situação de Matrícula - Curso de Manutenção", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_mulheres), 0), "\n(", format(round(percentual_alunas_manu), 0), "%)")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, 0.5, 1), color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_Mulher_manu)

ggsave("grafico_contagem_Mulher_manu_ambos.png", grafico_contagem_Mulher_manu)
## Saving 7 x 5 in image
# Cálculo do percentual de alunos por situação de matrícula para Manutenção e Suporte em Informática
contagem_homem_manu <- contagem_manu %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_homens = total_homens) %>%
  summarise(total_alunos, total_homens, percentual_alunos_manu = (total_homens / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_homem_manu)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano Situação de Matrícul…¹ total_alunos total_homens percentual_alunos_manu
##    <dbl> <chr>                         <int>        <int>                  <dbl>
##  1  2017 Concluída                       730          463                   63.4
##  2  2017 Em curso                       1260          824                   65.4
##  3  2017 Evasão                          309          203                   65.7
##  4  2017 Ingresso                        935          638                   68.2
##  5  2018 Concluída                       630          415                   65.9
##  6  2018 Em curso                       1366          914                   66.9
##  7  2018 Evasão                          336          220                   65.5
##  8  2018 Ingresso                        823          535                   65.0
##  9  2019 Concluída                       648          425                   65.6
## 10  2019 Em curso                       1273          853                   67.0
## 11  2019 Evasão                          279          195                   69.9
## 12  2019 Ingresso                        795          496                   62.4
## 13  2020 Concluída                       253          168                   66.4
## 14  2020 Em curso                       1674         1094                   65.4
## 15  2020 Evasão                          202          135                   66.8
## 16  2020 Ingresso                        799          493                   61.7
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
write_csv2(contagem_homem_manu, "percentual_homens_manutencaoESuporteInfor_SituacaoMatricula.csv")

cores_rgb <- c("#00008B", "#4169E1", "#0000FF", "#ADD8E6")

# Criação do gráfico com os valores absolutos do número de homens para Manutenção e Suporte em Informática
grafico_contagem_homens_manu <- ggplot(contagem_homem_manu, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de homens para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_homens, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homens_manu)

ggsave("contagem_homem_manu.png", grafico_contagem_homens_manu)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de homens para Manutenção e Suporte em Informática
grafico_contagem_homem_manu <- ggplot(contagem_homem_manu, aes(x = as.factor(ano), y = percentual_alunos_manu, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de homens para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunos_manu, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_manu)

ggsave("percentual_homem_manu.png", grafico_contagem_homem_manu)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_Homem_manu <- ggplot(contagem_homem_manu, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunos por Situação de Matrícula - Curso de Manutenção", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_homens), 0), "\n(", format(round(percentual_alunos_manu), 0), "%)")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, 0.5, 1), color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_Homem_manu)

ggsave("grafico_contagem_Homem_manu_ambos.png", grafico_contagem_Homem_manu)
## Saving 7 x 5 in image

3.1.2. Curso Técnico em Informática

#Fazendo a contagem por situação de matricula e por sexo para o curso de Informática
# Contagem de Ingresso
contagem_info_ingresso <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Em Curso
contagem_info_emCurso <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Evasão
contagem_info_evasao <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Evasão") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Conclusão
contagem_info_conclusao <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Combinação de todas as contagens para Informática
contagem_info <- bind_rows(contagem_info_ingresso, contagem_info_emCurso, contagem_info_evasao, contagem_info_conclusao)
print(contagem_info)
## # A tibble: 16 × 5
##      ano `Situação de Matrícula` total_alunos total_mulheres total_homens
##    <dbl> <chr>                          <int>          <int>        <int>
##  1  2017 Ingresso                        9916           3759         6157
##  2  2018 Ingresso                       10439           4406         6033
##  3  2019 Ingresso                       10846           4658         6188
##  4  2020 Ingresso                       11307           4807         6500
##  5  2017 Em curso                       15647           5807         9840
##  6  2018 Em curso                       17740           6565        11175
##  7  2019 Em curso                       18254           7200        11054
##  8  2020 Em curso                       23641           9803        13838
##  9  2017 Evasão                          4680           1819         2861
## 10  2018 Evasão                          3851           1542         2309
## 11  2019 Evasão                          3512           1354         2158
## 12  2020 Evasão                          2292            929         1363
## 13  2017 Concluída                       5927           2387         3540
## 14  2018 Concluída                       6151           2350         3801
## 15  2019 Concluída                       7345           2839         4506
## 16  2020 Concluída                       3447           1369         2078
# Cálculo do percentual de alunas por situação de matrícula para Informática
contagem_mulher_info <- contagem_info %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_mulheres = total_mulheres) %>%
  summarise(total_alunos, total_mulheres, percentual_alunas_info = (total_mulheres / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_mulher_info)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano `Situação de Matrícula` total_alunos total_mulheres
##    <dbl> <chr>                          <int>          <int>
##  1  2017 Concluída                       5927           2387
##  2  2017 Em curso                       15647           5807
##  3  2017 Evasão                          4680           1819
##  4  2017 Ingresso                        9916           3759
##  5  2018 Concluída                       6151           2350
##  6  2018 Em curso                       17740           6565
##  7  2018 Evasão                          3851           1542
##  8  2018 Ingresso                       10439           4406
##  9  2019 Concluída                       7345           2839
## 10  2019 Em curso                       18254           7200
## 11  2019 Evasão                          3512           1354
## 12  2019 Ingresso                       10846           4658
## 13  2020 Concluída                       3447           1369
## 14  2020 Em curso                       23641           9803
## 15  2020 Evasão                          2292            929
## 16  2020 Ingresso                       11307           4807
## # ℹ 1 more variable: percentual_alunas_info <dbl>
write_csv2(contagem_mulher_info, "percentual_mulheres_Infor_SituacaoMatricula.csv")

# Cores para o gráfico
cores_rgb1 <- c("#DC143C", "#CD5C5C", "#FF0000", "#FFC0CB")

# Criação do gráfico com valores absolutos de mulheres para o curso de Informática
grafico_contagem_mulheres_info <- ggplot(contagem_mulher_info, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de mulheres para o curso de Informática", x = "Ano", y = "Percentual de alunas") +
  geom_text(aes(label = paste0(format(round(total_mulheres, 0), nsmall = 0))), 
            position = position_dodge(width = 0.8), vjust = 1.5, color = "black") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulheres_info)

ggsave("contagem_mulheres_info.png", grafico_contagem_mulheres_info)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de mulheres para o curso de Informática
grafico_contagem_mulher_info <- ggplot(contagem_mulher_info, aes(x = as.factor(ano), y = percentual_alunas_info, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de mulheres para o curso de Informática", x = "Ano", y = "Percentual de alunas") +
  geom_text(aes(label = paste0(format(round(percentual_alunas_info, 0), nsmall = 0))), 
            position = position_dodge(width = 0.8), vjust = 1.5, color = "black") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_info)

ggsave("contagem_mulher_info.png", grafico_contagem_mulher_info)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_Mulher_info <- ggplot(contagem_mulher_info, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunas por Situação de Matrícula - Curso de Informática", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_mulheres), 0), "\n(", format(round(percentual_alunas_info), 0), "%)")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, 0.5, 0.2), hjust = 0.5, color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_Mulher_info)

ggsave("grafico_contagem_Mulher_info_ambos.png", grafico_contagem_Mulher_info)
## Saving 7 x 5 in image
# Cálculo do percentual de alunos por situação de matrícula para Informática
contagem_homem_info <- contagem_info %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_homens = total_homens) %>%
  summarise(total_alunos, total_homens, percentual_alunos_info = (total_homens / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_homem_info)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano Situação de Matrícul…¹ total_alunos total_homens percentual_alunos_info
##    <dbl> <chr>                         <int>        <int>                  <dbl>
##  1  2017 Concluída                      5927         3540                   59.7
##  2  2017 Em curso                      15647         9840                   62.9
##  3  2017 Evasão                         4680         2861                   61.1
##  4  2017 Ingresso                       9916         6157                   62.1
##  5  2018 Concluída                      6151         3801                   61.8
##  6  2018 Em curso                      17740        11175                   63.0
##  7  2018 Evasão                         3851         2309                   60.0
##  8  2018 Ingresso                      10439         6033                   57.8
##  9  2019 Concluída                      7345         4506                   61.3
## 10  2019 Em curso                      18254        11054                   60.6
## 11  2019 Evasão                         3512         2158                   61.4
## 12  2019 Ingresso                      10846         6188                   57.1
## 13  2020 Concluída                      3447         2078                   60.3
## 14  2020 Em curso                      23641        13838                   58.5
## 15  2020 Evasão                         2292         1363                   59.5
## 16  2020 Ingresso                      11307         6500                   57.5
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
write_csv2(contagem_homem_info, "percentual_homens_Infor_SituacaoMatricula.csv")

cores_rgb <- c("#00008B", "#4169E1", "#0000FF", "#ADD8E6")

# Criação do gráfico com os valores absolutos de homens para o curso de Informática
grafico_contagem_homens_info <- ggplot(contagem_homem_info, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de homens para o curso de Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_homens, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homens_info)

ggsave("contagem_homens_info.png", grafico_contagem_homens_info)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de homens para o curso de Informática
grafico_contagem_homem_info <- ggplot(contagem_homem_info, aes(x = as.factor(ano), y = percentual_alunos_info, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de homens para o curso de Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunos_info, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_info)

ggsave("contagem_homem_info.png", grafico_contagem_homem_info)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_Homem_info <- ggplot(contagem_homem_info, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunos por Situação de Matrícula - Curso de Informática", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_homens), 0), "\n(", format(round(percentual_alunos_info), 0), "%)")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, 0.5, 0.5), color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_Homem_info)

ggsave("grafico_contagem_Homem_info_ambos.png", grafico_contagem_Homem_info)
## Saving 7 x 5 in image

Vendo as informações de contagem por sexo e por situação de matricula

#Criando a contagem de alunos por sexo para o curso de Manutenção e Suporte em Informática e empilhando os dados por Situação da Matrícula
contagem_mulher_manu2 <- dado_mulher_manu %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_mulher_manu2)

contagem_homem_manu2 <- dado_homem_manu %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_homem_manu2)

contagem_alunos_manu2 <- bind_rows(contagem_mulher_manu2, contagem_homem_manu2)
print(contagem_alunos_manu2)
## # A tibble: 32 × 4
## # Groups:   ano, Sexo [8]
##      ano Sexo     `Situação de Matrícula`     n
##    <dbl> <chr>    <chr>                   <int>
##  1  2017 Feminino Concluída                 267
##  2  2017 Feminino Em curso                  436
##  3  2017 Feminino Evasão                    106
##  4  2017 Feminino Ingresso                  297
##  5  2018 Feminino Concluída                 215
##  6  2018 Feminino Em curso                  452
##  7  2018 Feminino Evasão                    116
##  8  2018 Feminino Ingresso                  288
##  9  2019 Feminino Concluída                 223
## 10  2019 Feminino Em curso                  420
## # ℹ 22 more rows
# Criando o gráfico de barras empilhadas
grafico_empilhado_manu2 <- ggplot(contagem_alunos_manu2, aes(x = as.factor(ano), y = n, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de Alunos para Manunt. e Suport. em Infor.", x = "Ano", y = "Número de Alunos") +
  geom_text(aes(label = format(round(n, 1), nsmall = 0)), position = position_stack(vjust = 0.5), color = "black") +
  facet_wrap(~Sexo, ncol = 1, scales = "free_y")

print(grafico_empilhado_manu2)

ggsave("grafico_contagem_alunos_manu2.png", grafico_empilhado_manu2)
## Saving 7 x 5 in image
#Criando a contagem de alunos por sexo para o curso de Informática e empilhando os dados por Situação da Matrícula
contagem_mulher_info2 <- dado_mulher_info %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_mulher_info2)

contagem_homem_info2 <- dado_homem_info %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
print(contagem_homem_info2)
## # A tibble: 16 × 4
## # Groups:   ano, Sexo [4]
##      ano Sexo      `Situação de Matrícula`     n
##    <dbl> <chr>     <chr>                   <int>
##  1  2017 Masculino Concluída                3540
##  2  2017 Masculino Em curso                 9840
##  3  2017 Masculino Evasão                   2861
##  4  2017 Masculino Ingresso                 6157
##  5  2018 Masculino Concluída                3801
##  6  2018 Masculino Em curso                11175
##  7  2018 Masculino Evasão                   2309
##  8  2018 Masculino Ingresso                 6033
##  9  2019 Masculino Concluída                4506
## 10  2019 Masculino Em curso                11054
## 11  2019 Masculino Evasão                   2158
## 12  2019 Masculino Ingresso                 6188
## 13  2020 Masculino Concluída                2078
## 14  2020 Masculino Em curso                13838
## 15  2020 Masculino Evasão                   1363
## 16  2020 Masculino Ingresso                 6500
contagem_alunos_info2 <- bind_rows(contagem_mulher_info2, contagem_homem_info2)
#print(contagem_alunos_info2)

# Criando o gráfico de barras empilhadas
grafico_empilhado_info2 <- ggplot(contagem_alunos_info2, aes(x = as.factor(ano), y = n, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de Alunos para Infor.", x = "Ano", y = "Número de Alunos") +
  geom_text(aes(label = format(round(n, 1), nsmall = 0)), position = position_stack(vjust = 0.5), color = "black") +
  facet_wrap(~Sexo, ncol = 1, scales = "free_y")

print(grafico_empilhado_info2)

ggsave("grafico_contagem_alunos_info2.png", grafico_empilhado_info2)
## Saving 7 x 5 in image

3.2. Ingresso Feminino nos Cursos da Pesquisa

Vamos dar uma olhada no percentual de ingresso e matrículas em Curso por parte das mulheres e dos homens para os cursos de Manutenção e Suporte em Informáitca e Técnico em Informática.

3.2.1. Primeiro vamos nos debruçar sobre os dados de Ingresso para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

3.2.1.1. Vamos olhar inicialmente os dados Feminos para vermos o percentual de ingresso por parte das mulheres para os cursos da pesquisa

# Fazendo o cálculo feminino para ingresso para o curso de Manutenção e Suporte em informática
dado_ingresso_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_mulher = (total_alunas / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_mulher_manu <- dado_ingresso_mulher_manu %>%
  filter(Sexo == "Feminino")

unique(dado_ingresso_mulher_manu$percentual_ingresso_mulher)
## [1] 31.76471 34.99392 37.61006 38.29787
print(dado_ingresso_mulher_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunas total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Man… Femi…          297            935
## 2  2018 Ingresso               Técnico em Man… Femi…          288            823
## 3  2019 Ingresso               Técnico em Man… Femi…          299            795
## 4  2020 Ingresso               Técnico em Man… Femi…          306            799
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_mulher <dbl>
write_csv2(dado_ingresso_mulher_manu, "Percentual_mulheres_manu_ingresso.csv")

grafico_ingresso_mulher_manu <- ggplot(dado_ingresso_mulher_manu, aes(x = as.factor(ano), y = percentual_ingresso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminino de ingresso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulher_manu)

ggsave("dados_percentual_Mulher_ingresso_Man.png", grafico_ingresso_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo feminino para ingresso para o curso de Informática
dado_ingresso_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_mulher = (total_alunas / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_mulher_info <- dado_ingresso_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_ingresso_mulher_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunas total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Inf… Femi…         3759           9916
## 2  2018 Ingresso               Técnico em Inf… Femi…         4406          10439
## 3  2019 Ingresso               Técnico em Inf… Femi…         4658          10846
## 4  2020 Ingresso               Técnico em Inf… Femi…         4807          11307
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_mulher <dbl>
write_csv2(dado_ingresso_mulher_info, "Percentual_mulheres_infor_ingresso.csv")

grafico_ingresso_mulher_info <- ggplot(dado_ingresso_mulher_info, aes(x = as.factor(ano), y = percentual_ingresso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminina de ingresso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulher_info)

ggsave("dados_percentual_Mulher_ingresso_Info.png", grafico_ingresso_mulher_info)
## Saving 7 x 5 in image

3.2.1.2. Analisando o percentual de meninos para os cursos base desse pesquisa

# Fazendo o cálculo Masculino para ingresso para o curso de Manutenção e Suporte em informática
dado_ingresso_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_homem = (total_alunos / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_homem_manu <- dado_ingresso_homem_manu %>%
  filter(Sexo == "Masculino")

print(dado_ingresso_homem_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunos total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Man… Masc…          638            935
## 2  2018 Ingresso               Técnico em Man… Masc…          535            823
## 3  2019 Ingresso               Técnico em Man… Masc…          496            795
## 4  2020 Ingresso               Técnico em Man… Masc…          493            799
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_homem <dbl>
write_csv2(dado_ingresso_homem_manu, "Percentual_homens_manu_ingresso.csv")

grafico_ingresso_homem_manu <- ggplot(dado_ingresso_homem_manu, aes(x = as.factor(ano), y = percentual_ingresso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino ingresso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_ingresso_homem_manu)

ggsave("dados_percentual_Homem_ingresso_Man.png", grafico_ingresso_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo masculino para ingresso em curso para o curso de Informática
dado_ingresso_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_homem = (total_alunos / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_homem_info <- dado_ingresso_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_ingresso_homem_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunos total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Inf… Masc…         6157           9916
## 2  2018 Ingresso               Técnico em Inf… Masc…         6033          10439
## 3  2019 Ingresso               Técnico em Inf… Masc…         6188          10846
## 4  2020 Ingresso               Técnico em Inf… Masc…         6500          11307
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_homem <dbl>
write_csv2(dado_ingresso_homem_info, "Percentual_homens_infor_ingresso.csv")

grafico_ingresso_homem_info <- ggplot(dado_ingresso_homem_info, aes(x = as.factor(ano), y = percentual_ingresso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_ingresso_homem_info)

ggsave("dados_percentual_Homem_ingresso_Info.png", grafico_ingresso_homem_info)
## Saving 7 x 5 in image
# Criando a variavél percentual_ingresso comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_ingresso_mulher_manu2 <- dado_ingresso_mulher_manu %>%
  mutate(percentual_ingresso = percentual_ingresso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_ingresso_homem_manu2 <- dado_ingresso_homem_manu %>%
  mutate(percentual_ingresso = percentual_ingresso_homem)
#print(dado_ingresso_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
ingresso_mulheres_homens_manu <- bind_rows(dado_ingresso_mulher_manu2, dado_ingresso_homem_manu2)

write_csv2(ingresso_mulheres_homens_manu, "Percentual_Mulheres&Homens_ingresso_manu.csv")

grafico_ingresso_mulheres_homens_manu <- ggplot(ingresso_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_ingresso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual ingresso para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_ingresso_manu.png", grafico_ingresso_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_ingresso comum os dois csvs de infor. para trabalhar no gráfico
dado_ingresso_mulher_info2 <- dado_ingresso_mulher_info %>%
  mutate(percentual_ingresso = percentual_ingresso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_ingresso_homem_info2 <- dado_ingresso_homem_info %>%
  mutate(percentual_ingresso = percentual_ingresso_homem)
#print(dado_ingresso_homem_manu2)

ingresso_mulheres_homens_infor <- bind_rows(dado_ingresso_mulher_info2, dado_ingresso_homem_info2)

write_csv2(ingresso_mulheres_homens_infor, "Percentual_Mulheres&Homens_ingresso_infor.csv")

grafico_ingresso_mulheres_homens_infor <- ggplot(ingresso_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_ingresso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual ingresso para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_ingresso_infor.png", grafico_ingresso_mulheres_homens_infor)
## Saving 7 x 5 in image

3.3 - Permanência

3.3.1 - Agora vamos vamos nos debruçar sobre os dados femininos com matriculas “Em Curso” para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

3.3.1.1. Vamos olhar inicialmente os dados Feminos para vermos o percentual de matriculas Em Curso por parte das mulheres para os cursos da pesquisa.

# Fazendo o cálculo feminino para matrículas em curso para o curso de Manutenção e Suporte em informática
dado_emCurso_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_mulher = (total_alunas / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_mulher_manu <- dado_emCurso_mulher_manu %>%
  filter(Sexo == "Feminino")

print(dado_emCurso_mulher_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunas total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Man… Femi…          436          1260
## 2  2018 Em curso                Técnico em Man… Femi…          452          1366
## 3  2019 Em curso                Técnico em Man… Femi…          420          1273
## 4  2020 Em curso                Técnico em Man… Femi…          580          1674
## # ℹ 1 more variable: percentual_emCurso_mulher <dbl>
write_csv2(dado_emCurso_mulher_manu, "Percentual_mulheres_manu_emCurso.csv")

grafico_emCurso_mulher_manu <- ggplot(dado_emCurso_mulher_manu, aes(x = as.factor(ano), y = percentual_emCurso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminino em curso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulher_manu)

ggsave("dados_percentual_Mulher_emCurso_Man.png", grafico_emCurso_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo feminino para matrículas em curso para o curso de Informática
dado_emCurso_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_mulher = (total_alunas / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_mulher_info <- dado_emCurso_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_emCurso_mulher_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunas total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Inf… Femi…         5807         15647
## 2  2018 Em curso                Técnico em Inf… Femi…         6565         17740
## 3  2019 Em curso                Técnico em Inf… Femi…         7200         18254
## 4  2020 Em curso                Técnico em Inf… Femi…         9803         23641
## # ℹ 1 more variable: percentual_emCurso_mulher <dbl>
write_csv2(dado_emCurso_mulher_info, "Percentual_mulheres_infor_emCurso.csv")

grafico_emCurso_mulher_info <- ggplot(dado_emCurso_mulher_info, aes(x = as.factor(ano), y = percentual_emCurso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminina em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulher_info)

ggsave("dados_percentual_Mulher_emCurso_Info.png", grafico_emCurso_mulher_info)
## Saving 7 x 5 in image

3.3.1.2. Analisando o percentual de meninos para os cursos base desse pesquisa

# Fazendo o cálculo Masculino para matrículas em curso para o curso de Manutenção e Suporte em informática
dado_emCurso_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_homem = (total_alunos / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_homem_manu <- dado_emCurso_homem_manu %>%
  filter(Sexo == "Masculino")

print(dado_emCurso_homem_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunos total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Man… Masc…          824          1260
## 2  2018 Em curso                Técnico em Man… Masc…          914          1366
## 3  2019 Em curso                Técnico em Man… Masc…          853          1273
## 4  2020 Em curso                Técnico em Man… Masc…         1094          1674
## # ℹ 1 more variable: percentual_emCurso_homem <dbl>
write_csv2(dado_emCurso_homem_manu, "Percentual_homens_manu_emCurso.csv")

grafico_emCurso_homem_manu <- ggplot(dado_emCurso_homem_manu, aes(x = as.factor(ano), y = percentual_emCurso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_emCurso_homem_manu)

ggsave("dados_percentual_Homem_emCurso_Man.png", grafico_emCurso_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo masculino para matrículas em curso para o curso de Informática
dado_emCurso_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` =="Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_homem = (total_alunos / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_homem_info <- dado_emCurso_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_emCurso_homem_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunos total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Inf… Masc…         9840         15647
## 2  2018 Em curso                Técnico em Inf… Masc…        11175         17740
## 3  2019 Em curso                Técnico em Inf… Masc…        11054         18254
## 4  2020 Em curso                Técnico em Inf… Masc…        13838         23641
## # ℹ 1 more variable: percentual_emCurso_homem <dbl>
write_csv2(dado_emCurso_homem_info, "Percentual_homens_infor_emCurso.csv")

grafico_emCurso_homem_info <- ggplot(dado_emCurso_homem_info, aes(x = as.factor(ano), y = percentual_emCurso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_emCurso_homem_info)

ggsave("dados_percentual_Homem_emCurso_Info.png", grafico_emCurso_homem_info)
## Saving 7 x 5 in image

3.3.1.3. Vamos observar os dados de matrículas em curso para os dois cursos e para amos os sexos em paralelo

# Criando a variavél percentual_emCurso comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_emCurso_mulher_manu2 <- dado_emCurso_mulher_manu %>%
  mutate(percentual_emCurso = percentual_emCurso_mulher)
#print(dado_emCurso_mulher_manu2)

dado_emCurso_homem_manu2 <- dado_emCurso_homem_manu %>%
  mutate(percentual_emCurso = percentual_emCurso_homem)
#print(dado_ingresso_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
emCurso_mulheres_homens_manu <- bind_rows(dado_emCurso_mulher_manu2, dado_emCurso_homem_manu2)

#print(emCurso_mulheres_homens_manu)
write_csv2(emCurso_mulheres_homens_manu, "Percentual_Mulheres&Homens_emCurso_manu.csv")

grafico_emCurso_mulheres_homens_manu <- ggplot(emCurso_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_emCurso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas emCurso para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_emCurso_manu.png", grafico_emCurso_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_emCurso comum os dois csvs de infor. para trabalhar no gráfico
dado_emCurso_mulher_info2 <- dado_emCurso_mulher_info %>%
  mutate(percentual_emCurso = percentual_emCurso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_emCurso_homem_info2 <- dado_emCurso_homem_info %>%
  mutate(percentual_emCurso = percentual_emCurso_homem)
#print(dado_ingresso_homem_manu2)

emCurso_mulheres_homens_infor <- bind_rows(dado_emCurso_mulher_info2, dado_emCurso_homem_info2)

write_csv2(emCurso_mulheres_homens_infor, "Percentual_Mulheres&Homens_emCurso_infor.csv")

grafico_emCurso_mulheres_homens_infor <- ggplot(emCurso_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_emCurso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas emCurso para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_emCurso_infor.png", grafico_emCurso_mulheres_homens_infor)
## Saving 7 x 5 in image

3.4 - Evasão

3.4.1. Evasão Feminina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de evasão feminina para o curso de Manutenção e Suporte em informática
dado_evasao_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_evasao = first(total_evasao),
            percentual_evasao_mulher = (total_alunas / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_mulher_manu <- dado_evasao_mulher_manu %>%
  filter(Sexo == "Feminino")

print(dado_evasao_mulher_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunas total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Manu… Femi…          106          309
## 2  2018 Evasão                  Técnico em Manu… Femi…          116          336
## 3  2019 Evasão                  Técnico em Manu… Femi…           84          279
## 4  2020 Evasão                  Técnico em Manu… Femi…           67          202
## # ℹ 1 more variable: percentual_evasao_mulher <dbl>
write_csv2(dado_evasao_mulher_manu, "Percentual_mulheres_manu_evasao.csv")

grafico_evasao_mulher_manu <- ggplot(dado_evasao_mulher_manu, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulher_manu)

ggsave("dados_percentual_Mulher_evasao_Man.png", grafico_evasao_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de evasão feminina para o curso de Informática
dado_evasao_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_evasao = first(total_evasao),
            percentual_evasao_mulher = (total_alunas / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_mulher_info <- dado_evasao_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_evasao_mulher_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunas total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Info… Femi…         1819         4680
## 2  2018 Evasão                  Técnico em Info… Femi…         1542         3851
## 3  2019 Evasão                  Técnico em Info… Femi…         1354         3512
## 4  2020 Evasão                  Técnico em Info… Femi…          929         2292
## # ℹ 1 more variable: percentual_evasao_mulher <dbl>
write_csv2(dado_evasao_mulher_info, "Percentual_mulheres_infor_evasao.csv")

grafico_evasao_mulher_info <- ggplot(dado_evasao_mulher_info, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulher_info)

ggsave("dados_percentual_Mulher_evasao_Info.png", grafico_evasao_mulher_info)
## Saving 7 x 5 in image

3.4.2. Evasão Masculina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de evasão Masculina para o curso de Manutenção e Suporte em informática
dado_evasao_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_evasao = first(total_evasao),
            percentual_evasao_homem = (total_alunos / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_homem_manu <- dado_evasao_homem_manu %>%
  filter(Sexo == "Masculino")

print(dado_evasao_homem_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunos total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Manu… Masc…          203          309
## 2  2018 Evasão                  Técnico em Manu… Masc…          220          336
## 3  2019 Evasão                  Técnico em Manu… Masc…          195          279
## 4  2020 Evasão                  Técnico em Manu… Masc…          135          202
## # ℹ 1 more variable: percentual_evasao_homem <dbl>
write_csv2(dado_evasao_homem_manu, "Percentual_homens_manu_evasao.csv")

grafico_evasao_homem_manu <- ggplot(dado_evasao_homem_manu, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_evasao_homem_manu)

ggsave("dados_percentual_Homem_evasao_Man.png", grafico_evasao_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de evasão masculina para o curso de Informática
dado_evasao_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_evasao = first(total_evasao),
            percentual_evasao_homem = (total_alunos / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_homem_info <- dado_evasao_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_evasao_homem_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunos total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Info… Masc…         2861         4680
## 2  2018 Evasão                  Técnico em Info… Masc…         2309         3851
## 3  2019 Evasão                  Técnico em Info… Masc…         2158         3512
## 4  2020 Evasão                  Técnico em Info… Masc…         1363         2292
## # ℹ 1 more variable: percentual_evasao_homem <dbl>
write_csv2(dado_evasao_homem_info, "Percentual_homens_infor_evasao.csv")

grafico_evasao_homem_info <- ggplot(dado_evasao_homem_info, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_evasao_homem_info)

ggsave("dados_percentual_Homem_evasao_Info.png", grafico_evasao_homem_info)
## Saving 7 x 5 in image

3.4.3. Analisando a evasao para os dois cursos e para ambos os sexos

# Criando a variavél percentual_evasao comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_evasao_mulher_manu2 <- dado_evasao_mulher_manu %>%
  mutate(percentual_evasao = percentual_evasao_mulher)
#print(dado_evasao_mulher_manu2)

dado_evasao_homem_manu2 <- dado_evasao_homem_manu %>%
  mutate(percentual_evasao = percentual_evasao_homem)
#print(dado_evasao_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
evasao_mulheres_homens_manu <- bind_rows(dado_evasao_mulher_manu2, dado_evasao_homem_manu2)

#print(evasao_mulheres_homens_manu)
write_csv2(evasao_mulheres_homens_manu, "Percentual_Mulheres&Homens_evasao_manu.csv")

grafico_evasao_mulheres_homens_manu <- ggplot(evasao_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_evasao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas evasao para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_evasao_manu.png", grafico_evasao_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_evasao comum os dois csvs de infor. para trabalhar no gráfico
dado_evasao_mulher_info2 <- dado_evasao_mulher_info %>%
  mutate(percentual_evasao = percentual_evasao_mulher)
#print(dado_evasao_mulher_manu2)

dado_evasao_homem_info2 <- dado_evasao_homem_info %>%
  mutate(percentual_evasao = percentual_evasao_homem)
#print(dado_evasao_homem_manu2)

evasao_mulheres_homens_infor <- bind_rows(dado_evasao_mulher_info2, dado_evasao_homem_info2)

write_csv2(evasao_mulheres_homens_infor, "Percentual_Mulheres&Homens_evasao_infor.csv")

grafico_evasao_mulheres_homens_infor <- ggplot(evasao_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_evasao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas evasao para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_evasao_infor.png", grafico_evasao_mulheres_homens_infor)
## Saving 7 x 5 in image

3.5 - Conclusão

Agora vamos dar uma olhada no percentual de conclusão de curso por parte das mulheres e dos homens para os cursos de Manutenção e Suporte em Informáitca.

3.5.1. Primeiro vamos nos debruçar sobre os dados de conclusão feminina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de conclusão feminina para o curso de Manutenção e Suporte em informática
dado_conclusao_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_mulher = (total_alunas / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_mulher_manu <- dado_conclusao_mulher_manu %>%
  filter(Sexo == "Feminino")

print(dado_conclusao_mulher_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`               Sexo  total_alunas
##   <dbl> <chr>                   <chr>                         <chr>        <int>
## 1  2017 Concluída               Técnico em Manutenção e Supo… Femi…          267
## 2  2018 Concluída               Técnico em Manutenção e Supo… Femi…          215
## 3  2019 Concluída               Técnico em Manutenção e Supo… Femi…          223
## 4  2020 Concluída               Técnico em Manutenção e Supo… Femi…           85
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_mulher <dbl>
write_csv2(dado_conclusao_mulher_manu, "Percentual_mulhres_manu_conclusao.csv")

grafico_conclusao_mulher_manu <- ggplot(dado_conclusao_mulher_manu, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulher_manu)

ggsave("dados_percentual_Mulher_conclusao_Man.png", grafico_conclusao_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de conclusão feminina para o curso de Informática
dado_conclusao_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_mulher = (total_alunas / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_mulher_info <- dado_conclusao_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_conclusao_mulher_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`        Sexo     total_alunas
##   <dbl> <chr>                   <chr>                  <chr>           <int>
## 1  2017 Concluída               Técnico em Informática Feminino         2387
## 2  2018 Concluída               Técnico em Informática Feminino         2350
## 3  2019 Concluída               Técnico em Informática Feminino         2839
## 4  2020 Concluída               Técnico em Informática Feminino         1369
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_mulher <dbl>
write_csv2(dado_conclusao_mulher_info, "Percentual_mulhres_infor_conclusao.csv")

grafico_conclusao_mulher_info <- ggplot(dado_conclusao_mulher_info, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulher_info)

ggsave("dados_percentual_Mulher_conclusao_Info.png", grafico_conclusao_mulher_info)
## Saving 7 x 5 in image

3.5.2. Agora vamos nos debruçar sobre os dados de conclusão masculina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de conclusão Masculina para o curso de Manutenção e Suporte em informática
dado_conclusao_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_homem = (total_alunos / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_homem_manu <- dado_conclusao_homem_manu %>%
  filter(Sexo == "Masculino")
  
print(dado_conclusao_homem_manu)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`               Sexo  total_alunos
##   <dbl> <chr>                   <chr>                         <chr>        <int>
## 1  2017 Concluída               Técnico em Manutenção e Supo… Masc…          463
## 2  2018 Concluída               Técnico em Manutenção e Supo… Masc…          415
## 3  2019 Concluída               Técnico em Manutenção e Supo… Masc…          425
## 4  2020 Concluída               Técnico em Manutenção e Supo… Masc…          168
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_homem <dbl>
write_csv2(dado_conclusao_homem_manu, "Percentual_homens_manu_conclusao.csv")

grafico_conclusao_homem_manu <- ggplot(dado_conclusao_homem_manu, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Masculina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_conclusao_homem_manu)

ggsave("dados_percentual_Homem_conclusao_Man.png", grafico_conclusao_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de conclusão masculina para o curso de Informática
dado_conclusao_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_homem = (total_alunos / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_homem_info <- dado_conclusao_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_conclusao_homem_info)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`        Sexo      total_alunos
##   <dbl> <chr>                   <chr>                  <chr>            <int>
## 1  2017 Concluída               Técnico em Informática Masculino         3540
## 2  2018 Concluída               Técnico em Informática Masculino         3801
## 3  2019 Concluída               Técnico em Informática Masculino         4506
## 4  2020 Concluída               Técnico em Informática Masculino         2078
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_homem <dbl>
write_csv2(dado_conclusao_homem_info, "Percentual_homens_infor_conclusao.csv")

grafico_conclusao_homem_info <- ggplot(dado_conclusao_homem_info, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Masculina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_conclusao_homem_info)

ggsave("dados_percentual_Homem_conclusao_Info.png", grafico_conclusao_homem_info)
## Saving 7 x 5 in image

3.5.3. Analisando os dados de conclusão para os dois cursos e para ambos os sexos

# Criando a variavél percentual_conclusao comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_conclusao_mulher_manu2 <- dado_conclusao_mulher_manu %>%
  mutate(percentual_conclusao = percentual_conclusao_mulher)
#print(dado_conclusao_mulher_manu2)

dado_conclusao_homem_manu2 <- dado_conclusao_homem_manu %>%
  mutate(percentual_conclusao = percentual_conclusao_homem)
#print(dado_conclusao_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
conclusao_mulheres_homens_manu <- bind_rows(dado_conclusao_mulher_manu2, dado_conclusao_homem_manu2)

#print(conclusao_mulheres_homens_manu)
write_csv2(conclusao_mulheres_homens_manu, "Percentual_Mulheres&Homens_conclusao_manu.csv")

grafico_conclusao_mulheres_homens_manu <- ggplot(conclusao_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_conclusao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas conclusao para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_conclusao_manu.png", grafico_conclusao_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_conclusao comum os dois csvs de infor. para trabalhar no gráfico
dado_conclusao_mulher_info2 <- dado_conclusao_mulher_info %>%
  mutate(percentual_conclusao = percentual_conclusao_mulher)
#print(dado_conclusao_mulher_manu2)

dado_conclusao_homem_info2 <- dado_conclusao_homem_info %>%
  mutate(percentual_conclusao = percentual_conclusao_homem)
#print(dado_conclusao_homem_manu2)

conclusao_mulheres_homens_infor <- bind_rows(dado_conclusao_mulher_info2, dado_conclusao_homem_info2)

write_csv2(conclusao_mulheres_homens_infor, "Percentual_Mulheres&Homens_conclusao_infor.csv")

grafico_conclusao_mulheres_homens_infor <- ggplot(conclusao_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_conclusao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas conclusao para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_conclusao_infor.png", grafico_conclusao_mulheres_homens_infor)
## Saving 7 x 5 in image

Agora que já temos uma visão geral sobre Ingresso, Em curso, Evasão e Conclusão Feminina para todos os Institutos Federais do Brasil; vamos nos debruçar sobre os dados do Instituto Federal da Paraíba (IFPB) para vermos os dados específicos para o estado onde a pesquisa está sendo realizada.

4. Nível Paraíba

Gerando os dados sobre o IFPB para realização de todas as análises posteriores

#Pegando os dados femininos para os cursos Técnico em Manutenção e Suporte em Informática e Técnico em Informática no IFPB
dado_mulher_manu_IFPB <- dado_mulher_manu %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_manu_IFPB)
write_csv2(dado_mulher_manu_IFPB, "dados_manu_mulher_IFPB.csv")

dado_mulher_info_IFPB <- dado_mulher_info %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_info_IFPB)
write_csv2(dado_mulher_info_IFPB, "dados_info_mulher_IFPB.csv")

#Pegando os dados masculinos para os cursos Técnico em Manutenção e Suporte em Informática e Técnico em Informática no IFPB
dado_homem_manu_IFPB <- dado_homem_manu %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_manu_IFPB)
write_csv2(dado_homem_manu_IFPB, "dados_manu_homem_IFPB.csv")

dado_homem_info_IFPB <- dado_homem_info %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_info_IFPB)
write_csv2(dado_homem_info_IFPB, "dados_info_homem_IFPB.csv")

#Dataset para o curso de Manutenção e Suporte em Informática para os dois sexo e para todos os anos
dado_manu_total_IFPB <- bind_rows(dado_mulher_manu_IFPB, dado_homem_manu_IFPB)

print(dado_manu_total_IFPB)
## # A tibble: 1,062 × 92
##    `Carga Horaria` `Carga Horaria Minima` `Co Ciclo Matricula` `Co Matricula`
##              <dbl>                  <dbl>                <dbl>          <dbl>
##  1            3667                   1000              1985886       64657151
##  2            3834                   1000               792572       34779071
##  3            3901                   1000              2150513       72077815
##  4            3901                   1000              2150513       72077310
##  5            3901                   1000              2150513       72077308
##  6            3901                   1000              2150513       72077268
##  7            3901                   1000              2150513       72077256
##  8            3901                   1000              2150513       72077254
##  9            3901                   1000              2150513       72077196
## 10            3901                   1000              2150513       72077306
## # ℹ 1,052 more rows
## # ℹ 88 more variables: `Cor / Raça` <chr>, `Dt Data Fim Previsto` <chr>,
## #   `Data de Inicio do Ciclo` <chr>, `Dt Ocorrencia Matricula` <chr>,
## #   `Eixo Tecnológico` <chr>, `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>, …
write_csv2(dado_manu_total_IFPB, "dados_manu_total2017a2021_IFPB.csv")

#Dataset para o curso de Informática para os dois sexo e para todos os anos
dado_info_total_IFPB <- bind_rows(dado_mulher_info_IFPB, dado_homem_info_IFPB)

print(dado_info_total_IFPB)
## # A tibble: 4,822 × 92
##    `Carga Horaria` `Carga Horaria Minima` `Co Ciclo Matricula` `Co Matricula`
##              <dbl>                  <dbl>                <dbl>          <dbl>
##  1            3634                   1000              2022975       66836167
##  2            3634                   1000              2022975       66836169
##  3            3634                   1000              2022975       66836181
##  4            3634                   1000              2022975       66836183
##  5            3634                   1000              2022975       66836165
##  6            3634                   1000              2022975       66836173
##  7            3300                   1000              2158043       72450376
##  8            3300                   1000              2158043       72448280
##  9            3300                   1000              2158043       72448278
## 10            3300                   1000              2158043       72448276
## # ℹ 4,812 more rows
## # ℹ 88 more variables: `Cor / Raça` <chr>, `Dt Data Fim Previsto` <chr>,
## #   `Data de Inicio do Ciclo` <chr>, `Dt Ocorrencia Matricula` <chr>,
## #   `Eixo Tecnológico` <chr>, `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>, …
write_csv2(dado_info_total_IFPB, "dados_info_total2017a2021_IFPB.csv")

4.1 - Realizando a contagem em valores absolutos e em percentuais Feminino e Masculino para os cursos Técnico em Manutenção e Suporte em Informática e Técnico em Informática no contexto do IFPB

4.1.1. Curso Técnico em Manutenção e Suporte em Informática

#Fazendo a contagem por situação de matricula e por sexo para o curso de Manutenção e Suporte em Informática
#Contagem de Ingresso
contagem_manu_ingresso_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_ingresso_IFPB)

# Contagem Em Curso
contagem_manu_emCurso_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_emCurso_IFPB)

#Contagem Evasão
contagem_manu_evasao_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` == "Evasão") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_evasao_IFPB)

#Contagem Conclusão
contagem_manu_conclusao_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu_IFPB %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_conclusao_IFPB)

contagem_manu_IFPB <- bind_rows(contagem_manu_ingresso_IFPB, contagem_manu_emCurso_IFPB, contagem_manu_evasao_IFPB, contagem_manu_conclusao_IFPB)

print(contagem_manu_IFPB)
## # A tibble: 16 × 5
##      ano `Situação de Matrícula` total_alunos total_mulheres total_homens
##    <dbl> <chr>                          <int>          <int>        <int>
##  1  2017 Ingresso                          33             21           12
##  2  2018 Ingresso                          38             21           17
##  3  2019 Ingresso                          44             31           13
##  4  2020 Ingresso                          41             30           11
##  5  2017 Em curso                         172             55          117
##  6  2018 Em curso                         127             49           78
##  7  2019 Em curso                          70             29           41
##  8  2020 Em curso                          87             55           32
##  9  2017 Evasão                            45             15           30
## 10  2018 Evasão                            26             11           15
## 11  2019 Evasão                            17              7           10
## 12  2020 Evasão                             4              3            1
## 13  2017 Concluída                        177             75          102
## 14  2018 Concluída                         63             18           45
## 15  2019 Concluída                         74             34           40
## 16  2020 Concluída                         44             14           30
contagem_mulher_manu_IFPB <- contagem_manu_IFPB %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_mulheres = total_mulheres) %>%
  summarise(total_alunos, total_mulheres, percentual_alunas_manu = (total_mulheres / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_mulher_manu_IFPB)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano `Situação de Matrícula` total_alunos total_mulheres
##    <dbl> <chr>                          <int>          <int>
##  1  2017 Concluída                        177             75
##  2  2017 Em curso                         172             55
##  3  2017 Evasão                            45             15
##  4  2017 Ingresso                          33             21
##  5  2018 Concluída                         63             18
##  6  2018 Em curso                         127             49
##  7  2018 Evasão                            26             11
##  8  2018 Ingresso                          38             21
##  9  2019 Concluída                         74             34
## 10  2019 Em curso                          70             29
## 11  2019 Evasão                            17              7
## 12  2019 Ingresso                          44             31
## 13  2020 Concluída                         44             14
## 14  2020 Em curso                          87             55
## 15  2020 Evasão                             4              3
## 16  2020 Ingresso                          41             30
## # ℹ 1 more variable: percentual_alunas_manu <dbl>
write_csv2(contagem_mulher_manu_IFPB, "percentual_mulheres_IFPB_manutencaoESuporteInfor_SituacaoMatricula.csv")

cores_rgb1 <- c("#DC143C", "#CD5C5C", "#FF0000", "#FFC0CB")

# Criação do gráfico com os valores absolutos do número de mulheres para Manutenção e Suporte em Informática
grafico_contagem_mulheres_manu_IFPB <- ggplot(contagem_mulher_manu_IFPB, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de mulheres no IFPB para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_mulheres, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulheres_manu_IFPB)

ggsave("contagem_mulher_IFPB_manu.png", grafico_contagem_mulheres_manu_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de mulheres para Manutenção e Suporte em Informática
grafico_contagem_mulher_manu_IFPB <- ggplot(contagem_mulher_manu_IFPB, aes(x = as.factor(ano), y = percentual_alunas_manu, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de mulheres no IFPB para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunas_manu, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_manu_IFPB)

ggsave("percentual_mulher_IFPB_manu.png", grafico_contagem_mulher_manu_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_mulher_manu_IFPB2 <- ggplot(contagem_mulher_manu_IFPB, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunas IFPB por Situação de Matrícula - Curso de Manutenção", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_mulheres), 0), "\n", format(round(percentual_alunas_manu), 0), "%")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, -0.5, 1), color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_manu_IFPB2)

ggsave("grafico_contagem_Mulher_manu_IFPB_ambos.png", grafico_contagem_mulher_manu_IFPB2)
## Saving 7 x 5 in image
# Cálculo do percentual de alunos por situação de matrícula para Manutenção e Suporte em Informática
contagem_homem_manu_IFPB <- contagem_manu_IFPB %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_homens = total_homens) %>%
  summarise(total_alunos, total_homens, percentual_alunos_manu = (total_homens / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_homem_manu_IFPB)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano Situação de Matrícul…¹ total_alunos total_homens percentual_alunos_manu
##    <dbl> <chr>                         <int>        <int>                  <dbl>
##  1  2017 Concluída                       177          102                   57.6
##  2  2017 Em curso                        172          117                   68.0
##  3  2017 Evasão                           45           30                   66.7
##  4  2017 Ingresso                         33           12                   36.4
##  5  2018 Concluída                        63           45                   71.4
##  6  2018 Em curso                        127           78                   61.4
##  7  2018 Evasão                           26           15                   57.7
##  8  2018 Ingresso                         38           17                   44.7
##  9  2019 Concluída                        74           40                   54.1
## 10  2019 Em curso                         70           41                   58.6
## 11  2019 Evasão                           17           10                   58.8
## 12  2019 Ingresso                         44           13                   29.5
## 13  2020 Concluída                        44           30                   68.2
## 14  2020 Em curso                         87           32                   36.8
## 15  2020 Evasão                            4            1                   25  
## 16  2020 Ingresso                         41           11                   26.8
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
write_csv2(contagem_homem_manu_IFPB, "percentual_homens_IFPB_manutencaoESuporteInfor_SituacaoMatricula.csv")

cores_rgb <- c("#00008B", "#4169E1", "#0000FF", "#ADD8E6")

# Criação do gráfico com os valores absolutos do número de homens para Manutenção e Suporte em Informática
grafico_contagem_homens_manu_IFPB <- ggplot(contagem_homem_manu_IFPB, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de homens no IFPB para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_homens, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homens_manu_IFPB)

ggsave("contagem_homem_IFPB_manu.png", grafico_contagem_homens_manu_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de homens para Manutenção e Suporte em Informática
grafico_contagem_homem_manu_IFPB <- ggplot(contagem_homem_manu_IFPB, aes(x = as.factor(ano), y = percentual_alunos_manu, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de homens no IFPB para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunos_manu, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_manu_IFPB)

ggsave("percentual_homem_IFPB_manu.png", grafico_contagem_homem_manu_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_homem_manu_IFPB2 <- ggplot(contagem_homem_manu_IFPB, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunos IFPB por Situação de Matrícula - Curso de Manutenção", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_homens), 0), "\n", format(round(percentual_alunos_manu), 0), "%")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, -0.2, -1), color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_manu_IFPB2)

ggsave("grafico_contagem_Homem_manu_IFPB_ambos.png", grafico_contagem_homem_manu_IFPB2)
## Saving 7 x 5 in image

4.1.2. Curso Técnico em Informática

#Fazendo a contagem por situação de matricula e por sexo para o curso de Informática
# Contagem de Ingresso
contagem_info_ingresso_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_info_IFPB %>%
    filter(`Situação de Matrícula` == "Ingresso") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info_IFPB %>%
    filter(`Situação de Matrícula` == "Ingresso") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Em Curso
contagem_info_emCurso_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info_IFPB %>%
    filter(`Situação de Matrícula` == "Em curso") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info_IFPB %>%
    filter(`Situação de Matrícula` == "Em curso") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Evasão
contagem_info_evasao_IFPB <- dado_info_total_IFPB%>%
  filter(`Situação de Matrícula` == "Evasão") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info_IFPB %>%
    filter(`Situação de Matrícula` == "Evasão") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info_IFPB %>%
    filter(`Situação de Matrícula` == "Evasão") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Conclusão
contagem_info_conclusao_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info_IFPB %>%
    filter(`Situação de Matrícula` == "Concluída") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info_IFPB %>%
    filter(`Situação de Matrícula` == "Concluída") %>%
    group_by(ano, `Situação de Matrícula`) %>%
    tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Combinação de todas as contagens para Informática
contagem_info_IFPB <- bind_rows(contagem_info_ingresso_IFPB, contagem_info_emCurso_IFPB, contagem_info_evasao_IFPB, contagem_info_conclusao_IFPB)

print(contagem_info_IFPB)
## # A tibble: 16 × 5
##      ano `Situação de Matrícula` total_alunos total_mulheres total_homens
##    <dbl> <chr>                          <int>          <int>        <int>
##  1  2017 Ingresso                         332            135          197
##  2  2018 Ingresso                         282            143          139
##  3  2019 Ingresso                         359            167          192
##  4  2020 Ingresso                         525            259          266
##  5  2017 Em curso                         459            141          318
##  6  2018 Em curso                         644            227          417
##  7  2019 Em curso                         567            246          321
##  8  2020 Em curso                         670            318          352
##  9  2017 Evasão                            79             34           45
## 10  2018 Evasão                            92             42           50
## 11  2019 Evasão                           145             60           85
## 12  2020 Evasão                            59             25           34
## 13  2017 Concluída                         32              7           25
## 14  2018 Concluída                         89             25           64
## 15  2019 Concluída                        249             93          156
## 16  2020 Concluída                        239             96          143
# Cálculo do percentual de alunas por situação de matrícula para Informática
contagem_mulher_info_IFPB <- contagem_info_IFPB %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_mulheres = total_mulheres) %>%
  summarise(total_alunos, total_mulheres, percentual_alunas_info = (total_mulheres / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_mulher_info_IFPB)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano `Situação de Matrícula` total_alunos total_mulheres
##    <dbl> <chr>                          <int>          <int>
##  1  2017 Concluída                         32              7
##  2  2017 Em curso                         459            141
##  3  2017 Evasão                            79             34
##  4  2017 Ingresso                         332            135
##  5  2018 Concluída                         89             25
##  6  2018 Em curso                         644            227
##  7  2018 Evasão                            92             42
##  8  2018 Ingresso                         282            143
##  9  2019 Concluída                        249             93
## 10  2019 Em curso                         567            246
## 11  2019 Evasão                           145             60
## 12  2019 Ingresso                         359            167
## 13  2020 Concluída                        239             96
## 14  2020 Em curso                         670            318
## 15  2020 Evasão                            59             25
## 16  2020 Ingresso                         525            259
## # ℹ 1 more variable: percentual_alunas_info <dbl>
write_csv2(contagem_mulher_info_IFPB, "percentual_mulheres_IFPB_Infor_SituacaoMatricula.csv")

# Cores para o gráfico
cores_rgb1 <- c("#DC143C", "#CD5C5C", "#FF0000", "#FFC0CB")

# Criação do gráfico com valores absolutos de mulheres para o curso de Informática
grafico_contagem_mulheres_info_IFPB <- ggplot(contagem_mulher_info_IFPB, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de mulheres no IFPB para o curso de Informática", x = "Ano", y = "Percentual de alunas") +
  geom_text(aes(label = paste0(format(round(total_mulheres, 0), nsmall = 0))),
            position = position_dodge(width = 0.8), vjust = 1.5, color = "black") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulheres_info_IFPB)

ggsave("contagem_mulheres_IFPB_info.png", grafico_contagem_mulheres_info_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de mulheres para o curso de Informática
grafico_contagem_mulher_info_IFPB <- ggplot(contagem_mulher_info_IFPB, aes(x = as.factor(ano), y = percentual_alunas_info, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de mulheres no IFPB para o curso de Informática", x = "Ano", y = "Percentual de alunas") +
  geom_text(aes(label = paste0(format(round(percentual_alunas_info, 0), nsmall = 0))),
            position = position_dodge(width = 0.8), vjust = 1.5, color = "black") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_info_IFPB)

ggsave("contagem_mulher_IFPB_info.png", grafico_contagem_mulher_info_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_mulher_info_IFPB2 <- ggplot(contagem_mulher_info_IFPB, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunas IFPB por Situação de Matrícula - Curso de Informática", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_mulheres), 0), "\n(", format(round(percentual_alunas_info), 0), "%)")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, 0.5, 0.2), hjust = 0.5, color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_info_IFPB2)

ggsave("grafico_contagem_Mulher_info_IFPB_ambos.png", grafico_contagem_mulher_info_IFPB2)
## Saving 7 x 5 in image
# Cálculo do percentual de alunos por situação de matrícula para Informática
contagem_homem_info_IFPB <- contagem_info_IFPB %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_homens = total_homens) %>%
  summarise(total_alunos, total_homens, percentual_alunos_info = (total_homens / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_homem_info_IFPB)
## # A tibble: 16 × 5
## # Groups:   ano [4]
##      ano Situação de Matrícul…¹ total_alunos total_homens percentual_alunos_info
##    <dbl> <chr>                         <int>        <int>                  <dbl>
##  1  2017 Concluída                        32           25                   78.1
##  2  2017 Em curso                        459          318                   69.3
##  3  2017 Evasão                           79           45                   57.0
##  4  2017 Ingresso                        332          197                   59.3
##  5  2018 Concluída                        89           64                   71.9
##  6  2018 Em curso                        644          417                   64.8
##  7  2018 Evasão                           92           50                   54.3
##  8  2018 Ingresso                        282          139                   49.3
##  9  2019 Concluída                       249          156                   62.7
## 10  2019 Em curso                        567          321                   56.6
## 11  2019 Evasão                          145           85                   58.6
## 12  2019 Ingresso                        359          192                   53.5
## 13  2020 Concluída                       239          143                   59.8
## 14  2020 Em curso                        670          352                   52.5
## 15  2020 Evasão                           59           34                   57.6
## 16  2020 Ingresso                        525          266                   50.7
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
write_csv2(contagem_homem_info_IFPB, "percentual_homens_IFPB_Infor_SituacaoMatricula.csv")

cores_rgb <- c("#00008B", "#4169E1", "#0000FF", "#ADD8E6")

# Criação do gráfico com os valores absolutos de homens para o curso de Informática
grafico_contagem_homens_info_IFPB <- ggplot(contagem_homem_info_IFPB, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de homens no IFPB para o curso de Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_homens, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homens_info_IFPB)

ggsave("contagem_homens_IFPB_info.png", grafico_contagem_homens_info_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de homens para o curso de Informática
grafico_contagem_homem_info_IFPB <- ggplot(contagem_homem_info_IFPB, aes(x = as.factor(ano), y = percentual_alunos_info, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de homens no IFPB para o curso de Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunos_info, 0), nsmall = 0))), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_info_IFPB)

ggsave("contagem_homem_IFPB_info.png", grafico_contagem_homem_info_IFPB)
## Saving 7 x 5 in image
# Criação do gráfico empilhado com valores absolutos e percentuais em um único gráfico
grafico_contagem_Homem_info_IFPB2 <- ggplot(contagem_homem_info_IFPB, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Contagem de Alunos por Situação de Matrícula - Curso de Informática", x = "Ano", y = "Total de Alunos") +
  geom_text(aes(label = paste0(format(round(total_homens), 0), "\n(", format(round(percentual_alunos_info), 0), "%)")),
            vjust = ifelse(contagem_manu$total_alunos >= 30, 0.5, 0.5), color = "black", position = position_dodge(width = 0.9)) +
  facet_wrap(~ 'Situação de Matrícula', ncol = 1, scales = "free_y") +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_Homem_info_IFPB2)

ggsave("grafico_contagem_Homem_info_IFPB_ambos.png", grafico_contagem_Homem_info_IFPB2)
## Saving 7 x 5 in image

4.1.3. Vendo as informações de contagem e percentuais por sexo e por situação de matricula

#Criando a contagem de alunos por sexo para o curso de Manutenção e Suporte em Informática e empilhando os dados por Situação da Matrícula
contagem_mulher_manu_IFPB2 <- dado_mulher_manu_IFPB %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_mulher_manu_IFPB2)

contagem_homem_manu_IFPB2 <- dado_homem_manu_IFPB %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_homem_manu_IFPB2)

contagem_alunos_manu_IFPB2 <- bind_rows(contagem_mulher_manu_IFPB2, contagem_homem_manu_IFPB2)
print(contagem_alunos_manu_IFPB2)
## # A tibble: 32 × 4
## # Groups:   ano, Sexo [8]
##      ano Sexo     `Situação de Matrícula`     n
##    <dbl> <chr>    <chr>                   <int>
##  1  2017 Feminino Concluída                  75
##  2  2017 Feminino Em curso                   55
##  3  2017 Feminino Evasão                     15
##  4  2017 Feminino Ingresso                   21
##  5  2018 Feminino Concluída                  18
##  6  2018 Feminino Em curso                   49
##  7  2018 Feminino Evasão                     11
##  8  2018 Feminino Ingresso                   21
##  9  2019 Feminino Concluída                  34
## 10  2019 Feminino Em curso                   29
## # ℹ 22 more rows
# Criando o gráfico de barras empilhadas
grafico_empilhado_manu_IFPB2 <- ggplot(contagem_alunos_manu_IFPB2, aes(x = as.factor(ano), y = n, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de Alunos do IFPB para Manunt. e Suport. em Infor.", x = "Ano", y = "Número de Alunos") +
  geom_text(aes(label = format(round(n, 1), nsmall = 0)), position = position_stack(vjust = 0.5), color = "black") +
  facet_wrap(~Sexo, ncol = 1, scales = "free_y")

print(grafico_empilhado_manu_IFPB2)

ggsave("grafico_contagem_alunos_manu_IFPB2.png", grafico_empilhado_manu_IFPB2)
## Saving 7 x 5 in image
#Criando a contagem de alunos por sexo para o curso de Informática e empilhando os dados por Situação da Matrícula
contagem_mulher_info_IFPB2 <- dado_mulher_info_IFPB %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_mulher_manu_IFPB2)

contagem_homem_info_IFPB2 <- dado_homem_info_IFPB %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_homem_manu_IFPB2)

contagem_alunos_info_IFPB2 <- bind_rows(contagem_mulher_info_IFPB2, contagem_homem_info_IFPB2)
print(contagem_alunos_info_IFPB2)
## # A tibble: 32 × 4
## # Groups:   ano, Sexo [8]
##      ano Sexo     `Situação de Matrícula`     n
##    <dbl> <chr>    <chr>                   <int>
##  1  2017 Feminino Concluída                   7
##  2  2017 Feminino Em curso                  141
##  3  2017 Feminino Evasão                     34
##  4  2017 Feminino Ingresso                  135
##  5  2018 Feminino Concluída                  25
##  6  2018 Feminino Em curso                  227
##  7  2018 Feminino Evasão                     42
##  8  2018 Feminino Ingresso                  143
##  9  2019 Feminino Concluída                  93
## 10  2019 Feminino Em curso                  246
## # ℹ 22 more rows
# Criando o gráfico de barras empilhadas
grafico_empilhado_infor_IFPB2 <- ggplot(contagem_alunos_info_IFPB2, aes(x = as.factor(ano), y = n, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de Alunos do IFPB para Infor.", x = "Ano", y = "Número de Alunos") +
  geom_text(aes(label = format(round(n, 1), nsmall = 0)), position = position_stack(vjust = 0.5), color = "black") +
  facet_wrap(~Sexo, ncol = 1, scales = "free_y")

print(grafico_empilhado_infor_IFPB2)

ggsave("grafico_contagem_alunos_infor_IFPB2.png", grafico_empilhado_infor_IFPB2)
## Saving 7 x 5 in image

4.2 - Ingresso

4.2.1. Ingresso nos Cursos de Manut. e Suport. em Infor e Técnico em Infor para o IFPB

Gerando os dados de Ingresso para os dois cursos

# Gewrando os dados de ingresso para o curso de Manutenção e Suporte em informática
dado_ingresso_manu_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_mulher = (total_alunas / total_ingresso) * 100,
            percentual_ingresso_homem = (total_alunos / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_ingresso_mulher_manu_IFPB)

# Gewrando os dados de ingresso para o curso de Informática
dado_ingresso_info_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
   mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_mulher = (total_alunas / total_ingresso) * 100,
            percentual_ingresso_homem = (total_alunos / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_ingresso_info_IFPB)

4.2.2. Trabalhando os dados Femininos de Ingresso para os dois cursos

# Trabalhando os dados Femininos para o curso de Manutenção e Surporte em Informática
dado_ingresso_mulher_manu_IFPB <- dado_ingresso_manu_IFPB %>%
  filter(Sexo == "Feminino") %>%
  select(-total_alunos, -percentual_ingresso_homem)

#unique(dado_ingresso_mulher_manu_IFPB$percentual_ingresso_mulher)

print(dado_ingresso_mulher_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunas total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Man… Femi…           21             33
## 2  2018 Ingresso               Técnico em Man… Femi…           21             38
## 3  2019 Ingresso               Técnico em Man… Femi…           31             44
## 4  2020 Ingresso               Técnico em Man… Femi…           30             41
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_mulher <dbl>
write_csv2(dado_ingresso_mulher_manu_IFPB, "Percentual_mulheres_manu_ingresso_IFPB.csv")

grafico_ingresso_mulher_manu_IFPB <- ggplot(dado_ingresso_mulher_manu_IFPB, aes(x = as.factor(ano), y = percentual_ingresso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminino de ingresso no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulher_manu_IFPB)

ggsave("dados_percentual_Mulher_ingresso_Man_IFPB.png", grafico_ingresso_mulher_manu_IFPB)
## Saving 7 x 5 in image
# Trabalhando os dados Femininos para o curso de Informática
dado_ingresso_mulher_info_IFPB <- dado_ingresso_info_IFPB %>%
  filter(Sexo == "Feminino")%>%
  select(-total_alunos, -percentual_ingresso_homem)

print(dado_ingresso_mulher_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunas total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Inf… Femi…          135            332
## 2  2018 Ingresso               Técnico em Inf… Femi…          143            282
## 3  2019 Ingresso               Técnico em Inf… Femi…          167            359
## 4  2020 Ingresso               Técnico em Inf… Femi…          259            525
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_mulher <dbl>
write_csv2(dado_ingresso_mulher_info_IFPB, "Percentual_mulheres_infor_ingresso_IFPB.csv")

grafico_ingresso_mulher_info_IFPB <- ggplot(dado_ingresso_mulher_info_IFPB, aes(x = as.factor(ano), y = percentual_ingresso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminina de ingresso do IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulher_info_IFPB)

ggsave("dados_percentual_Mulher_ingresso_Info_IFPB.png", grafico_ingresso_mulher_info_IFPB)
## Saving 7 x 5 in image

4.2.3. Trabalhando os dados Masculinos de Ingresso para os dois cursos

# Trabalhando os dados Masculinos para o curso de Manutenção e Surporte em Informática
dado_ingresso_homem_manu_IFPB <- dado_ingresso_manu_IFPB %>%
  filter(Sexo == "Masculino") %>%
  select(-total_alunas, -percentual_ingresso_mulher)

print(dado_ingresso_homem_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunos total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Man… Masc…           12             33
## 2  2018 Ingresso               Técnico em Man… Masc…           17             38
## 3  2019 Ingresso               Técnico em Man… Masc…           13             44
## 4  2020 Ingresso               Técnico em Man… Masc…           11             41
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_homem <dbl>
write_csv2(dado_ingresso_homem_manu_IFPB, "Percentual_homens_manu_ingresso_IFPB.csv")

grafico_ingresso_homem_manu_IFPB <- ggplot(dado_ingresso_homem_manu_IFPB, aes(x = as.factor(ano), y = percentual_ingresso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino ingresso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_ingresso_homem_manu_IFPB)

ggsave("dados_percentual_Homem_ingresso_Man_IFPB.png", grafico_ingresso_homem_manu_IFPB)
## Saving 7 x 5 in image
# Trabalhando os dados Masculinos para o curso de Informática
dado_ingresso_homem_info_IFPB <- dado_ingresso_info_IFPB %>%
  filter(Sexo == "Masculino")%>%
  select(-total_alunas, -percentual_ingresso_mulher)

print(dado_ingresso_homem_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunos total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Inf… Masc…          197            332
## 2  2018 Ingresso               Técnico em Inf… Masc…          139            282
## 3  2019 Ingresso               Técnico em Inf… Masc…          192            359
## 4  2020 Ingresso               Técnico em Inf… Masc…          266            525
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 1 more variable: percentual_ingresso_homem <dbl>
write_csv2(dado_ingresso_homem_info_IFPB, "Percentual_homens_infor_ingresso_IFPB.csv")

grafico_ingresso_homem_info_IFPB <- ggplot(dado_ingresso_homem_info_IFPB, aes(x = as.factor(ano), y = percentual_ingresso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_ingresso_homem_info_IFPB)

ggsave("dados_percentual_Homem_ingresso_Info_IFPB.png", grafico_ingresso_homem_info_IFPB)
## Saving 7 x 5 in image

4.2.4. Vamos observar os dados de Ingresso para os dois cursos e para amos os sexos em paralelo

# Criando a variavél percentual_ingresso comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_ingresso_mulher_manu2 <- dado_ingresso_mulher_manu_IFPB %>%
  mutate(percentual_ingresso = percentual_ingresso_mulher) %>%
  mutate(total = total_alunas)
#print(dado_ingresso_mulher_manu2)

dado_ingresso_homem_manu2 <- dado_ingresso_homem_manu_IFPB %>%
  mutate(percentual_ingresso = percentual_ingresso_homem)%>%
  mutate(total = total_alunos)
#print(dado_ingresso_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
ingresso_mulheres_homens_manu_IFPB <- bind_rows(dado_ingresso_mulher_manu2, dado_ingresso_homem_manu2)

print(ingresso_mulheres_homens_manu_IFPB)
## # A tibble: 8 × 11
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunas total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Man… Femi…           21             33
## 2  2018 Ingresso               Técnico em Man… Femi…           21             38
## 3  2019 Ingresso               Técnico em Man… Femi…           31             44
## 4  2020 Ingresso               Técnico em Man… Femi…           30             41
## 5  2017 Ingresso               Técnico em Man… Masc…           NA             33
## 6  2018 Ingresso               Técnico em Man… Masc…           NA             38
## 7  2019 Ingresso               Técnico em Man… Masc…           NA             44
## 8  2020 Ingresso               Técnico em Man… Masc…           NA             41
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 5 more variables: percentual_ingresso_mulher <dbl>,
## #   percentual_ingresso <dbl>, total <int>, total_alunos <int>,
## #   percentual_ingresso_homem <dbl>
write_csv2(ingresso_mulheres_homens_manu_IFPB, "Percentual_Mulheres&Homens_ingresso_manu_IFPB.csv")

grafico_ingresso_mulheres_homens_manu_IFPB <- ggplot(ingresso_mulheres_homens_manu_IFPB, aes(x = as.factor(ano), y = percentual_ingresso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual ingresso no IFPB para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulheres_homens_manu_IFPB)

ggsave("dados_percentual_Mulheres&Homens_ingresso_manu_IFPB.png", grafico_ingresso_mulheres_homens_manu_IFPB)
## Saving 7 x 5 in image
# Criando a variavél percentual_ingresso comum os dois csvs de infor. para trabalhar no gráfico
dado_ingresso_mulher_info2 <- dado_ingresso_mulher_info_IFPB %>%
  mutate(percentual_ingresso = percentual_ingresso_mulher)%>%
  mutate(total = total_alunas)
#print(dado_ingresso_mulher_manu2)

dado_ingresso_homem_info2 <- dado_ingresso_homem_info_IFPB %>%
  mutate(percentual_ingresso = percentual_ingresso_homem)%>%
  mutate(total = total_alunos)
#print(dado_ingresso_homem_manu2)

ingresso_mulheres_homens_infor_IFPB <- bind_rows(dado_ingresso_mulher_info2, dado_ingresso_homem_info2)

print(ingresso_mulheres_homens_infor_IFPB)
## # A tibble: 8 × 11
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano Situação de Matrícul…¹ `Nome de Curso` Sexo  total_alunas total_ingresso
##   <dbl> <chr>                  <chr>           <chr>        <int>          <int>
## 1  2017 Ingresso               Técnico em Inf… Femi…          135            332
## 2  2018 Ingresso               Técnico em Inf… Femi…          143            282
## 3  2019 Ingresso               Técnico em Inf… Femi…          167            359
## 4  2020 Ingresso               Técnico em Inf… Femi…          259            525
## 5  2017 Ingresso               Técnico em Inf… Masc…           NA            332
## 6  2018 Ingresso               Técnico em Inf… Masc…           NA            282
## 7  2019 Ingresso               Técnico em Inf… Masc…           NA            359
## 8  2020 Ingresso               Técnico em Inf… Masc…           NA            525
## # ℹ abbreviated name: ¹​`Situação de Matrícula`
## # ℹ 5 more variables: percentual_ingresso_mulher <dbl>,
## #   percentual_ingresso <dbl>, total <int>, total_alunos <int>,
## #   percentual_ingresso_homem <dbl>
write_csv2(ingresso_mulheres_homens_infor_IFPB, "Percentual_Mulheres&Homens_ingresso_infor_IFPB.csv")

grafico_ingresso_mulheres_homens_infor_IFPB <- ggplot(ingresso_mulheres_homens_infor_IFPB, aes(x = as.factor(ano), y = percentual_ingresso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual ingresso no IFPB para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulheres_homens_infor_IFPB)

ggsave("dados_percentual_Mulheres&Homens_ingresso_infor_IFPB.png", grafico_ingresso_mulheres_homens_infor_IFPB)
## Saving 7 x 5 in image

4.3 - Permanência

4.3.1. Matrículas “Em Curso” para os dois cursos da Pesquisa

Gerando os dados de Matrículas em Curso para os dois cursos

# Gewrando os dados de Matrículas em Curso para o curso de Manutenção e Suporte em informática
dado_emCurso_manu_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_mulher = (total_alunas / total_emCurso) * 100,
            percentual_emCurso_homem = (total_alunos / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_emCurso_manu_IFPB)

# Gewrando os dados de Matrículas em Curso para o curso de Informática
dado_emCurso_info_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
   mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_mulher = (total_alunas / total_emCurso) * 100,
            percentual_emCurso_homem = (total_alunos / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_emCurso_info_IFPB)

4.3.2. Trabalhando os dados Femininos de Matrículas em Curso para os dois cursos

# Fazendo o cálculo feminino para matrículas em curso para o curso de Manutenção e Suporte em informática
dado_emCurso_mulher_manu_IFPB <- dado_emCurso_manu_IFPB %>%
  filter(Sexo == "Feminino") %>%
  select(-total_alunos, -percentual_emCurso_homem)

print(dado_emCurso_mulher_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunas total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Man… Femi…           55           172
## 2  2018 Em curso                Técnico em Man… Femi…           49           127
## 3  2019 Em curso                Técnico em Man… Femi…           29            70
## 4  2020 Em curso                Técnico em Man… Femi…           55            87
## # ℹ 1 more variable: percentual_emCurso_mulher <dbl>
write_csv2(dado_emCurso_mulher_manu_IFPB, "Percentual_mulheres_manu_emCurso_IFPB.csv")

grafico_emCurso_mulher_manu_IFPB <- ggplot(dado_emCurso_mulher_manu_IFPB, aes(x = as.factor(ano), y = percentual_emCurso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminino em curso no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulher_manu_IFPB)

ggsave("dados_percentual_Mulher_emCurso_Man_IFPB.png", grafico_emCurso_mulher_manu_IFPB)
## Saving 7 x 5 in image
# Fazendo o cálculo feminino para matrículas em curso para o curso de Informática
dado_emCurso_mulher_info_IFPB <- dado_emCurso_info_IFPB %>%
  filter(Sexo == "Feminino") %>%
  select(-total_alunos, -percentual_emCurso_homem)

print(dado_emCurso_mulher_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunas total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Inf… Femi…          141           459
## 2  2018 Em curso                Técnico em Inf… Femi…          227           644
## 3  2019 Em curso                Técnico em Inf… Femi…          246           567
## 4  2020 Em curso                Técnico em Inf… Femi…          318           670
## # ℹ 1 more variable: percentual_emCurso_mulher <dbl>
write_csv2(dado_emCurso_mulher_info_IFPB, "Percentual_mulheres_infor_emCurso_IFPB.csv")

grafico_emCurso_mulher_info_IFPB <- ggplot(dado_emCurso_mulher_info_IFPB, aes(x = as.factor(ano), y = percentual_emCurso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminina em curso no IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulher_info_IFPB)

ggsave("dados_percentual_Mulher_emCurso_Info_IFPB.png", grafico_emCurso_mulher_info_IFPB)
## Saving 7 x 5 in image

4.3.3. Trabalhando os dados Masculinos de Matrículas em Curso para os dois cursos

# Fazendo o cálculo Masculino para matrículas em curso para o curso de Manutenção e Suporte em informática
dado_emCurso_homem_manu_IFPB <- dado_emCurso_manu_IFPB %>%
  filter(Sexo == "Masculino")%>%
  select(-total_alunas, -percentual_emCurso_mulher)

print(dado_emCurso_homem_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunos total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Man… Masc…          117           172
## 2  2018 Em curso                Técnico em Man… Masc…           78           127
## 3  2019 Em curso                Técnico em Man… Masc…           41            70
## 4  2020 Em curso                Técnico em Man… Masc…           32            87
## # ℹ 1 more variable: percentual_emCurso_homem <dbl>
write_csv2(dado_emCurso_homem_manu_IFPB, "Percentual_homens_manu_emCurso.csv_IFPB")

grafico_emCurso_homem_manu_IFPB <- ggplot(dado_emCurso_homem_manu_IFPB, aes(x = as.factor(ano), y = percentual_emCurso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_emCurso_homem_manu_IFPB)

ggsave("dados_percentual_Homem_emCurso_Man_IFPB.png", grafico_emCurso_homem_manu_IFPB)
## Saving 7 x 5 in image
# Fazendo o cálculo masculino para matrículas em curso para o curso de Informática
dado_emCurso_homem_info_IFPB <- dado_emCurso_info_IFPB %>%
  filter(Sexo == "Masculino")%>%
  select(-total_alunas, -percentual_emCurso_mulher)

print(dado_emCurso_homem_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunos total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Inf… Masc…          318           459
## 2  2018 Em curso                Técnico em Inf… Masc…          417           644
## 3  2019 Em curso                Técnico em Inf… Masc…          321           567
## 4  2020 Em curso                Técnico em Inf… Masc…          352           670
## # ℹ 1 more variable: percentual_emCurso_homem <dbl>
write_csv2(dado_emCurso_homem_info_IFPB, "Percentual_homens_infor_emCurso_IFPB.csv")

grafico_emCurso_homem_info_IFPB <- ggplot(dado_emCurso_homem_info, aes(x = as.factor(ano), y = percentual_emCurso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso no IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_emCurso_homem_info_IFPB)

ggsave("dados_percentual_Homem_emCurso_Info_IFPB.png", grafico_emCurso_homem_info_IFPB)
## Saving 7 x 5 in image

4.3.4. Vamos observar os dados de matrículas em curso para os dois cursos e para ambos os sexos em paralelo

# Criando a variavél percentual_emCurso comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_emCurso_mulher_manu2 <- dado_emCurso_mulher_manu_IFPB %>%
  mutate(percentual_emCurso = percentual_emCurso_mulher)
#print(dado_emCurso_mulher_manu2)

dado_emCurso_homem_manu2 <- dado_emCurso_homem_manu_IFPB %>%
  mutate(percentual_emCurso = percentual_emCurso_homem)
#print(dado_ingresso_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
emCurso_mulheres_homens_manu_IFPB <- bind_rows(dado_emCurso_mulher_manu2, dado_emCurso_homem_manu2)

print(emCurso_mulheres_homens_manu_IFPB)
## # A tibble: 8 × 10
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunas total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Man… Femi…           55           172
## 2  2018 Em curso                Técnico em Man… Femi…           49           127
## 3  2019 Em curso                Técnico em Man… Femi…           29            70
## 4  2020 Em curso                Técnico em Man… Femi…           55            87
## 5  2017 Em curso                Técnico em Man… Masc…           NA           172
## 6  2018 Em curso                Técnico em Man… Masc…           NA           127
## 7  2019 Em curso                Técnico em Man… Masc…           NA            70
## 8  2020 Em curso                Técnico em Man… Masc…           NA            87
## # ℹ 4 more variables: percentual_emCurso_mulher <dbl>,
## #   percentual_emCurso <dbl>, total_alunos <int>,
## #   percentual_emCurso_homem <dbl>
write_csv2(emCurso_mulheres_homens_manu_IFPB, "Percentual_Mulheres&Homens_emCurso_manu_IFPB.csv")

grafico_emCurso_mulheres_homens_manu_IFPB <- ggplot(emCurso_mulheres_homens_manu_IFPB, aes(x = as.factor(ano), y = percentual_emCurso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas emCurso no IFPB para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulheres_homens_manu_IFPB)

ggsave("dados_percentual_Mulheres&Homens_emCurso_manu_IFPB.png", grafico_emCurso_mulheres_homens_manu_IFPB)
## Saving 7 x 5 in image
# Criando a variavél percentual_emCurso comum os dois csvs de infor. para trabalhar no gráfico
dado_emCurso_mulher_info2 <- dado_emCurso_mulher_info_IFPB %>%
  mutate(percentual_emCurso = percentual_emCurso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_emCurso_homem_info2 <- dado_emCurso_homem_info_IFPB %>%
  mutate(percentual_emCurso = percentual_emCurso_homem)
#print(dado_ingresso_homem_manu2)

emCurso_mulheres_homens_infor_IFPB <- bind_rows(dado_emCurso_mulher_info2, dado_emCurso_homem_info2)

print(emCurso_mulheres_homens_infor_IFPB)
## # A tibble: 8 × 10
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso` Sexo  total_alunas total_emCurso
##   <dbl> <chr>                   <chr>           <chr>        <int>         <int>
## 1  2017 Em curso                Técnico em Inf… Femi…          141           459
## 2  2018 Em curso                Técnico em Inf… Femi…          227           644
## 3  2019 Em curso                Técnico em Inf… Femi…          246           567
## 4  2020 Em curso                Técnico em Inf… Femi…          318           670
## 5  2017 Em curso                Técnico em Inf… Masc…           NA           459
## 6  2018 Em curso                Técnico em Inf… Masc…           NA           644
## 7  2019 Em curso                Técnico em Inf… Masc…           NA           567
## 8  2020 Em curso                Técnico em Inf… Masc…           NA           670
## # ℹ 4 more variables: percentual_emCurso_mulher <dbl>,
## #   percentual_emCurso <dbl>, total_alunos <int>,
## #   percentual_emCurso_homem <dbl>
write_csv2(emCurso_mulheres_homens_infor_IFPB, "Percentual_Mulheres&Homens_emCurso_infor_IFPB.csv")

grafico_emCurso_mulheres_homens_infor_IFPB <- ggplot(emCurso_mulheres_homens_infor_IFPB, aes(x = as.factor(ano), y = percentual_emCurso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas emCurso no IFPB para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulheres_homens_infor_IFPB)

ggsave("dados_percentual_Mulheres&Homens_emCurso_infor_IFPB.png", grafico_emCurso_mulheres_homens_infor_IFPB)
## Saving 7 x 5 in image

4.4 - Evasão

4.4.1. Evasão para os dois cursos da Pesquisa

Gerando os dados de Evasão para os dois cursos

# Fazendo o cálculo de evasão feminina para o curso de Manutenção e Suporte em informática
dado_evasao_manu_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
   mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_evasao = first(total_evasao),
            percentual_evasao_mulher = (total_alunas / total_evasao) * 100,
            percentual_evasao_homem = (total_alunos / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_evasao_manu_IFPB)

dado_evasao_info_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_evasao = first(total_evasao),
            percentual_evasao_mulher = (total_alunas / total_evasao) * 100,
            percentual_evasao_homem = (total_alunos / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_evasao_info_IFPB)

4.4.2. Trabalhando os dados Femininos de Evasão para os dois cursos

# Fazendo o cálculo de evasão feminina para o curso de Manutenção e Suporte em informática
dado_evasao_mulher_manu_IFPB <- dado_evasao_manu_IFPB %>%
  filter(Sexo == "Feminino")%>%
  select(-total_alunos, -percentual_evasao_homem)

print(dado_evasao_mulher_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunas total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Manu… Femi…           15           45
## 2  2018 Evasão                  Técnico em Manu… Femi…           11           26
## 3  2019 Evasão                  Técnico em Manu… Femi…            7           17
## 4  2020 Evasão                  Técnico em Manu… Femi…            3            4
## # ℹ 1 more variable: percentual_evasao_mulher <dbl>
write_csv2(dado_evasao_mulher_manu_IFPB, "Percentual_mulheres_manu_evasao_IFPB.csv")

grafico_evasao_mulher_manu_IFPB <- ggplot(dado_evasao_mulher_manu_IFPB, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulher_manu_IFPB)

ggsave("dados_percentual_Mulher_evasao_Man_IFPB.png", grafico_evasao_mulher_manu_IFPB)
## Saving 7 x 5 in image
# Fazendo o cálculo de evasão feminina para o curso de Informática
dado_evasao_mulher_info_IFPB <- dado_evasao_info_IFPB %>%
  filter(Sexo == "Feminino")%>%
  select(-total_alunos, -percentual_evasao_homem)

print(dado_evasao_mulher_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunas total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Info… Femi…           34           79
## 2  2018 Evasão                  Técnico em Info… Femi…           42           92
## 3  2019 Evasão                  Técnico em Info… Femi…           60          145
## 4  2020 Evasão                  Técnico em Info… Femi…           25           59
## # ℹ 1 more variable: percentual_evasao_mulher <dbl>
write_csv2(dado_evasao_mulher_info_IFPB, "Percentual_mulheres_infor_evasao_IFPB.csv")

grafico_evasao_mulher_info_IFPB <- ggplot(dado_evasao_mulher_info_IFPB, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina no IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulher_info_IFPB)

ggsave("dados_percentual_Mulher_evasao_Info_IFPB.png", grafico_evasao_mulher_info_IFPB)
## Saving 7 x 5 in image

4.4.3. Trabalhando os dados Masculinos de Evasão para os dois cursos

# Fazendo o cálculo de evasão Masculina para o curso de Manutenção e Suporte em informática
dado_evasao_homem_manu_IFPB <- dado_evasao_manu_IFPB %>%
  filter(Sexo == "Masculino") %>%
  select(-total_alunas, -percentual_evasao_mulher)

print(dado_evasao_homem_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunos total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Manu… Masc…           30           45
## 2  2018 Evasão                  Técnico em Manu… Masc…           15           26
## 3  2019 Evasão                  Técnico em Manu… Masc…           10           17
## 4  2020 Evasão                  Técnico em Manu… Masc…            1            4
## # ℹ 1 more variable: percentual_evasao_homem <dbl>
write_csv2(dado_evasao_homem_manu_IFPB, "Percentual_homens_manu_evasao_IFPB.csv")

grafico_evasao_homem_manu_IFPB <- ggplot(dado_evasao_homem_manu_IFPB, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_evasao_homem_manu_IFPB)

ggsave("dados_percentual_Homem_evasao_Man_IFPB.png", grafico_evasao_homem_manu_IFPB)
## Saving 7 x 5 in image
# Fazendo o cálculo de evasão masculina para o curso de Informática
dado_evasao_homem_info_IFPB <- dado_evasao_info_IFPB %>%
  filter(Sexo == "Masculino") %>%
  select(-total_alunas, -percentual_evasao_mulher)

print(dado_evasao_homem_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`  Sexo  total_alunos total_evasao
##   <dbl> <chr>                   <chr>            <chr>        <int>        <int>
## 1  2017 Evasão                  Técnico em Info… Masc…           45           79
## 2  2018 Evasão                  Técnico em Info… Masc…           50           92
## 3  2019 Evasão                  Técnico em Info… Masc…           85          145
## 4  2020 Evasão                  Técnico em Info… Masc…           34           59
## # ℹ 1 more variable: percentual_evasao_homem <dbl>
write_csv2(dado_evasao_homem_info, "Percentual_homens_infor_evasao.csv")

grafico_evasao_homem_info_IFPB <- ggplot(dado_evasao_homem_info_IFPB, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina no IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_evasao_homem_info_IFPB)

ggsave("dados_percentual_Homem_evasao_Info_IFPB.png", grafico_evasao_homem_info_IFPB)
## Saving 7 x 5 in image

4.4.4. Vamos observar os dados de Evasão para os dois cursos e para ambos os sexos em paralelo

# Criando a variavél percentual_evasao comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_evasao_mulher_manu2 <- dado_evasao_mulher_manu_IFPB %>%
  mutate(percentual_evasao = percentual_evasao_mulher)
#print(dado_evasao_mulher_manu2)

dado_evasao_homem_manu2 <- dado_evasao_homem_manu_IFPB %>%
  mutate(percentual_evasao = percentual_evasao_homem)
#print(dado_evasao_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
evasao_mulheres_homens_manu_IFPB <- bind_rows(dado_evasao_mulher_manu2, dado_evasao_homem_manu2)

#print(evasao_mulheres_homens_manu_IFPB)
write_csv2(evasao_mulheres_homens_manu_IFPB, "Percentual_Mulheres&Homens_evasao_manu_IFPB.csv")

grafico_evasao_mulheres_homens_manu_IFPB <- ggplot(evasao_mulheres_homens_manu_IFPB, aes(x = as.factor(ano), y = percentual_evasao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas evasao no IFPB para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulheres_homens_manu_IFPB)

ggsave("dados_percentual_Mulheres&Homens_evasao_manu_IFPB.png", grafico_evasao_mulheres_homens_manu_IFPB)
## Saving 7 x 5 in image
# Criando a variavél percentual_evasao comum os dois csvs de infor. para trabalhar no gráfico
dado_evasao_mulher_info2 <- dado_evasao_mulher_info_IFPB %>%
  mutate(percentual_evasao = percentual_evasao_mulher)
#print(dado_evasao_mulher_manu2)

dado_evasao_homem_info2 <- dado_evasao_homem_info_IFPB %>%
  mutate(percentual_evasao = percentual_evasao_homem)
#print(dado_evasao_homem_manu2)

evasao_mulheres_homens_infor_IFPB <- bind_rows(dado_evasao_mulher_info2, dado_evasao_homem_info2)

write_csv2(evasao_mulheres_homens_infor_IFPB, "Percentual_Mulheres&Homens_evasao_infor_IFPB.csv")

grafico_evasao_mulheres_homens_infor_IFPB <- ggplot(evasao_mulheres_homens_infor_IFPB, aes(x = as.factor(ano), y = percentual_evasao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas evasao no IFPB para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulheres_homens_infor_IFPB)

ggsave("dados_percentual_Mulheres&Homens_evasao_infor_IFPB.png", grafico_evasao_mulheres_homens_infor_IFPB)
## Saving 7 x 5 in image

4.5 - Conclusão

4.5.1. Conclusão do curso pelas mulheres e pelos homens

Gerando os dados de Conclusão para os dois cursos

# Fazendo o cálculo de conclusão feminina para o curso de Manutenção e Suporte em informática e Técnico em Informática
dado_conclusao_manu_IFPB <- dado_manu_total_IFPB %>%
  filter(`Situação de Matrícula` =="Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
   mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_mulher = (total_alunas / total_conclusao) * 100,
            percentual_conclusao_homem = (total_alunos / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_conclusao_manu_IFPB)

dado_conclusao_info_IFPB <- dado_info_total_IFPB %>%
  filter(`Situação de Matrícula` =="Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_alunos = first(total_alunos),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_mulher = (total_alunas / total_conclusao) * 100,
            percentual_conclusao_homem = (total_alunos / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
#print(dado_evasao_info_IFPB)

4.5.2. Trabalhando os dados Femininos de Conclusão para os dois cursos

# Fazendo o cálculo de conclusão feminina para o curso de Manutenção e Suporte em informática
dado_conclusao_mulher_manu_IFPB <- dado_conclusao_manu_IFPB %>%
  filter(Sexo == "Feminino") %>%
  select(-total_alunos, -percentual_conclusao_homem)

print(dado_conclusao_mulher_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`               Sexo  total_alunas
##   <dbl> <chr>                   <chr>                         <chr>        <int>
## 1  2017 Concluída               Técnico em Manutenção e Supo… Femi…           75
## 2  2018 Concluída               Técnico em Manutenção e Supo… Femi…           18
## 3  2019 Concluída               Técnico em Manutenção e Supo… Femi…           34
## 4  2020 Concluída               Técnico em Manutenção e Supo… Femi…           14
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_mulher <dbl>
write_csv2(dado_conclusao_mulher_manu_IFPB, "Percentual_mulhres_manu_conclusao_IFPB.csv")

grafico_conclusao_mulher_manu_IFPB <- ggplot(dado_conclusao_mulher_manu_IFPB, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulher_manu_IFPB)

ggsave("dados_percentual_Mulher_conclusao_Man_IFPB.png", grafico_conclusao_mulher_manu_IFPB)
## Saving 7 x 5 in image
# Fazendo o cálculo de conclusão feminina para o curso de Informática
dado_conclusao_mulher_info_IFPB <- dado_conclusao_info_IFPB %>%
  filter(Sexo == "Feminino")%>%
  select(-total_alunos, -percentual_conclusao_homem)

print(dado_conclusao_mulher_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`        Sexo     total_alunas
##   <dbl> <chr>                   <chr>                  <chr>           <int>
## 1  2017 Concluída               Técnico em Informática Feminino            7
## 2  2018 Concluída               Técnico em Informática Feminino           25
## 3  2019 Concluída               Técnico em Informática Feminino           93
## 4  2020 Concluída               Técnico em Informática Feminino           96
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_mulher <dbl>
write_csv2(dado_conclusao_mulher_info_IFPB, "Percentual_mulhres_infor_conclusao_IFPB.csv")

grafico_conclusao_mulher_info_IFPB <- ggplot(dado_conclusao_mulher_info_IFPB, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina no IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulher_info_IFPB)

ggsave("dados_percentual_Mulher_conclusao_Info_IFPB.png", grafico_conclusao_mulher_info_IFPB)
## Saving 7 x 5 in image

4.5.3. Trabalhando os dados Masculinos de Conclusão para os dois cursos

# Fazendo o cálculo de conclusão Masculina para o curso de Manutenção e Suporte em informática
dado_conclusao_homem_manu_IFPB <- dado_conclusao_manu_IFPB %>%
  filter(Sexo == "Masculino")%>%
  select(-total_alunas, -percentual_conclusao_mulher)
  
print(dado_conclusao_homem_manu_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`               Sexo  total_alunos
##   <dbl> <chr>                   <chr>                         <chr>        <int>
## 1  2017 Concluída               Técnico em Manutenção e Supo… Masc…          102
## 2  2018 Concluída               Técnico em Manutenção e Supo… Masc…           45
## 3  2019 Concluída               Técnico em Manutenção e Supo… Masc…           40
## 4  2020 Concluída               Técnico em Manutenção e Supo… Masc…           30
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_homem <dbl>
write_csv2(dado_conclusao_homem_manu_IFPB, "Percentual_homens_manu_conclusao_IFPB.csv")

grafico_conclusao_homem_manu_IFPB <- ggplot(dado_conclusao_homem_manu_IFPB, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Masculina no IFPB para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_conclusao_homem_manu_IFPB)

ggsave("dados_percentual_Homem_conclusao_Man_IFPB.png", grafico_conclusao_homem_manu_IFPB)
## Saving 7 x 5 in image
# Fazendo o cálculo de conclusão masculina para o curso de Informática
dado_conclusao_homem_info_IFPB <- dado_conclusao_info_IFPB %>%
  filter(Sexo == "Masculino")%>%
  select(-total_alunas, -percentual_conclusao_mulher)

print(dado_conclusao_homem_info_IFPB)
## # A tibble: 4 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`        Sexo      total_alunos
##   <dbl> <chr>                   <chr>                  <chr>            <int>
## 1  2017 Concluída               Técnico em Informática Masculino           25
## 2  2018 Concluída               Técnico em Informática Masculino           64
## 3  2019 Concluída               Técnico em Informática Masculino          156
## 4  2020 Concluída               Técnico em Informática Masculino          143
## # ℹ 2 more variables: total_conclusao <int>, percentual_conclusao_homem <dbl>
write_csv2(dado_conclusao_homem_info_IFPB, "Percentual_homens_infor_conclusao_IFPB.csv")

grafico_conclusao_homem_info_IFPB <- ggplot(dado_conclusao_homem_info_IFPB, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Masculina no IFPB para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 1), nsmall = 2)), vjust = 1.5, color = "white", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_conclusao_homem_info_IFPB)

ggsave("dados_percentual_Homem_conclusao_Info_IFPB.png", grafico_conclusao_homem_info_IFPB)
## Saving 7 x 5 in image

4.5.4. Vamos observar os dados de Conclusão para os dois cursos e para ambos os sexos em paralelo

# Criando a variavél percentual_conclusao comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_conclusao_mulher_manu2 <- dado_conclusao_mulher_manu_IFPB %>%
  mutate(percentual_conclusao = percentual_conclusao_mulher)
#print(dado_conclusao_mulher_manu2)

dado_conclusao_homem_manu2 <- dado_conclusao_homem_manu_IFPB %>%
  mutate(percentual_conclusao = percentual_conclusao_homem)
#print(dado_conclusao_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
conclusao_mulheres_homens_manu_IFPB <- bind_rows(dado_conclusao_mulher_manu2, dado_conclusao_homem_manu2)

#print(conclusao_mulheres_homens_manu_IFPB)
write_csv2(conclusao_mulheres_homens_manu_IFPB, "Percentual_Mulheres&Homens_conclusao_manu_IFPB.csv")

grafico_conclusao_mulheres_homens_manu_IFPB <- ggplot(conclusao_mulheres_homens_manu_IFPB, aes(x = as.factor(ano), y = percentual_conclusao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas conclusao no IFPB para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulheres_homens_manu_IFPB)

ggsave("dados_percentual_Mulheres&Homens_conclusao_manu_IFPB.png", grafico_conclusao_mulheres_homens_manu_IFPB)
## Saving 7 x 5 in image
# Criando a variavél percentual_conclusao comum os dois csvs de infor. para trabalhar no gráfico
dado_conclusao_mulher_info2 <- dado_conclusao_mulher_info_IFPB %>%
  mutate(percentual_conclusao = percentual_conclusao_mulher)
#print(dado_conclusao_mulher_manu2)

dado_conclusao_homem_info2 <- dado_conclusao_homem_info_IFPB %>%
  mutate(percentual_conclusao = percentual_conclusao_homem)
#print(dado_conclusao_homem_manu2)

conclusao_mulheres_homens_infor_IFPB <- bind_rows(dado_conclusao_mulher_info2, dado_conclusao_homem_info2)

print(conclusao_mulheres_homens_infor_IFPB)
## # A tibble: 8 × 10
## # Groups:   ano, Situação de Matrícula, Nome de Curso [4]
##     ano `Situação de Matrícula` `Nome de Curso`        Sexo      total_alunas
##   <dbl> <chr>                   <chr>                  <chr>            <int>
## 1  2017 Concluída               Técnico em Informática Feminino             7
## 2  2018 Concluída               Técnico em Informática Feminino            25
## 3  2019 Concluída               Técnico em Informática Feminino            93
## 4  2020 Concluída               Técnico em Informática Feminino            96
## 5  2017 Concluída               Técnico em Informática Masculino           NA
## 6  2018 Concluída               Técnico em Informática Masculino           NA
## 7  2019 Concluída               Técnico em Informática Masculino           NA
## 8  2020 Concluída               Técnico em Informática Masculino           NA
## # ℹ 5 more variables: total_conclusao <int>, percentual_conclusao_mulher <dbl>,
## #   percentual_conclusao <dbl>, total_alunos <int>,
## #   percentual_conclusao_homem <dbl>
write_csv2(conclusao_mulheres_homens_infor_IFPB, "Percentual_Mulheres&Homens_conclusao_infor_IFPB.csv")

grafico_conclusao_mulheres_homens_infor_IFPB <- ggplot(conclusao_mulheres_homens_infor_IFPB, aes(x = as.factor(ano), y = percentual_conclusao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas conclusao no IFPB para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulheres_homens_infor_IFPB)

ggsave("dados_percentual_Mulheres&Homens_conclusao_infor_IFPB.png", grafico_conclusao_mulheres_homens_infor_IFPB)
## Saving 7 x 5 in image