Library

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)
library(purrr)
#library(GGally)
#library(pscl)
library(broom)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2
## ──
## ✔ ggplot2 3.4.0     ✔ stringr 1.5.0
## ✔ tibble  3.1.8     ✔ forcats 1.0.0
## ✔ tidyr   1.3.0     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
library(modelr)
## 
## Attaching package: 'modelr'
## 
## The following object is masked from 'package:broom':
## 
##     bootstrap
library(here)
## here() starts at D:/laryssa/mestrado/NiloPecanha/NiloPecanha-Laryssa
library(skimr)
library(gcookbook)
library(lubridate)
## 
## Attaching package: 'lubridate'
## 
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(rio)
library(tidyr)

Lendo os CSVs e salvando em um dataframe

dado_2017 <- read_csv2("2017-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1031798 Columns: 25
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (18): Cor / Raça, Dt Data Fim Previsto, Data de Inicio do Ciclo, Dt Ocor...
## dbl  (7): Carga Horaria, Carga Horaria Minima, Co Ciclo Matricula, Co Matric...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2017 <- dado_2017 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2017", "Ingresso", `Situação de Matrícula`))%>%
  mutate(`Sg Sexo` = ifelse(`Sg Sexo`=="F", "Feminino", "Masculino"), ano = 2017) %>%
  rename(Sexo=`Sg Sexo`)

# Separando os dados entre mulheres e homens para o ano de 2017
fem17 <- dado_2017%>%
  filter(`Sexo` == "Feminino") 
#print(fem17)

## Separando as mulheres por curso para o ano de 2017
manu_mulher17 <- fem17%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher17)

infor_mulher17 <- fem17%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher17)

#Fazendo a parte masculina
mas17 <- dado_2017%>%
  filter(`Sexo` == "Masculino") 
#print(mas17)

## Separando os homens por curso para o ano de 2017
manu_homem17 <- mas17%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem17)

infor_homem17 <- mas17%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem17)

dado_2018 <- read_csv2("2018-microdados-matriculas.csv") 
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 964593 Columns: 35── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (25): Sexo, Renda Familiar, Cor / Raça, Faixa Etria, Data de Ocorrncia d...
## dbl (10): Idade, Cdigo da Matrcula, Cdigo do Ciclo Matrcula, Vagas Ofertadas...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2018 <- dado_2018 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2018", "Ingresso", `Situação de Matrícula`))%>%
  mutate(`Sexo` = ifelse(`Sexo`=="F", "Feminino", "Masculino"), ano = 2018) %>% 
  rename(Sexo=`Sexo`)

# Separando os dados entre mulheres e homens para o ano de 2018
fem18 <- dado_2018%>%
  filter(`Sexo` == "Feminino") 
#print(fem18)

## Separando as mulheres por curso para o ano de 2018
manu_mulher18 <- fem18%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher18)

infor_mulher18 <- fem18%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher18)

#Fazendo a parte masculina
mas18 <- dado_2018%>%
  filter(`Sexo` == "Masculino") 
#print(mas18)

## Separando os homens por curso para o ano de 2018
manu_homem18 <- mas18%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem18)

infor_homem18 <- mas18%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem18)

dado_2019 <- read_csv2("2019-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1023303 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (23): Categoria da Situação, Cor / Raça, Data de Inicio do Ciclo, Data d...
## dbl (31): Teste, Carga Horaria, Carga Horaria Minima, Código do Ciclo Matric...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2019 <- dado_2019 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2019", "Ingresso", `Situação de Matrícula`))%>%
  mutate(ano = 2019)

# Separando os dados entre mulheres e homens para o ano de 2019
fem19 <- dado_2019%>%
  filter(`Sexo` == "Feminino") 
#print(fem19)

## Separando as mulheres por curso para o ano de 2019
manu_mulher19 <- fem19%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher19)

infor_mulher19 <- fem19%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher19)

# Fazendo a parte masculina
mas19 <- dado_2019%>%
  filter(`Sexo` == "Masculino") 
#print(mas19)

## Separando os homens por curso para o ano de 2019
manu_homem19 <- mas19%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem19)

infor_homem19 <- mas19%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem19)

dado_2020 <- read_csv2("2020-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1507476 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (24): Categoria de Situação, Cor/Raça, Data de Fim Previsto do Ciclo, Da...
## dbl (30): Carga Horaria, Carga Horaria Minima, Cod Unidade, Código da Matríc...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2020 <- dado_2020 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2020", "Ingresso", `Situação de Matrícula`))%>%
  mutate(Sexo = ifelse(Sexo=="F", "Feminino", "Masculino"), ano = 2020)

# Separando os dados entre mulheres e homens para o ano de 2020
fem20 <- dado_2020%>%
  filter(`Sexo` == "Feminino") 
#print(fem20)

## Separando as mulheres por curso para o ano de 2020
manu_mulher20 <- fem20%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher20)

infor_mulher20 <- fem20%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher20)

#Fazendo a parte masculina
mas20 <- dado_2020%>%
  filter(`Sexo` == "Masculino") 
#print(mas20)

## Separando os homens por curso para o ano de 2020
manu_homem20 <- mas20%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem20)

infor_homem20 <- mas20%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem20)

dado_2021 <- read_csv2("2021-microdados-matriculas(novo).csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1523346 Columns: 56── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (24): Categoria da Situação, Cor / Raça, Data de Fim Previsto do Ciclo, ...
## dbl (32): Carga Horaria, Carga Horaria Mínima, Co Inst, Cod Unidade, Código ...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2021 <- dado_2021 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))%>%
  mutate(data = as.Date(`Data de Inicio do Ciclo`,format = '%d/%m/%Y'), Ano = year(data)) %>%
  mutate(`Situação de Matrícula` = ifelse(`Situação de Matrícula`== "Em curso" & `Ano`=="2021", "Ingresso", `Situação de Matrícula`))%>%
  mutate(ano = 2021)

# Separando os dados entre mulheres e homens para o ano de 2021
fem21 <- dado_2021%>%
  filter(`Sexo` == "Feminino") 
#print(fem21)

## Separando as mulheres por curso para o ano de 2021
manu_mulher21 <- fem21%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_mulher21)

infor_mulher21 <- fem21%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_mulher21)

#Fazendo a parte masculina
mas21 <- dado_2021%>%
  filter(`Sexo` == "Masculino") 
#print(mas21)

## Separando os homens por curso para o ano de 2021
manu_homem21 <- mas21%>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática")
#print(manu_homem21)

infor_homem21 <- mas21%>%
  filter(`Nome de Curso` == "Técnico em Informática")
#print(infor_Homem21)

#agrupando os dados e montando dos datasets por ano

dado <- bind_rows(dado_2017, dado_2018, dado_2019, dado_2020, dado_2021)
#print(dado)

write.csv2(dado, "dados_2017a2021.csv")

#Dataset com os dados femininos para dos os anos
dado_mulher <- bind_rows(fem17, fem18, fem19, fem20, fem21)
#print(dado_mulher)

write.csv2(dado_mulher, "dados_mulher2017a2021.csv")

#Dataset com os dados femininos para o curso de Manutenção e Suporte em informática para todos os anos
dado_mulher_manu <- bind_rows(manu_mulher17, manu_mulher18, manu_mulher19, manu_mulher20, manu_mulher21)
print(dado_mulher_manu)
## # A tibble: 5,401 × 97
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Data …⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          4200    1000 1979672  6.42e7 NO DEC… 22/12/… 04/02/… 01/02/… Inform…
##  2          3720    1000 1857567  6.09e7 PRETA   10/02/… 10/02/… 01/02/… Inform…
##  3          3720    1000 1857567  6.09e7 PARDA   10/02/… 10/02/… 01/02/… Inform…
##  4          3720    1000 1857567  6.09e7 PARDA   10/02/… 10/02/… 01/02/… Inform…
##  5          3720    1000 1857567  6.09e7 BRANCA  10/02/… 10/02/… 01/02/… Inform…
##  6          3720    1000 1857567  6.09e7 PARDA   10/02/… 10/02/… 01/02/… Inform…
##  7          3720    1000 1857567  6.09e7 PARDA   10/02/… 10/02/… 01/02/… Inform…
##  8          3720    1000 1857567  6.09e7 AMARELA 10/02/… 10/02/… 01/02/… Inform…
##  9          3720    1000 1857567  6.09e7 PARDA   10/02/… 10/02/… 01/02/… Inform…
## 10          3720    1000 1857567  6.09e7 PARDA   10/02/… 10/02/… 01/02/… Inform…
## # … with 5,391 more rows, 88 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, …
write.csv2(dado_mulher_manu, "dados_mulher_Manu2017a2021.csv")

#Dataset com os dados femininos para o curso de informática para todos os anos
dado_mulher_info <- bind_rows(infor_mulher17, infor_mulher18, infor_mulher19, infor_mulher20, infor_mulher21)
print(dado_mulher_info)
## # A tibble: 81,157 × 97
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Data …⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          3366    1000 1981201  6.43e7 PARDA   31/12/… 02/02/… 01/02/… Inform…
##  2          3366    1000 1981201  6.43e7 PARDA   31/12/… 02/02/… 01/02/… Inform…
##  3          3366    1000 1981201  6.43e7 BRANCA  31/12/… 02/02/… 01/02/… Inform…
##  4          3332    1000 2007416  7.13e7 NO DEC… 13/12/… 15/02/… 01/02/… Inform…
##  5          3390    1000  811932  3.62e7 NO DEC… 08/08/… 08/08/… 01/08/… Inform…
##  6          4450    1000 2024022  6.69e7 INDGENA 18/12/… 10/02/… 01/04/… Inform…
##  7          4450    1000 2024022  6.69e7 INDGENA 18/12/… 10/02/… 01/04/… Inform…
##  8          4450    1000 2024022  6.69e7 INDGENA 18/12/… 10/02/… 01/04/… Inform…
##  9          4450    1000 2024022  6.69e7 INDGENA 18/12/… 10/02/… 01/04/… Inform…
## 10          4134    1000 2165967  7.28e7 BRANCA  20/12/… 08/05/… 01/05/… Inform…
## # … with 81,147 more rows, 88 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, …
write.csv2(dado_mulher_info, "dados_mulher_info2017a2021.csv")

#dataset com os dados masculinos para todos os anos
dado_homem <- bind_rows(mas17, mas18, mas19, mas20, mas21)
#print(dado_homem)

write.csv2(dado_homem, "dados_homem2017a2021.csv")

#Dataset com os dados masculinos para o curso de Manutenção e Suporte em informática para todos os anos
dado_homem_manu <- bind_rows(manu_homem17, manu_homem18, manu_homem19, manu_homem20, manu_homem21)
#print(dado_homem_manu)

write_csv2(dado_homem_manu, "dados_homem_manu2017a2021.csv")

#Dataset com os dados masculinos para o curso de informática para todos os anos
dado_homem_info <- bind_rows(infor_homem17, infor_homem18, infor_homem19, infor_homem20, infor_homem21)
#print(dado_homem_info)

write_csv2(dado_homem_info, "dados_homem_info2017a2021.csv")

#Dataset para o curso de Manutenção e Suporte em Informática para os dois sexo e para todos os anos
dado_manu_total <- bind_rows(dado_mulher_manu, dado_homem_manu)
#print(dado_manu_total)

write_csv2(dado_manu_total, "dados_manu_total2017a2021.csv")

#Dataset para o curso de Informática para os dois sexo e para todos os anos
dado_info_total <- bind_rows(dado_mulher_info, dado_homem_info)
#print(dado_info_total)

write_csv2(dado_info_total, "dados_info_total2017a2021.csv")

1. Realizando a contagem Feminina e Masculina nos Cursos da Pesquisa

Primeiro vamos olhar os valores absolutos e os percentuais para o curso de Manutenção e Suporte em Informática

#Fazendo a contagem por situação de matricula e por sexo para o curso de Manutenção e Suporte em Informática
#Contagem de Ingresso
contagem_manu_ingresso <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_ingresso)

# Contagem Em Curso
contagem_manu_emCurso <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_emCurso)

#Contagem Evasão
contagem_manu_evasao <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Evasão") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_evasao)

#Contagem Conclusão
contagem_manu_conclusao <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_manu %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_manu %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

#print(contagem_manu_conclusao)

contagem_manu <- bind_rows(contagem_manu_ingresso, contagem_manu_emCurso, contagem_manu_evasao, contagem_manu_conclusao)
print(contagem_manu)
## # A tibble: 20 × 5
##      ano `Situação de Matrícula` total_alunos total_mulheres total_homens
##    <dbl> <chr>                          <int>          <int>        <int>
##  1  2017 Ingresso                         935            297          638
##  2  2018 Ingresso                         823            288          535
##  3  2019 Ingresso                         795            299          496
##  4  2020 Ingresso                         799            306          493
##  5  2021 Ingresso                         690            261          429
##  6  2017 Em curso                        1260            436          824
##  7  2018 Em curso                        1366            452          914
##  8  2019 Em curso                        1273            420          853
##  9  2020 Em curso                        1674            580         1094
## 10  2021 Em curso                        1324            446          878
## 11  2017 Evasão                           309            106          203
## 12  2018 Evasão                           336            116          220
## 13  2019 Evasão                           279             84          195
## 14  2020 Evasão                           202             67          135
## 15  2021 Evasão                           234             91          143
## 16  2017 Concluída                        730            267          463
## 17  2018 Concluída                        630            215          415
## 18  2019 Concluída                        648            223          425
## 19  2020 Concluída                        253             85          168
## 20  2021 Concluída                        925            362          563
# Cálculo do percentual de alunas por situação de matrícula para Manutenção e Suporte em Informática
contagem_mulher_manu <- contagem_manu %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_mulheres = total_mulheres) %>%
  summarise(total_alunos, total_mulheres, percentual_alunas_manu = (total_mulheres / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_mulher_manu)
## # A tibble: 20 × 5
## # Groups:   ano [5]
##      ano `Situação de Matrícula` total_alunos total_mulheres percentual_alunas…¹
##    <dbl> <chr>                          <int>          <int>               <dbl>
##  1  2017 Concluída                        730            267                36.6
##  2  2017 Em curso                        1260            436                34.6
##  3  2017 Evasão                           309            106                34.3
##  4  2017 Ingresso                         935            297                31.8
##  5  2018 Concluída                        630            215                34.1
##  6  2018 Em curso                        1366            452                33.1
##  7  2018 Evasão                           336            116                34.5
##  8  2018 Ingresso                         823            288                35.0
##  9  2019 Concluída                        648            223                34.4
## 10  2019 Em curso                        1273            420                33.0
## 11  2019 Evasão                           279             84                30.1
## 12  2019 Ingresso                         795            299                37.6
## 13  2020 Concluída                        253             85                33.6
## 14  2020 Em curso                        1674            580                34.6
## 15  2020 Evasão                           202             67                33.2
## 16  2020 Ingresso                         799            306                38.3
## 17  2021 Concluída                        925            362                39.1
## 18  2021 Em curso                        1324            446                33.7
## 19  2021 Evasão                           234             91                38.9
## 20  2021 Ingresso                         690            261                37.8
## # … with abbreviated variable name ¹​percentual_alunas_manu
write_csv2(contagem_mulher_manu, "percentual_mulheres_manutencaoESuporteInfor_SituacaoMatricula.csv")

cores_rgb1 <- c("#DC143C", "#CD5C5C", "#FF0000", "#FFC0CB")

# Criação do gráfico com os valores absolutos do número de mulheres para Manutenção e Suporte em Informática
grafico_contagem_mulheres_manu <- ggplot(contagem_mulher_manu, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de mulheres para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_mulheres, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulheres_manu)

ggsave("contagem_mulher_manu.png", grafico_contagem_mulheres_manu)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de mulheres para Manutenção e Suporte em Informática
grafico_contagem_mulher_manu <- ggplot(contagem_mulher_manu, aes(x = as.factor(ano), y = percentual_alunas_manu, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de mulheres para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunas_manu, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_manu)

ggsave("percentual_mulher_manu.png", grafico_contagem_mulher_manu)
## Saving 7 x 5 in image
# Cálculo do percentual de alunos por situação de matrícula para Manutenção e Suporte em Informática
contagem_homem_manu <- contagem_manu %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_homens = total_homens) %>%
  summarise(total_alunos, total_homens, percentual_alunos_manu = (total_homens / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_homem_manu)
## # A tibble: 20 × 5
## # Groups:   ano [5]
##      ano `Situação de Matrícula` total_alunos total_homens percentual_alunos_m…¹
##    <dbl> <chr>                          <int>        <int>                 <dbl>
##  1  2017 Concluída                        730          463                  63.4
##  2  2017 Em curso                        1260          824                  65.4
##  3  2017 Evasão                           309          203                  65.7
##  4  2017 Ingresso                         935          638                  68.2
##  5  2018 Concluída                        630          415                  65.9
##  6  2018 Em curso                        1366          914                  66.9
##  7  2018 Evasão                           336          220                  65.5
##  8  2018 Ingresso                         823          535                  65.0
##  9  2019 Concluída                        648          425                  65.6
## 10  2019 Em curso                        1273          853                  67.0
## 11  2019 Evasão                           279          195                  69.9
## 12  2019 Ingresso                         795          496                  62.4
## 13  2020 Concluída                        253          168                  66.4
## 14  2020 Em curso                        1674         1094                  65.4
## 15  2020 Evasão                           202          135                  66.8
## 16  2020 Ingresso                         799          493                  61.7
## 17  2021 Concluída                        925          563                  60.9
## 18  2021 Em curso                        1324          878                  66.3
## 19  2021 Evasão                           234          143                  61.1
## 20  2021 Ingresso                         690          429                  62.2
## # … with abbreviated variable name ¹​percentual_alunos_manu
write_csv2(contagem_homem_manu, "percentual_homens_manutencaoESuporteInfor_SituacaoMatricula.csv")

cores_rgb <- c("#00008B", "#4169E1", "#0000FF", "#ADD8E6")

# Criação do gráfico com os valores absolutos do número de homens para Manutenção e Suporte em Informática
grafico_contagem_homens_manu <- ggplot(contagem_homem_manu, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de homens para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_homens, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homens_manu)

ggsave("contagem_homem_manu.png", grafico_contagem_homens_manu)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de homens para Manutenção e Suporte em Informática
grafico_contagem_homem_manu <- ggplot(contagem_homem_manu, aes(x = as.factor(ano), y = percentual_alunos_manu, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de homens para o curso de Mant. e Suport. em Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunos_manu, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_manu)

ggsave("percentual_homem_manu.png", grafico_contagem_homem_manu)
## Saving 7 x 5 in image

Agora vamos olhar os valores absolutos e os percentuais para o curso de Informática

#Fazendo a contagem por situação de matricula e por sexo para o curso de Informática
# Contagem de Ingresso
contagem_info_ingresso <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup() %>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Ingresso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Em Curso
contagem_info_emCurso <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Em curso") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Evasão
contagem_info_evasao <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Evasão") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Evasão") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Contagem Conclusão
contagem_info_conclusao <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`) %>%
  tally() %>%
  ungroup()%>%
  left_join(
    dado_mulher_info %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  left_join(
    dado_homem_info %>%
      filter(`Situação de Matrícula` == "Concluída") %>%
      group_by(ano, `Situação de Matrícula`) %>%
      tally(),
    by = c("ano", "Situação de Matrícula")
  ) %>%
  rename(total_alunos = n.x, total_mulheres = n.y, total_homens = n)

# Combinação de todas as contagens para Informática
contagem_info <- bind_rows(contagem_info_ingresso, contagem_info_emCurso, contagem_info_evasao, contagem_info_conclusao)
print(contagem_info)
## # A tibble: 20 × 5
##      ano `Situação de Matrícula` total_alunos total_mulheres total_homens
##    <dbl> <chr>                          <int>          <int>        <int>
##  1  2017 Ingresso                        9916           3759         6157
##  2  2018 Ingresso                       10439           4406         6033
##  3  2019 Ingresso                       10846           4658         6188
##  4  2020 Ingresso                       11307           4807         6500
##  5  2021 Ingresso                        9904           4688         5216
##  6  2017 Em curso                       15647           5807         9840
##  7  2018 Em curso                       17740           6565        11175
##  8  2019 Em curso                       18254           7200        11054
##  9  2020 Em curso                       23641           9803        13838
## 10  2021 Em curso                       23604           9906        13698
## 11  2017 Evasão                          4680           1819         2861
## 12  2018 Evasão                          3851           1542         2309
## 13  2019 Evasão                          3512           1354         2158
## 14  2020 Evasão                          2292            929         1363
## 15  2021 Evasão                          3124           1227         1897
## 16  2017 Concluída                       5927           2387         3540
## 17  2018 Concluída                       6151           2350         3801
## 18  2019 Concluída                       7345           2839         4506
## 19  2020 Concluída                       3447           1369         2078
## 20  2021 Concluída                       8709           3742         4967
# Cálculo do percentual de alunas por situação de matrícula para Informática
contagem_mulher_info <- contagem_info %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_mulheres = total_mulheres) %>%
  summarise(total_alunos, total_mulheres, percentual_alunas_info = (total_mulheres / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_mulher_info)
## # A tibble: 20 × 5
## # Groups:   ano [5]
##      ano `Situação de Matrícula` total_alunos total_mulheres percentual_alunas…¹
##    <dbl> <chr>                          <int>          <int>               <dbl>
##  1  2017 Concluída                       5927           2387                40.3
##  2  2017 Em curso                       15647           5807                37.1
##  3  2017 Evasão                          4680           1819                38.9
##  4  2017 Ingresso                        9916           3759                37.9
##  5  2018 Concluída                       6151           2350                38.2
##  6  2018 Em curso                       17740           6565                37.0
##  7  2018 Evasão                          3851           1542                40.0
##  8  2018 Ingresso                       10439           4406                42.2
##  9  2019 Concluída                       7345           2839                38.7
## 10  2019 Em curso                       18254           7200                39.4
## 11  2019 Evasão                          3512           1354                38.6
## 12  2019 Ingresso                       10846           4658                42.9
## 13  2020 Concluída                       3447           1369                39.7
## 14  2020 Em curso                       23641           9803                41.5
## 15  2020 Evasão                          2292            929                40.5
## 16  2020 Ingresso                       11307           4807                42.5
## 17  2021 Concluída                       8709           3742                43.0
## 18  2021 Em curso                       23604           9906                42.0
## 19  2021 Evasão                          3124           1227                39.3
## 20  2021 Ingresso                        9904           4688                47.3
## # … with abbreviated variable name ¹​percentual_alunas_info
write_csv2(contagem_mulher_info, "percentual_mulheres_Infor_SituacaoMatricula.csv")

# Cores para o gráfico
cores_rgb1 <- c("#DC143C", "#CD5C5C", "#FF0000", "#FFC0CB")

# Criação do gráfico com valores absolutos de mulheres para o curso de Informática
grafico_contagem_mulheres_info <- ggplot(contagem_mulher_info, aes(x = as.factor(ano), y = total_mulheres, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de mulheres para o curso de Informática", x = "Ano", y = "Percentual de alunas") +
  geom_text(aes(label = paste0(format(round(total_mulheres, 0), nsmall = 0))), 
            position = position_dodge(width = 0.8), vjust = 1.5, color = "black") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulheres_info)

ggsave("contagem_mulheres_info.png", grafico_contagem_mulheres_info)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de mulheres para o curso de Informática
grafico_contagem_mulher_info <- ggplot(contagem_mulher_info, aes(x = as.factor(ano), y = percentual_alunas_info, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de mulheres para o curso de Informática", x = "Ano", y = "Percentual de alunas") +
  geom_text(aes(label = paste0(format(round(percentual_alunas_info, 0), nsmall = 0))), 
            position = position_dodge(width = 0.8), vjust = 1.5, color = "black") +
  scale_fill_manual(values = cores_rgb1)

print(grafico_contagem_mulher_info)

ggsave("contagem_mulher_info.png", grafico_contagem_mulher_info)
## Saving 7 x 5 in image
# Cálculo do percentual de alunos por situação de matrícula para Informática
contagem_homem_info <- contagem_info %>%
  group_by(ano, `Situação de Matrícula`) %>%
  mutate(total_alunos = total_alunos, total_homens = total_homens) %>%
  summarise(total_alunos, total_homens, percentual_alunos_info = (total_homens / total_alunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(contagem_homem_info)
## # A tibble: 20 × 5
## # Groups:   ano [5]
##      ano `Situação de Matrícula` total_alunos total_homens percentual_alunos_i…¹
##    <dbl> <chr>                          <int>        <int>                 <dbl>
##  1  2017 Concluída                       5927         3540                  59.7
##  2  2017 Em curso                       15647         9840                  62.9
##  3  2017 Evasão                          4680         2861                  61.1
##  4  2017 Ingresso                        9916         6157                  62.1
##  5  2018 Concluída                       6151         3801                  61.8
##  6  2018 Em curso                       17740        11175                  63.0
##  7  2018 Evasão                          3851         2309                  60.0
##  8  2018 Ingresso                       10439         6033                  57.8
##  9  2019 Concluída                       7345         4506                  61.3
## 10  2019 Em curso                       18254        11054                  60.6
## 11  2019 Evasão                          3512         2158                  61.4
## 12  2019 Ingresso                       10846         6188                  57.1
## 13  2020 Concluída                       3447         2078                  60.3
## 14  2020 Em curso                       23641        13838                  58.5
## 15  2020 Evasão                          2292         1363                  59.5
## 16  2020 Ingresso                       11307         6500                  57.5
## 17  2021 Concluída                       8709         4967                  57.0
## 18  2021 Em curso                       23604        13698                  58.0
## 19  2021 Evasão                          3124         1897                  60.7
## 20  2021 Ingresso                        9904         5216                  52.7
## # … with abbreviated variable name ¹​percentual_alunos_info
write_csv2(contagem_homem_info, "percentual_homens_Infor_SituacaoMatricula.csv")

cores_rgb <- c("#00008B", "#4169E1", "#0000FF", "#ADD8E6")

# Criação do gráfico com os valores absolutos de homens para o curso de Informática
grafico_contagem_homens_info <- ggplot(contagem_homem_info, aes(x = as.factor(ano), y = total_homens, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Número de homens para o curso de Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(total_homens, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homens_info)

ggsave("contagem_homens_info.png", grafico_contagem_homens_info)
## Saving 7 x 5 in image
# Criação do gráfico com o percentual de homens para o curso de Informática
grafico_contagem_homem_info <- ggplot(contagem_homem_info, aes(x = as.factor(ano), y = percentual_alunos_info, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge(width = 0.8)) +
  labs(title = "Percentual de homens para o curso de Infor", x = "", y = "") +
  geom_text(aes(label = paste0(format(round(percentual_alunos_info, 0), nsmall = 0))), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) +
  scale_fill_manual(values = cores_rgb)

print(grafico_contagem_homem_info)

ggsave("contagem_homem_info.png", grafico_contagem_homem_info)
## Saving 7 x 5 in image

Vendo as informações de contagem por Sexo e por Situação de Matrícula

#Criando a contagem de alunos por sexo para o curso de Manutenção e Suporte em Informática e empilhando os dados por Situação da Matrícula
contagem_mulher_manu2 <- dado_mulher_manu %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_mulher_manu2)

contagem_homem_manu2 <- dado_homem_manu %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_homem_manu2)

contagem_alunos_manu <- bind_rows(contagem_mulher_manu2, contagem_homem_manu2)

# Criando o gráfico de barras empilhadas
grafico_empilhado_manu <- ggplot(contagem_alunos_manu, aes(x = as.factor(ano), y = n, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de Alunos para Manunt. e Suport. em Infor.", x = "Ano", y = "Número de Alunos") +
  geom_text(aes(label = format(round(n, 1), nsmall = 0)), position = position_stack(vjust = 0.5), color = "black") +
  facet_wrap(~Sexo, ncol = 1, scales = "free_y")

print(grafico_empilhado_manu)

ggsave("grafico_contagem_alunos_manu.png", grafico_empilhado_manu)
## Saving 7 x 5 in image
#Criando a contagem de alunos por sexo para o curso de Informática e empilhando os dados por Situação da Matrícula
contagem_mulher_info2 <- dado_mulher_info %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_mulher_manu2)

contagem_homem_info2 <- dado_homem_info %>% group_by(ano, `Sexo`, `Situação de Matrícula`)%>%tally()
#print(contagem_homem_manu2)

contagem_alunos_info <- bind_rows(contagem_mulher_info2, contagem_homem_info2)

# Criando o gráfico de barras empilhadas
grafico_empilhado_infor <- ggplot(contagem_alunos_info, aes(x = as.factor(ano), y = n, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity") +
  labs(title = "Número de Alunos para Infor.", x = "Ano", y = "Número de Alunos") +
  geom_text(aes(label = format(round(n, 1), nsmall = 0)), position = position_stack(vjust = 0.5), color = "black") +
  facet_wrap(~Sexo, ncol = 1, scales = "free_y")

print(grafico_empilhado_infor)

ggsave("grafico_contagem_alunos_infor.png", grafico_empilhado_infor)
## Saving 7 x 5 in image

1.1 Ingresso Feminino nos Cursos da Pesquisa

Vamos dar uma olhada no percentual de ingresso e matrículas em Curso por parte das mulheres e dos homens para os cursos de Manutenção e Suporte em Informáitca.

1.1.1 Primeiro vamos nos debruçar sobre os dados de Ingresso para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

1. Vamos olhar inicialmente os dados Feminos para vermos o percentual de ingresso por parte das mulheres para os cursos da pesquisa

# Fazendo o cálculo feminino para ingresso para o curso de Manutenção e Suporte em informática
dado_ingresso_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_mulher = (total_alunas / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_mulher_manu <- dado_ingresso_mulher_manu %>%
  filter(Sexo == "Feminino")

unique(dado_ingresso_mulher_manu$percentual_ingresso_mulher)
## [1] 31.76471 34.99392 37.61006 38.29787 37.82609
print(dado_ingresso_mulher_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Ingresso                Técnico em Manute… Femi…     297     935    31.8
## 2  2018 Ingresso                Técnico em Manute… Femi…     288     823    35.0
## 3  2019 Ingresso                Técnico em Manute… Femi…     299     795    37.6
## 4  2020 Ingresso                Técnico em Manute… Femi…     306     799    38.3
## 5  2021 Ingresso                Técnico em Manute… Femi…     261     690    37.8
## # … with abbreviated variable names ¹​total_alunas, ²​total_ingresso,
## #   ³​percentual_ingresso_mulher
write_csv2(dado_ingresso_mulher_manu, "Percentual_mulheres_manu_ingresso.csv")

grafico_ingresso_mulher_manu <- ggplot(dado_ingresso_mulher_manu, aes(x = as.factor(ano), y = percentual_ingresso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminino de ingresso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulher_manu)

ggsave("dados_percentual_Mulher_ingresso_Man.png", grafico_ingresso_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo feminino para ingresso para o curso de Informática
dado_ingresso_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_mulher = (total_alunas / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_mulher_info <- dado_ingresso_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_ingresso_mulher_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Ingresso                Técnico em Inform… Femi…    3759    9916    37.9
## 2  2018 Ingresso                Técnico em Inform… Femi…    4406   10439    42.2
## 3  2019 Ingresso                Técnico em Inform… Femi…    4658   10846    42.9
## 4  2020 Ingresso                Técnico em Inform… Femi…    4807   11307    42.5
## 5  2021 Ingresso                Técnico em Inform… Femi…    4688    9904    47.3
## # … with abbreviated variable names ¹​total_alunas, ²​total_ingresso,
## #   ³​percentual_ingresso_mulher
write_csv2(dado_ingresso_mulher_info, "Percentual_mulheres_infor_ingresso.csv")

grafico_ingresso_mulher_info <- ggplot(dado_ingresso_mulher_info, aes(x = as.factor(ano), y = percentual_ingresso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminina de ingresso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulher_info)

ggsave("dados_percentual_Mulher_ingresso_Info.png", grafico_ingresso_mulher_info)
## Saving 7 x 5 in image

2. Analisando o percentual de meninos para os cursos base desse pesquisa

# Fazendo o cálculo Masculino para ingresso para o curso de Manutenção e Suporte em informática
dado_ingresso_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_homem = (total_alunos / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_homem_manu <- dado_ingresso_homem_manu %>%
  filter(Sexo == "Masculino")

print(dado_ingresso_homem_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Ingresso                Técnico em Manute… Masc…     638     935    68.2
## 2  2018 Ingresso                Técnico em Manute… Masc…     535     823    65.0
## 3  2019 Ingresso                Técnico em Manute… Masc…     496     795    62.4
## 4  2020 Ingresso                Técnico em Manute… Masc…     493     799    61.7
## 5  2021 Ingresso                Técnico em Manute… Masc…     429     690    62.2
## # … with abbreviated variable names ¹​total_alunos, ²​total_ingresso,
## #   ³​percentual_ingresso_homem
write_csv2(dado_ingresso_homem_manu, "Percentual_homens_manu_ingresso.csv")

grafico_ingresso_homem_manu <- ggplot(dado_ingresso_homem_manu, aes(x = as.factor(ano), y = percentual_ingresso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino ingresso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_ingresso_homem_manu)

ggsave("dados_percentual_Homem_ingresso_Man.png", grafico_ingresso_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo masculino para ingresso em curso para o curso de Informática
dado_ingresso_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Ingresso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_ingresso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_ingresso = first(total_ingresso),
            percentual_ingresso_homem = (total_alunos / total_ingresso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_ingresso_homem_info <- dado_ingresso_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_ingresso_homem_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Ingresso                Técnico em Inform… Masc…    6157    9916    62.1
## 2  2018 Ingresso                Técnico em Inform… Masc…    6033   10439    57.8
## 3  2019 Ingresso                Técnico em Inform… Masc…    6188   10846    57.1
## 4  2020 Ingresso                Técnico em Inform… Masc…    6500   11307    57.5
## 5  2021 Ingresso                Técnico em Inform… Masc…    5216    9904    52.7
## # … with abbreviated variable names ¹​total_alunos, ²​total_ingresso,
## #   ³​percentual_ingresso_homem
write_csv2(dado_ingresso_homem_info, "Percentual_homens_infor_ingresso.csv")

grafico_ingresso_homem_info <- ggplot(dado_ingresso_homem_info, aes(x = as.factor(ano), y = percentual_ingresso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_ingresso_homem_info)

ggsave("dados_percentual_Homem_ingresso_Info.png", grafico_ingresso_homem_info)
## Saving 7 x 5 in image
# Criando a variavél percentual_ingresso comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_ingresso_mulher_manu2 <- dado_ingresso_mulher_manu %>%
  mutate(percentual_ingresso = percentual_ingresso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_ingresso_homem_manu2 <- dado_ingresso_homem_manu %>%
  mutate(percentual_ingresso = percentual_ingresso_homem)
#print(dado_ingresso_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
ingresso_mulheres_homens_manu <- bind_rows(dado_ingresso_mulher_manu2, dado_ingresso_homem_manu2)

write_csv2(ingresso_mulheres_homens_manu, "Percentual_Mulheres&Homens_ingresso_manu.csv")

grafico_ingresso_mulheres_homens_manu <- ggplot(ingresso_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_ingresso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual ingresso para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_ingresso_manu.png", grafico_ingresso_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_ingresso comum os dois csvs de infor. para trabalhar no gráfico
dado_ingresso_mulher_info2 <- dado_ingresso_mulher_info %>%
  mutate(percentual_ingresso = percentual_ingresso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_ingresso_homem_info2 <- dado_ingresso_homem_info %>%
  mutate(percentual_ingresso = percentual_ingresso_homem)
#print(dado_ingresso_homem_manu2)

ingresso_mulheres_homens_infor <- bind_rows(dado_ingresso_mulher_info2, dado_ingresso_homem_info2)

write_csv2(ingresso_mulheres_homens_infor, "Percentual_Mulheres&Homens_ingresso_infor.csv")

grafico_ingresso_mulheres_homens_infor <- ggplot(ingresso_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_ingresso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual ingresso para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_ingresso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_ingresso_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_ingresso_infor.png", grafico_ingresso_mulheres_homens_infor)
## Saving 7 x 5 in image

1.1.2 Agora vamos vamos nos debruçar sobre os dados femininos com matriculas “Em Curso” para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

1. Vamos olhar inicialmente os dados Feminos para vermos o percentual de matriculas Em Curso por parte das mulheres para os cursos da pesquisa.

# Fazendo o cálculo feminino para matrículas em curso para o curso de Manutenção e Suporte em informática
dado_emCurso_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_mulher = (total_alunas / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_mulher_manu <- dado_emCurso_mulher_manu %>%
  filter(Sexo == "Feminino")

print(dado_emCurso_mulher_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Em curso                Técnico em Manute… Femi…     436    1260    34.6
## 2  2018 Em curso                Técnico em Manute… Femi…     452    1366    33.1
## 3  2019 Em curso                Técnico em Manute… Femi…     420    1273    33.0
## 4  2020 Em curso                Técnico em Manute… Femi…     580    1674    34.6
## 5  2021 Em curso                Técnico em Manute… Femi…     446    1324    33.7
## # … with abbreviated variable names ¹​total_alunas, ²​total_emCurso,
## #   ³​percentual_emCurso_mulher
write_csv2(dado_emCurso_mulher_manu, "Percentual_mulheres_manu_emCurso.csv")

grafico_emCurso_mulher_manu <- ggplot(dado_emCurso_mulher_manu, aes(x = as.factor(ano), y = percentual_emCurso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminino em curso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulher_manu)

ggsave("dados_percentual_Mulher_emCurso_Man.png", grafico_emCurso_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo feminino para matrículas em curso para o curso de Informática
dado_emCurso_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_mulher = (total_alunas / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_mulher_info <- dado_emCurso_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_emCurso_mulher_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Em curso                Técnico em Inform… Femi…    5807   15647    37.1
## 2  2018 Em curso                Técnico em Inform… Femi…    6565   17740    37.0
## 3  2019 Em curso                Técnico em Inform… Femi…    7200   18254    39.4
## 4  2020 Em curso                Técnico em Inform… Femi…    9803   23641    41.5
## 5  2021 Em curso                Técnico em Inform… Femi…    9906   23604    42.0
## # … with abbreviated variable names ¹​total_alunas, ²​total_emCurso,
## #   ³​percentual_emCurso_mulher
write_csv2(dado_emCurso_mulher_info, "Percentual_mulheres_infor_emCurso.csv")

grafico_emCurso_mulher_info <- ggplot(dado_emCurso_mulher_info, aes(x = as.factor(ano), y = percentual_emCurso_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Feminina em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulher_info)

ggsave("dados_percentual_Mulher_emCurso_Info.png", grafico_emCurso_mulher_info)
## Saving 7 x 5 in image

2. Analisando o percentual de meninos para os cursos base desse pesquisa

# Fazendo o cálculo Masculino para matrículas em curso para o curso de Manutenção e Suporte em informática
dado_emCurso_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_homem = (total_alunos / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_homem_manu <- dado_emCurso_homem_manu %>%
  filter(Sexo == "Masculino")

print(dado_emCurso_homem_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Em curso                Técnico em Manute… Masc…     824    1260    65.4
## 2  2018 Em curso                Técnico em Manute… Masc…     914    1366    66.9
## 3  2019 Em curso                Técnico em Manute… Masc…     853    1273    67.0
## 4  2020 Em curso                Técnico em Manute… Masc…    1094    1674    65.4
## 5  2021 Em curso                Técnico em Manute… Masc…     878    1324    66.3
## # … with abbreviated variable names ¹​total_alunos, ²​total_emCurso,
## #   ³​percentual_emCurso_homem
write_csv2(dado_emCurso_homem_manu, "Percentual_homens_manu_emCurso.csv")

grafico_emCurso_homem_manu <- ggplot(dado_emCurso_homem_manu, aes(x = as.factor(ano), y = percentual_emCurso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_emCurso_homem_manu)

ggsave("dados_percentual_Homem_emCurso_Man.png", grafico_emCurso_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo masculino para matrículas em curso para o curso de Informática
dado_emCurso_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` =="Em curso") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_emCurso = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_emCurso = first(total_emCurso),
            percentual_emCurso_homem = (total_alunos / total_emCurso) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_emCurso_homem_info <- dado_emCurso_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_emCurso_homem_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Em curso                Técnico em Inform… Masc…    9840   15647    62.9
## 2  2018 Em curso                Técnico em Inform… Masc…   11175   17740    63.0
## 3  2019 Em curso                Técnico em Inform… Masc…   11054   18254    60.6
## 4  2020 Em curso                Técnico em Inform… Masc…   13838   23641    58.5
## 5  2021 Em curso                Técnico em Inform… Masc…   13698   23604    58.0
## # … with abbreviated variable names ¹​total_alunos, ²​total_emCurso,
## #   ³​percentual_emCurso_homem
write_csv2(dado_emCurso_homem_info, "Percentual_homens_infor_emCurso.csv")

grafico_emCurso_homem_info <- ggplot(dado_emCurso_homem_info, aes(x = as.factor(ano), y = percentual_emCurso_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual Masculino em curso para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_emCurso_homem_info)

ggsave("dados_percentual_Homem_emCurso_Info.png", grafico_emCurso_homem_info)
## Saving 7 x 5 in image
# Criando a variavél percentual_emCurso comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_emCurso_mulher_manu2 <- dado_emCurso_mulher_manu %>%
  mutate(percentual_emCurso = percentual_emCurso_mulher)
#print(dado_emCurso_mulher_manu2)

dado_emCurso_homem_manu2 <- dado_emCurso_homem_manu %>%
  mutate(percentual_emCurso = percentual_emCurso_homem)
#print(dado_ingresso_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
emCurso_mulheres_homens_manu <- bind_rows(dado_emCurso_mulher_manu2, dado_emCurso_homem_manu2)

#print(emCurso_mulheres_homens_manu)
write_csv2(emCurso_mulheres_homens_manu, "Percentual_Mulheres&Homens_emCurso_manu.csv")

grafico_emCurso_mulheres_homens_manu <- ggplot(emCurso_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_emCurso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas emCurso para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_emCurso_manu.png", grafico_emCurso_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_emCurso comum os dois csvs de infor. para trabalhar no gráfico
dado_emCurso_mulher_info2 <- dado_emCurso_mulher_info %>%
  mutate(percentual_emCurso = percentual_emCurso_mulher)
#print(dado_ingresso_mulher_manu2)

dado_emCurso_homem_info2 <- dado_emCurso_homem_info %>%
  mutate(percentual_emCurso = percentual_emCurso_homem)
#print(dado_ingresso_homem_manu2)

emCurso_mulheres_homens_infor <- bind_rows(dado_emCurso_mulher_info2, dado_emCurso_homem_info2)

write_csv2(emCurso_mulheres_homens_infor, "Percentual_Mulheres&Homens_emCurso_infor.csv")

grafico_emCurso_mulheres_homens_infor <- ggplot(emCurso_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_emCurso, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas emCurso para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_emCurso, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_emCurso_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_emCurso_infor.png", grafico_emCurso_mulheres_homens_infor)
## Saving 7 x 5 in image

1.2 Interrupção dos Cursos pelas mulheres e pelos homens

Evasão Feminina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de evasão feminina para o curso de Manutenção e Suporte em informática
dado_evasao_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_evasao = first(total_evasao),
            percentual_evasao_mulher = (total_alunas / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_mulher_manu <- dado_evasao_mulher_manu %>%
  filter(Sexo == "Feminino")

print(dado_evasao_mulher_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Evasão                  Técnico em Manute… Femi…     106     309    34.3
## 2  2018 Evasão                  Técnico em Manute… Femi…     116     336    34.5
## 3  2019 Evasão                  Técnico em Manute… Femi…      84     279    30.1
## 4  2020 Evasão                  Técnico em Manute… Femi…      67     202    33.2
## 5  2021 Evasão                  Técnico em Manute… Femi…      91     234    38.9
## # … with abbreviated variable names ¹​total_alunas, ²​total_evasao,
## #   ³​percentual_evasao_mulher
write_csv2(dado_evasao_mulher_manu, "Percentual_mulheres_manu_evasao.csv")

grafico_evasao_mulher_manu <- ggplot(dado_evasao_mulher_manu, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulher_manu)

ggsave("dados_percentual_Mulher_evasao_Man.png", grafico_evasao_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de evasão feminina para o curso de Informática
dado_evasao_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_evasao = first(total_evasao),
            percentual_evasao_mulher = (total_alunas / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_mulher_info <- dado_evasao_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_evasao_mulher_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Evasão                  Técnico em Inform… Femi…    1819    4680    38.9
## 2  2018 Evasão                  Técnico em Inform… Femi…    1542    3851    40.0
## 3  2019 Evasão                  Técnico em Inform… Femi…    1354    3512    38.6
## 4  2020 Evasão                  Técnico em Inform… Femi…     929    2292    40.5
## 5  2021 Evasão                  Técnico em Inform… Femi…    1227    3124    39.3
## # … with abbreviated variable names ¹​total_alunas, ²​total_evasao,
## #   ³​percentual_evasao_mulher
write_csv2(dado_evasao_mulher_info, "Percentual_mulheres_infor_evasao.csv")

grafico_evasao_mulher_info <- ggplot(dado_evasao_mulher_info, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulher_info)

ggsave("dados_percentual_Mulher_evasao_Info.png", grafico_evasao_mulher_info)
## Saving 7 x 5 in image

Evasão Masculina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de evasão Masculina para o curso de Manutenção e Suporte em informática
dado_evasao_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_evasao = first(total_evasao),
            percentual_evasao_homem = (total_alunos / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_homem_manu <- dado_evasao_homem_manu %>%
  filter(Sexo == "Masculino")

print(dado_evasao_homem_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Evasão                  Técnico em Manute… Masc…     203     309    65.7
## 2  2018 Evasão                  Técnico em Manute… Masc…     220     336    65.5
## 3  2019 Evasão                  Técnico em Manute… Masc…     195     279    69.9
## 4  2020 Evasão                  Técnico em Manute… Masc…     135     202    66.8
## 5  2021 Evasão                  Técnico em Manute… Masc…     143     234    61.1
## # … with abbreviated variable names ¹​total_alunos, ²​total_evasao,
## #   ³​percentual_evasao_homem
write_csv2(dado_evasao_homem_manu, "Percentual_homens_manu_evasao.csv")

grafico_evasao_homem_manu <- ggplot(dado_evasao_homem_manu, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_evasao_homem_manu)

ggsave("dados_percentual_Homem_evasao_Man.png", grafico_evasao_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de evasão masculina para o curso de Informática
dado_evasao_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` =="Evasão") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_evasao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_evasao = first(total_evasao),
            percentual_evasao_homem = (total_alunos / total_evasao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_evasao_homem_info <- dado_evasao_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_evasao_homem_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Evasão                  Técnico em Inform… Masc…    2861    4680    61.1
## 2  2018 Evasão                  Técnico em Inform… Masc…    2309    3851    60.0
## 3  2019 Evasão                  Técnico em Inform… Masc…    2158    3512    61.4
## 4  2020 Evasão                  Técnico em Inform… Masc…    1363    2292    59.5
## 5  2021 Evasão                  Técnico em Inform… Masc…    1897    3124    60.7
## # … with abbreviated variable names ¹​total_alunos, ²​total_evasao,
## #   ³​percentual_evasao_homem
write_csv2(dado_evasao_homem_info, "Percentual_homens_infor_evasao.csv")

grafico_evasao_homem_info <- ggplot(dado_evasao_homem_info, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_evasao_homem_info)

ggsave("dados_percentual_Homem_evasao_Info.png", grafico_evasao_homem_info)
## Saving 7 x 5 in image
# Criando a variavél percentual_evasao comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_evasao_mulher_manu2 <- dado_evasao_mulher_manu %>%
  mutate(percentual_evasao = percentual_evasao_mulher)
#print(dado_evasao_mulher_manu2)

dado_evasao_homem_manu2 <- dado_evasao_homem_manu %>%
  mutate(percentual_evasao = percentual_evasao_homem)
#print(dado_evasao_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
evasao_mulheres_homens_manu <- bind_rows(dado_evasao_mulher_manu2, dado_evasao_homem_manu2)

#print(evasao_mulheres_homens_manu)
write_csv2(evasao_mulheres_homens_manu, "Percentual_Mulheres&Homens_evasao_manu.csv")

grafico_evasao_mulheres_homens_manu <- ggplot(evasao_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_evasao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas evasao para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_evasao_manu.png", grafico_evasao_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_evasao comum os dois csvs de infor. para trabalhar no gráfico
dado_evasao_mulher_info2 <- dado_evasao_mulher_info %>%
  mutate(percentual_evasao = percentual_evasao_mulher)
#print(dado_evasao_mulher_manu2)

dado_evasao_homem_info2 <- dado_evasao_homem_info %>%
  mutate(percentual_evasao = percentual_evasao_homem)
#print(dado_evasao_homem_manu2)

evasao_mulheres_homens_infor <- bind_rows(dado_evasao_mulher_info2, dado_evasao_homem_info2)

write_csv2(evasao_mulheres_homens_infor, "Percentual_Mulheres&Homens_evasao_infor.csv")

grafico_evasao_mulheres_homens_infor <- ggplot(evasao_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_evasao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas evasao para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_evasao_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_evasao_infor.png", grafico_evasao_mulheres_homens_infor)
## Saving 7 x 5 in image

1.3 Conclusão do curso pelas mulheres e pelos homens

Agora vamos dar uma olhada no percentual de conclusão de curso por parte das mulheres e dos homens para os cursos de Manutenção e Suporte em Informáitca.

1.3.1 Primeiro vamos nos debruçar sobre os dados de conclusão feminina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de conclusão feminina para o curso de Manutenção e Suporte em informática
dado_conclusao_mulher_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_mulher = (total_alunas / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_mulher_manu <- dado_conclusao_mulher_manu %>%
  filter(Sexo == "Feminino")

print(dado_conclusao_mulher_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Concluída               Técnico em Manute… Femi…     267     730    36.6
## 2  2018 Concluída               Técnico em Manute… Femi…     215     630    34.1
## 3  2019 Concluída               Técnico em Manute… Femi…     223     648    34.4
## 4  2020 Concluída               Técnico em Manute… Femi…      85     253    33.6
## 5  2021 Concluída               Técnico em Manute… Femi…     362     925    39.1
## # … with abbreviated variable names ¹​total_alunas, ²​total_conclusao,
## #   ³​percentual_conclusao_mulher
write_csv2(dado_conclusao_mulher_manu, "Percentual_mulhres_manu_conclusao.csv")

grafico_conclusao_mulher_manu <- ggplot(dado_conclusao_mulher_manu, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulher_manu)

ggsave("dados_percentual_Mulher_conclusao_Man.png", grafico_conclusao_mulher_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de conclusão feminina para o curso de Informática
dado_conclusao_mulher_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(Sexo == "Feminino")) %>%
  summarise(total_alunas = first(total_alunas),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_mulher = (total_alunas / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_mulher_info <- dado_conclusao_mulher_info %>%
  filter(Sexo == "Feminino")

print(dado_conclusao_mulher_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Concluída               Técnico em Inform… Femi…    2387    5927    40.3
## 2  2018 Concluída               Técnico em Inform… Femi…    2350    6151    38.2
## 3  2019 Concluída               Técnico em Inform… Femi…    2839    7345    38.7
## 4  2020 Concluída               Técnico em Inform… Femi…    1369    3447    39.7
## 5  2021 Concluída               Técnico em Inform… Femi…    3742    8709    43.0
## # … with abbreviated variable names ¹​total_alunas, ²​total_conclusao,
## #   ³​percentual_conclusao_mulher
write_csv2(dado_conclusao_mulher_info, "Percentual_mulhres_infor_conclusao.csv")

grafico_conclusao_mulher_info <- ggplot(dado_conclusao_mulher_info, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulher_info)

ggsave("dados_percentual_Mulher_conclusao_Info.png", grafico_conclusao_mulher_info)
## Saving 7 x 5 in image

1.3.2 Agora vamos nos debruçar sobre os dados de conclusão masculina para os cursos selecionados na pesquisa entre os anos de 2017 a 2021

# Fazendo o cálculo de conclusão Masculina para o curso de Manutenção e Suporte em informática
dado_conclusao_homem_manu <- dado_manu_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_homem = (total_alunos / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_homem_manu <- dado_conclusao_homem_manu %>%
  filter(Sexo == "Masculino")
  
print(dado_conclusao_homem_manu)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Concluída               Técnico em Manute… Masc…     463     730    63.4
## 2  2018 Concluída               Técnico em Manute… Masc…     415     630    65.9
## 3  2019 Concluída               Técnico em Manute… Masc…     425     648    65.6
## 4  2020 Concluída               Técnico em Manute… Masc…     168     253    66.4
## 5  2021 Concluída               Técnico em Manute… Masc…     563     925    60.9
## # … with abbreviated variable names ¹​total_alunos, ²​total_conclusao,
## #   ³​percentual_conclusao_homem
write_csv2(dado_conclusao_homem_manu, "Percentual_homens_manu_conclusao.csv")

grafico_conclusao_homem_manu <- ggplot(dado_conclusao_homem_manu, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Masculina para o curso de Mant. e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + scale_fill_manual(values = "Blue")

print(grafico_conclusao_homem_manu)

ggsave("dados_percentual_Homem_conclusao_Man.png", grafico_conclusao_homem_manu)
## Saving 7 x 5 in image
# Fazendo o cálculo de conclusão masculina para o curso de Informática
dado_conclusao_homem_info <- dado_info_total %>%
  filter(`Situação de Matrícula` == "Concluída") %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(total_conclusao = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(Sexo == "Masculino")) %>%
  summarise(total_alunos = first(total_alunos),
            total_conclusao = first(total_conclusao),
            percentual_conclusao_homem = (total_alunos / total_conclusao) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
dado_conclusao_homem_info <- dado_conclusao_homem_info %>%
  filter(Sexo == "Masculino")

print(dado_conclusao_homem_info)
## # A tibble: 5 × 7
## # Groups:   ano, Situação de Matrícula, Nome de Curso [5]
##     ano `Situação de Matrícula` `Nome de Curso`    Sexo  total…¹ total…² perce…³
##   <dbl> <chr>                   <chr>              <chr>   <int>   <int>   <dbl>
## 1  2017 Concluída               Técnico em Inform… Masc…    3540    5927    59.7
## 2  2018 Concluída               Técnico em Inform… Masc…    3801    6151    61.8
## 3  2019 Concluída               Técnico em Inform… Masc…    4506    7345    61.3
## 4  2020 Concluída               Técnico em Inform… Masc…    2078    3447    60.3
## 5  2021 Concluída               Técnico em Inform… Masc…    4967    8709    57.0
## # … with abbreviated variable names ¹​total_alunos, ²​total_conclusao,
## #   ³​percentual_conclusao_homem
write_csv2(dado_conclusao_homem_info, "Percentual_homens_infor_conclusao.csv")

grafico_conclusao_homem_info <- ggplot(dado_conclusao_homem_info, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Masculina para o curso de Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))+ scale_fill_manual(values = "Blue")

print(grafico_conclusao_homem_info)

ggsave("dados_percentual_Homem_conclusao_Info.png", grafico_conclusao_homem_info)
## Saving 7 x 5 in image
# Criando a variavél percentual_conclusao comum os dois csvs de mant. e suport. em infor. para trabalhar no gráfico
dado_conclusao_mulher_manu2 <- dado_conclusao_mulher_manu %>%
  mutate(percentual_conclusao = percentual_conclusao_mulher)
#print(dado_conclusao_mulher_manu2)

dado_conclusao_homem_manu2 <- dado_conclusao_homem_manu %>%
  mutate(percentual_conclusao = percentual_conclusao_homem)
#print(dado_conclusao_homem_manu2)

#agrupando os dados para trabalhar os dois sexos no gráfico
conclusao_mulheres_homens_manu <- bind_rows(dado_conclusao_mulher_manu2, dado_conclusao_homem_manu2)

#print(conclusao_mulheres_homens_manu)
write_csv2(conclusao_mulheres_homens_manu, "Percentual_Mulheres&Homens_conclusao_manu.csv")

grafico_conclusao_mulheres_homens_manu <- ggplot(conclusao_mulheres_homens_manu, aes(x = as.factor(ano), y = percentual_conclusao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas conclusao para o curso de Man e Suport. em Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulheres_homens_manu)

ggsave("dados_percentual_Mulheres&Homens_conclusao_manu.png", grafico_conclusao_mulheres_homens_manu)
## Saving 7 x 5 in image
# Criando a variavél percentual_conclusao comum os dois csvs de infor. para trabalhar no gráfico
dado_conclusao_mulher_info2 <- dado_conclusao_mulher_info %>%
  mutate(percentual_conclusao = percentual_conclusao_mulher)
#print(dado_conclusao_mulher_manu2)

dado_conclusao_homem_info2 <- dado_conclusao_homem_info %>%
  mutate(percentual_conclusao = percentual_conclusao_homem)
#print(dado_conclusao_homem_manu2)

conclusao_mulheres_homens_infor <- bind_rows(dado_conclusao_mulher_info2, dado_conclusao_homem_info2)

write_csv2(conclusao_mulheres_homens_infor, "Percentual_Mulheres&Homens_conclusao_infor.csv")

grafico_conclusao_mulheres_homens_infor <- ggplot(conclusao_mulheres_homens_infor, aes(x = as.factor(ano), y = percentual_conclusao, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual matrículas conclusao para o curso de Infor.", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao, 1), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(grafico_conclusao_mulheres_homens_infor)

ggsave("dados_percentual_Mulheres&Homens_conclusao_infor.png", grafico_conclusao_mulheres_homens_infor)
## Saving 7 x 5 in image

Vamos olhar agora as mesmas informações mas com foco apenas no IFPB

#Pegando os dados femininos para os cursos Técnico em Manutenção e Suporte em Informática e Técnico em Informática no IFPB
dado_mulher_manu_IFPB <- dado_mulher_manu %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_manu_IFPB)
write_csv2(dado_mulher_manu_IFPB, "dados_manu_mulher_IFPB.csv")

dado_mulher_info_IFPB <- dado_mulher_info %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_info_IFPB)
write_csv2(dado_mulher_info_IFPB, "dados_info_mulher_IFPB.csv")

#Pegando os dados masculinos para os cursos Técnico em Manutenção e Suporte em Informática e Técnico em Informática no IFPB
dado_homem_manu_IFPB <- dado_homem_manu %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_manu_IFPB)
write_csv2(dado_homem_manu_IFPB, "dados_manu_homem_IFPB.csv")

dado_homem_info_IFPB <- dado_homem_info %>%
  filter(`Instituição`=="IFPB")

#print(dado_mulher_info_IFPB)
write_csv2(dado_homem_info_IFPB, "dados_info_homem_IFPB.csv")

#Dataset para o curso de Manutenção e Suporte em Informática para os dois sexo e para todos os anos
dado_manu_total_IFPB <- bind_rows(dado_mulher_manu_IFPB, dado_homem_manu_IFPB)
print(dado_manu_total_IFPB)
## # A tibble: 1,260 × 97
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Data …⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          3667    1000 1985886  6.47e7 NO DEC… 30/03/… 23/03/… 01/03/… Inform…
##  2          3834    1000  792572  3.48e7 BRANCA  31/12/… 07/02/… 01/03/… Inform…
##  3          3901    1000 2150513  7.21e7 PARDA   20/12/… 20/03/… 01/03/… Inform…
##  4          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
##  5          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
##  6          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
##  7          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
##  8          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
##  9          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
## 10          3901    1000 2150513  7.21e7 BRANCA  20/12/… 20/03/… 01/03/… Inform…
## # … with 1,250 more rows, 88 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, …
write_csv2(dado_manu_total_IFPB, "dados_manu_total2017a2021_IFPB.csv")

#Dataset para o curso de Informática para os dois sexo e para todos os anos
dado_info_total_IFPB <- bind_rows(dado_mulher_info_IFPB, dado_homem_info_IFPB)
print(dado_info_total_IFPB)
## # A tibble: 6,669 × 97
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Data …⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          3634    1000 2022975  6.68e7 PARDA   30/09/… 09/05/… 01/05/… Inform…
##  2          3634    1000 2022975  6.68e7 PARDA   30/09/… 09/05/… 01/05/… Inform…
##  3          3634    1000 2022975  6.68e7 PARDA   30/09/… 09/05/… 01/05/… Inform…
##  4          3634    1000 2022975  6.68e7 PARDA   30/09/… 09/05/… 01/05/… Inform…
##  5          3634    1000 2022975  6.68e7 PRETA   30/09/… 09/05/… 01/05/… Inform…
##  6          3634    1000 2022975  6.68e7 PARDA   30/09/… 09/05/… 01/05/… Inform…
##  7          3300    1000 2158043  7.25e7 PARDA   30/12/… 02/03/… 01/03/… Inform…
##  8          3300    1000 2158043  7.24e7 PARDA   30/12/… 02/03/… 01/03/… Inform…
##  9          3300    1000 2158043  7.24e7 PARDA   30/12/… 02/03/… 01/03/… Inform…
## 10          3300    1000 2158043  7.24e7 PARDA   30/12/… 02/03/… 01/03/… Inform…
## # … with 6,659 more rows, 88 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, …
write_csv2(dado_info_total_IFPB, "dados_info_total2017a2021_IFPB.csv")