Library

library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(readr)
library(purrr)
#library(GGally)
#library(pscl)
library(broom)
library(tidyverse)
## ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2
## ──
## ✔ ggplot2 3.4.0     ✔ stringr 1.5.0
## ✔ tibble  3.1.8     ✔ forcats 1.0.0
## ✔ tidyr   1.3.0     
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
library(modelr)
## 
## Attaching package: 'modelr'
## 
## The following object is masked from 'package:broom':
## 
##     bootstrap
library(here)
## here() starts at D:/laryssa/mestrado/NiloPecanha/NiloPecanha-Laryssa
library(skimr)
library(gcookbook)
library(lubridate)
## 
## Attaching package: 'lubridate'
## 
## The following objects are masked from 'package:base':
## 
##     date, intersect, setdiff, union
library(rio)

Lendo os CSVs e salvando em um dataframe

dado_2017 <- read_csv2("2017-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1031798 Columns: 25
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (18): Cor / Raça, Dt Data Fim Previsto, Dt Data Inicio, Dt Ocorrencia Ma...
## dbl  (7): Carga Horaria, Carga Horaria Minima, Co Ciclo Matricula, Co Matric...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2017 <- dado_2017 %>% 
  filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))  %>%
  mutate(`Sg Sexo` = ifelse(`Sg Sexo`=="F", "Feminino", "Masculino"), ano = 2017) %>%
  rename(Sexo=`Sg Sexo`)

# Separando os dados entre mulheres e homens para o ano de 2017
fem17 <- dado_2017%>%
  filter(`Sexo` == "Feminino") 
#print(fem17)

mas17 <- dado_2017%>%
  filter(`Sexo` == "Masculino") 
#print(mas17)

dado_2018 <- read_csv2("2018-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 964593 Columns: 35── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (25): Sexo, Renda Familiar, Cor / Raça, Faixa Etria, Data de Ocorrncia d...
## dbl (10): Idade, Cdigo da Matrcula, Cdigo do Ciclo Matrcula, Vagas Ofertadas...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2018 <- dado_2018 %>% filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))  %>%
  mutate(`Sexo` = ifelse(`Sexo`=="F", "Feminino", "Masculino"), ano = 2018) %>% 
  rename(Sexo=`Sexo`)

# Separando os dados entre mulheres e homens para o ano de 2018
fem18 <- dado_2018%>%
  filter(`Sexo` == "Feminino") 
#print(fem18)

mas18 <- dado_2018%>%
  filter(`Sexo` == "Masculino") 
#print(mas18)

dado_2019 <- read_csv2("2019-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1023303 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (23): Categoria da Situação, Cor / Raça, Data de Inicio do Ciclo, Data d...
## dbl (31): Teste, Carga Horaria, Carga Horaria Minima, Código do Ciclo Matric...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2019 <- dado_2019 %>% filter(`Tipo de Oferta`=="Integrado")%>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))  %>%
  select(-Teste) %>% 
  mutate(ano = 2019)

# Separando os dados entre mulheres e homens para o ano de 2019
fem19 <- dado_2019%>%
  filter(`Sexo` == "Feminino") 
#print(fem19)

mas19 <- dado_2019%>%
  filter(`Sexo` == "Masculino") 
#print(mas19)

dado_2020 <- read_csv2("2020-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1507476 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (24): Categoria de Situação, Cor/Raça, Data de Fim Previsto do Ciclo, Da...
## dbl (30): Carga Horaria, Carga Horaria Minima, Cod Unidade, Código da Matríc...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2020 <- dado_2020 %>% filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))  %>%
  mutate(Sexo = ifelse(Sexo=="F", "Feminino", "Masculino"), ano = 2020)

# Separando os dados entre mulheres e homens para o ano de 2020
fem20 <- dado_2020%>%
  filter(`Sexo` == "Feminino") 
#print(fem20)

mas20 <- dado_2020%>%
  filter(`Sexo` == "Masculino") 
#print(mas20)

dado_2021 <- read_csv2("2021-microdados-matriculas.csv")
## ℹ Using "','" as decimal and "'.'" as grouping mark. Use `read_delim()` for more control.
## Rows: 1507476 Columns: 54── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (24): Categoria de Situação, Cor/Raça, Data de Fim Previsto do Ciclo, Da...
## dbl (30): Carga Horaria, Carga Horaria Minima, Cod Unidade, Código da Matríc...
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
dado_2021 <- dado_2021 %>% filter(`Tipo de Oferta`=="Integrado") %>%
  filter(`Tipo de Curso`=="Técnico") %>%
  filter(str_detect(`Instituição`, "^IF"))  %>%
  mutate(Sexo = ifelse(Sexo=="F", "Feminino", "Masculino"), ano = 2021)

# Separando os dados entre mulheres e homens para o ano de 2021
fem21 <- dado_2021%>%
  filter(`Sexo` == "Feminino") 
#print(fem21)

mas21 <- dado_2021%>%
  filter(`Sexo` == "Masculino") 
#print(mas21)

#agrupando os dados e montando dos datasets

dado <- bind_rows(dado_2017, dado_2018, dado_2019, dado_2020, dado_2021)
print(dado)
## # A tibble: 1,155,254 × 91
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Dt Da…⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  2          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  3          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  4          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  5          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  6          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  7          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  8          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  9          3500    1200 2151261  7.21e7 PARDA   31/12/… 02/03/… 01/03/… Recurs…
## 10          3500    1200 2151261  7.21e7 NO DEC… 31/12/… 02/03/… 01/03/… Recurs…
## # … with 1,155,244 more rows, 82 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, ano <dbl>, …
#Dataset com os dados femininos
dado_mulher <- bind_rows(fem17, fem18, fem19, fem20, fem21)
print(dado_mulher)
## # A tibble: 554,787 × 91
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Dt Da…⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  2          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  3          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  4          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  5          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  6          3500    1200 2151261  7.21e7 PARDA   31/12/… 02/03/… 01/03/… Recurs…
##  7          3500    1200 2151261  7.21e7 NO DEC… 31/12/… 02/03/… 01/03/… Recurs…
##  8          3500    1200 2151261  7.21e7 PRETA   31/12/… 02/03/… 01/03/… Recurs…
##  9          3500    1200 2151261  7.21e7 PARDA   31/12/… 02/03/… 01/03/… Recurs…
## 10          3500    1200 2151261  7.21e7 PRETA   31/12/… 02/03/… 01/03/… Recurs…
## # … with 554,777 more rows, 82 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, ano <dbl>, …
#dataset com os dados masculinos
dado_homem <- bind_rows(mas17, mas18, mas19, mas20, mas21)
print(dado_homem)
## # A tibble: 600,467 × 91
##    Carga Horar…¹ Carga…² Co Ci…³ Co Ma…⁴ Cor /…⁵ Dt Da…⁶ Dt Da…⁷ Dt Oc…⁸ Eixo …⁹
##            <dbl>   <dbl>   <dbl>   <dbl> <chr>   <chr>   <chr>   <chr>   <chr>  
##  1          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  2          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  3          3750    1200 1943726  6.14e7 PARDA   30/06/… 10/03/… 01/03/… Infrae…
##  4          3500    1200 2151261  7.21e7 BRANCA  31/12/… 02/03/… 01/03/… Recurs…
##  5          3500    1200 2151261  7.21e7 BRANCA  31/12/… 02/03/… 01/03/… Recurs…
##  6          3500    1200 2151261  7.21e7 PRETA   31/12/… 02/03/… 01/03/… Recurs…
##  7          3500    1200 2151261  7.21e7 NO DEC… 31/12/… 02/03/… 01/03/… Recurs…
##  8          3500    1200 2151261  7.21e7 PARDA   31/12/… 02/03/… 01/03/… Recurs…
##  9          3500    1200 2151261  7.21e7 NO DEC… 31/12/… 02/03/… 01/03/… Recurs…
## 10          3500    1200 2151261  7.24e7 PARDA   31/12/… 02/03/… 01/03/… Recurs…
## # … with 600,457 more rows, 82 more variables: `Fator Esforco Curso` <dbl>,
## #   `Mes De Ocorrencia` <chr>, `Modalidade Ensino` <chr>,
## #   `Nome de Curso` <chr>, `Fonte de financiamento` <chr>,
## #   `Renda Familiar` <chr>, Instituição <chr>, Sexo <chr>,
## #   `Situação de Matrícula` <chr>, `Sub Eixo Tecnologico` <chr>,
## #   `Tipo de Curso` <chr>, `Tipo de Oferta` <chr>, `Total Inscritos` <dbl>,
## #   Turno <chr>, `Unidade Ensino` <chr>, `Vagas Ofertadas` <dbl>, ano <dbl>, …

Analisando os dados do data frame e fazendo ajustes

Nesse momento foram realizados ajustes nos nomes dos cursos, pois tinha uma divergência entre a nomenclatura dos anos 2019 à 2021 em relação a 2017 e 2018; após o ajuste realizados apresentamos um gráfico mostrando a concentração feminina e masculina nos cursos selecionados entre os anos de 2017 à 2021.

#unique(dado$`Nome de Curso`)
#unique(dado$`Eixo Tecnológico`)
cursos_selcionados <- c("Técnico em Manutenção e Suporte em Informática", "Técnico em Informática")
dado_summary = dado %>%
  filter(`Nome de Curso` %in% cursos_selcionados) %>%
  group_by(ano) %>% 
  mutate(nalunos = n()) %>% 
  group_by(ano, Sexo) %>% 
  summarise(percentual_por_sexo = n() / first(nalunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(dado_summary)
## # A tibble: 10 × 3
## # Groups:   ano [5]
##      ano Sexo      percentual_por_sexo
##    <dbl> <chr>                   <dbl>
##  1  2017 Feminino                 37.8
##  2  2017 Masculino                62.2
##  3  2018 Feminino                 38.5
##  4  2018 Masculino                61.5
##  5  2019 Feminino                 39.8
##  6  2019 Masculino                60.2
##  7  2020 Feminino                 41.1
##  8  2020 Masculino                58.9
##  9  2021 Feminino                 41.1
## 10  2021 Masculino                58.9
p1 <- ggplot(dado_summary, aes(x = as.factor(ano), y = percentual_por_sexo, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "", x = "Anos correspondentes", y = "Percentual de alunos(as) %") +
  geom_text(aes(label = format(round(percentual_por_sexo, 2), nsmall = 2)), vjust = 1.5, color = "black") +
  coord_flip()

print(p1)

ggsave("dados_sexo_cursos.png", p1)
## Saving 7 x 5 in image
dado_teste = dado %>%
  filter(`Nome de Curso`== "Técnico em Manutenção e Suporte em Informática") %>%
  group_by(ano) %>% 
  mutate(nalunos = n()) %>% 
  group_by(ano, Sexo) %>% 
  summarise(percentual_por_sexo = n() / first(nalunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(dado_teste)
## # A tibble: 10 × 3
## # Groups:   ano [5]
##      ano Sexo      percentual_por_sexo
##    <dbl> <chr>                   <dbl>
##  1  2017 Feminino                 34.2
##  2  2017 Masculino                65.8
##  3  2018 Feminino                 33.9
##  4  2018 Masculino                66.1
##  5  2019 Feminino                 34.3
##  6  2019 Masculino                65.7
##  7  2020 Feminino                 35.5
##  8  2020 Masculino                64.5
##  9  2021 Feminino                 35.5
## 10  2021 Masculino                64.5
#ggsave("dados_sexo_ManutencaoESuporte.jpeg", dado_teste)
#export(dado_teste, file = "dados_sexo_ManutencaoESuporte.png")

p2 <- ggplot(dado_teste, aes(x = as.factor(ano), y = percentual_por_sexo, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "", x = "Anos correspondentes", y = "Percentual de alunos(as) %") +
  geom_text(aes(label = format(round(percentual_por_sexo, 2), nsmall = 2)), vjust = 1.5, color = "black") +
  coord_flip()

print(p2)

ggsave("dados_sexo_ManutencaoESuporte.png", p2)
## Saving 7 x 5 in image
dado_teste1 = dado %>%
  filter(`Nome de Curso`== "Técnico em Informática") %>%
  group_by(ano) %>% 
  mutate(nalunos = n()) %>% 
  group_by(ano, Sexo) %>% 
  summarise(percentual_por_sexo = n() / first(nalunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(dado_teste1)
## # A tibble: 10 × 3
## # Groups:   ano [5]
##      ano Sexo      percentual_por_sexo
##    <dbl> <chr>                   <dbl>
##  1  2017 Feminino                 38.1
##  2  2017 Masculino                61.9
##  3  2018 Feminino                 38.9
##  4  2018 Masculino                61.1
##  5  2019 Feminino                 40.2
##  6  2019 Masculino                59.8
##  7  2020 Feminino                 41.6
##  8  2020 Masculino                58.4
##  9  2021 Feminino                 41.6
## 10  2021 Masculino                58.4
p3 <- ggplot(dado_teste1, aes(x = as.factor(ano), y = percentual_por_sexo, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "", x = "Anos correspondentes", y = "Percentual de alunos(as) %") +
  geom_text(aes(label = format(round(percentual_por_sexo, 2), nsmall = 2)), vjust = 1.5, color = "black") +
  coord_flip()

print(p3)

ggsave("dados_sexo_Infor.png", p3)
## Saving 7 x 5 in image

1.1 Ingresso nos Cursos da Pesquisa pelas mulheres e pelos homens

Analisando o percentual de meninas para os cursos base desse pesquisa.

cursos_selcionados <- c("Técnico em Manutenção e Suporte em Informática", "Técnico em Informática")
dado_summary_mulher = dado_mulher %>%
  filter(`Nome de Curso` %in% cursos_selcionados) %>%
  filter(Sexo == "Feminino") %>%
  group_by(ano) %>% 
  mutate(nalunos = n()) %>% 
  group_by(ano, `Nome de Curso`) %>% 
  summarise(percentual_por_sexo = n() / first(nalunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(dado_summary_mulher)
## # A tibble: 10 × 3
## # Groups:   ano [5]
##      ano `Nome de Curso`                                percentual_por_sexo
##    <dbl> <chr>                                                        <dbl>
##  1  2017 Técnico em Informática                                       92.6 
##  2  2017 Técnico em Manutenção e Suporte em Informática                7.43
##  3  2018 Técnico em Informática                                       93.3 
##  4  2018 Técnico em Manutenção e Suporte em Informática                6.72
##  5  2019 Técnico em Informática                                       94.0 
##  6  2019 Técnico em Manutenção e Suporte em Informática                6.01
##  7  2020 Técnico em Informática                                       94.2 
##  8  2020 Técnico em Manutenção e Suporte em Informática                5.78
##  9  2021 Técnico em Informática                                       94.2 
## 10  2021 Técnico em Manutenção e Suporte em Informática                5.78
p4 <- ggplot(dado_summary_mulher, aes(x = as.factor(ano), y = percentual_por_sexo, fill = `Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de alunas nos cursos selecionados", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_por_sexo, 0), nsmall = 0)), vjust = -0.2, color = "black", position = position_dodge(width = 0.9))

print(p4)

ggsave("dados_percentual_Mulheres.png", p4)
## Saving 7 x 5 in image
# Analisando o ingresso masculino para os cursos base da pesquisa
dado_summary_homem = dado %>%
  filter(`Nome de Curso` %in% cursos_selcionados) %>%
  filter(str_detect(`Instituição`, "^IF")) %>%
  filter(Sexo == "Masculino") %>%
  group_by(ano) %>% 
  mutate(nalunos = n()) %>% 
  group_by(ano, `Nome de Curso`) %>% 
  summarise(percentual_por_sexo = n() / first(nalunos) * 100)
## `summarise()` has grouped output by 'ano'. You can override using the `.groups`
## argument.
print(dado_summary_homem)
## # A tibble: 10 × 3
## # Groups:   ano [5]
##      ano `Nome de Curso`                                percentual_por_sexo
##    <dbl> <chr>                                                        <dbl>
##  1  2017 Técnico em Informática                                       91.3 
##  2  2017 Técnico em Manutenção e Suporte em Informática                8.68
##  3  2018 Técnico em Informática                                       91.8 
##  4  2018 Técnico em Manutenção e Suporte em Informática                8.20
##  5  2019 Técnico em Informática                                       92.4 
##  6  2019 Técnico em Manutenção e Suporte em Informática                7.61
##  7  2020 Técnico em Informática                                       92.6 
##  8  2020 Técnico em Manutenção e Suporte em Informática                7.36
##  9  2021 Técnico em Informática                                       92.6 
## 10  2021 Técnico em Manutenção e Suporte em Informática                7.36
p5 <- ggplot(dado_summary_homem, aes(x = as.factor(ano), y = percentual_por_sexo, fill = `Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de alunos nos cursos selecionados", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_por_sexo, 0), nsmall = 0)), vjust = -0.2, color = "black", position = position_dodge(width = 0.9))

print(p5)

ggsave("dados_percentual_Homem.png", p5)
## Saving 7 x 5 in image

1.2 Interrupção dos Cursos pelas mulheres e pelos homens

situacao_matricula <- c("Evasão")
sit_mat <- c("Concluída", "Em curso", "Integralizada", "Reprovado")
cursos_selecionados <- c("Técnico em Manutenção e Suporte em Informática", "Técnico em Informática")

dado_summary <- dado_mulher %>%
  filter(`Nome de Curso` %in% cursos_selecionados) %>%
  filter(`Situação de Matrícula` %in% situacao_matricula) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(n_alunas = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunas = sum(n_alunas)) %>%
  summarise(percentual_evasao_mulher = sum(`Situação de Matrícula` == "Evasão") / first(total_alunas) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
print(dado_summary)
## # A tibble: 10 × 5
## # Groups:   ano, Situação de Matrícula, Nome de Curso [10]
##      ano `Situação de Matrícula` `Nome de Curso`                   Sexo  perce…¹
##    <dbl> <chr>                   <chr>                             <chr>   <dbl>
##  1  2017 Evasão                  Técnico em Informática            Femi…  0.0550
##  2  2017 Evasão                  Técnico em Manutenção e Suporte … Femi…  0.943 
##  3  2018 Evasão                  Técnico em Informática            Femi…  0.0649
##  4  2018 Evasão                  Técnico em Manutenção e Suporte … Femi…  0.862 
##  5  2019 Evasão                  Técnico em Informática            Femi…  0.0739
##  6  2019 Evasão                  Técnico em Manutenção e Suporte … Femi…  1.19  
##  7  2020 Evasão                  Técnico em Informática            Femi…  0.108 
##  8  2020 Evasão                  Técnico em Manutenção e Suporte … Femi…  1.49  
##  9  2021 Evasão                  Técnico em Informática            Femi…  0.108 
## 10  2021 Evasão                  Técnico em Manutenção e Suporte … Femi…  1.49  
## # … with abbreviated variable name ¹​percentual_evasao_mulher
# Gráfico com a representação visual do que foi calculado no dado_summary para a evasão feminina para os cursos da pesquisa
dado_summary_grafico <- ggplot(dado_summary, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))
print(dado_summary_grafico)

# Trabalhando com o curso de Técnico em Manutenção e Suporte em Informática para o sexo feminino

dado_Man_Mul <- dado_summary %>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_evasao_mulher)

Man_Fem <- ggplot(dado_Man_Mul, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina no curso de Manutenção e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(Man_Fem)

#Salvando a representação gráfica em uma imagem para uso posterior
ggsave("dados_percentual_Mulher_evasao_Man.png", Man_Fem)
## Saving 7 x 5 in image
# Trabalhando com o curso de Técnico em Informática

dado_info_Mul <- dado_summary %>%
  filter(`Nome de Curso` == "Técnico em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_evasao_mulher)

Infor_Fem <- ggplot(dado_info_Mul, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina no curso Técnico em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(Infor_Fem)

ggsave("dados_percentual_Mulher_evasao_Infor.png", Infor_Fem)
## Saving 7 x 5 in image
# Gerando dataframe com a visão geral da evasão feminina para os dois cursos trabalhados
evasao_mulher <- bind_rows(dado_Man_Mul, dado_info_Mul)
print(evasao_mulher)
## # A tibble: 10 × 5
## # Groups:   Situação de Matrícula, percentual_evasao_mulher [8]
##      ano `Situação de Matrícula` `Nome de Curso`                   Sexo  perce…¹
##    <dbl> <chr>                   <chr>                             <chr>   <dbl>
##  1  2017 Evasão                  Técnico em Manutenção e Suporte … Femi…  0.943 
##  2  2018 Evasão                  Técnico em Manutenção e Suporte … Femi…  0.862 
##  3  2019 Evasão                  Técnico em Manutenção e Suporte … Femi…  1.19  
##  4  2020 Evasão                  Técnico em Manutenção e Suporte … Femi…  1.49  
##  5  2021 Evasão                  Técnico em Manutenção e Suporte … Femi…  1.49  
##  6  2017 Evasão                  Técnico em Informática            Femi…  0.0550
##  7  2018 Evasão                  Técnico em Informática            Femi…  0.0649
##  8  2019 Evasão                  Técnico em Informática            Femi…  0.0739
##  9  2020 Evasão                  Técnico em Informática            Femi…  0.108 
## 10  2021 Evasão                  Técnico em Informática            Femi…  0.108 
## # … with abbreviated variable name ¹​percentual_evasao_mulher
# Representação gráfica dos dados obtidos acima sobre evasão feminina
evasao_geral_Mulher <- ggplot(evasao_mulher, aes(x = as.factor(ano), y = percentual_evasao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina nos cursos selecionados", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(evasao_geral_Mulher)

ggsave("dados_percentual_Mulher_evasao.png", evasao_geral_Mulher)
## Saving 7 x 5 in image
#trabalhando os dados masculinos sobre evasão para os dois cursos trabalhados
dado_summary_1 <- dado_homem %>%
  filter(`Nome de Curso` %in% cursos_selecionados) %>%
  filter(`Situação de Matrícula` %in% situacao_matricula) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>%
  mutate(n_alunos = n()) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`, Sexo) %>%
  mutate(total_alunos = sum(n_alunos)) %>%
  summarise(percentual_evasao_homem = sum(`Situação de Matrícula` == "Evasão") / first(total_alunos) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Nome de
## Curso'. You can override using the `.groups` argument.
print(dado_summary_1)
## # A tibble: 10 × 5
## # Groups:   ano, Situação de Matrícula, Nome de Curso [10]
##      ano `Situação de Matrícula` `Nome de Curso`                   Sexo  perce…¹
##    <dbl> <chr>                   <chr>                             <chr>   <dbl>
##  1  2017 Evasão                  Técnico em Informática            Masc…  0.0350
##  2  2017 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.493 
##  3  2018 Evasão                  Técnico em Informática            Masc…  0.0433
##  4  2018 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.455 
##  5  2019 Evasão                  Técnico em Informática            Masc…  0.0463
##  6  2019 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.513 
##  7  2020 Evasão                  Técnico em Informática            Masc…  0.0734
##  8  2020 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.741 
##  9  2021 Evasão                  Técnico em Informática            Masc…  0.0734
## 10  2021 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.741 
## # … with abbreviated variable name ¹​percentual_evasao_homem
# Gráfico com a representação visual do que foi calculado no dado_summary_1 para a evasão masculina para os cursos da pesquisa
dado_summary_grafico_masculino <- ggplot(dado_summary_1, aes(x = as.factor(ano), y = percentual_evasao_homem, fill = `Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))
print(dado_summary_grafico_masculino)

# Trabalhando com o curso de Técnico em Manutenção e Suporte em Informática para o sexo Masculino

dado_Man <- dado_summary_1 %>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_evasao_homem)

Man_Mas <- ggplot(dado_Man, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina no curso de Manutenção e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(Man_Mas)

ggsave("dados_percentual_Homem_evasao_Man.png", Man_Mas)
## Saving 7 x 5 in image
# Trabalhando com o curso de Técnico em Informática

dado_info <- dado_summary_1 %>%
  filter(`Nome de Curso` == "Técnico em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_evasao_homem)

Infor_Mas <- ggplot(dado_info, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina no curso Técnico em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(Infor_Mas)

ggsave("dados_percentual_Homem_evasao_Infor.png", Infor_Mas)
## Saving 7 x 5 in image
# Gerando dataframe com a visão geral da evasão masculina para os dois cursos trabalhados
evasao_homem <- bind_rows(dado_Man, dado_info)
print(evasao_homem)
## # A tibble: 10 × 5
## # Groups:   Situação de Matrícula, percentual_evasao_homem [8]
##      ano `Situação de Matrícula` `Nome de Curso`                   Sexo  perce…¹
##    <dbl> <chr>                   <chr>                             <chr>   <dbl>
##  1  2017 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.493 
##  2  2018 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.455 
##  3  2019 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.513 
##  4  2020 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.741 
##  5  2021 Evasão                  Técnico em Manutenção e Suporte … Masc…  0.741 
##  6  2017 Evasão                  Técnico em Informática            Masc…  0.0350
##  7  2018 Evasão                  Técnico em Informática            Masc…  0.0433
##  8  2019 Evasão                  Técnico em Informática            Masc…  0.0463
##  9  2020 Evasão                  Técnico em Informática            Masc…  0.0734
## 10  2021 Evasão                  Técnico em Informática            Masc…  0.0734
## # … with abbreviated variable name ¹​percentual_evasao_homem
evasao_geral_home <- ggplot(evasao_homem, aes(x = as.factor(ano), y = percentual_evasao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Masculina nos cursos selecionados", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(evasao_geral_home)

ggsave("dados_percentual_Homem_evasao.png", evasao_geral_home)
## Saving 7 x 5 in image
#Evasao por sexo para Manuten. e Suport.
evasao_geral_manu <- bind_rows(dado_Man_Mul, dado_Man) %>%
  mutate(percentual_evasao_geral_manu = coalesce(percentual_evasao_mulher, percentual_evasao_homem))

print(evasao_geral_manu)
## # A tibble: 10 × 7
## # Groups:   Situação de Matrícula, percentual_evasao_mulher [5]
##      ano `Situação de Matrícula` `Nome de Curso`   Sexo  perce…¹ perce…² perce…³
##    <dbl> <chr>                   <chr>             <chr>   <dbl>   <dbl>   <dbl>
##  1  2017 Evasão                  Técnico em Manut… Femi…   0.943  NA       0.943
##  2  2018 Evasão                  Técnico em Manut… Femi…   0.862  NA       0.862
##  3  2019 Evasão                  Técnico em Manut… Femi…   1.19   NA       1.19 
##  4  2020 Evasão                  Técnico em Manut… Femi…   1.49   NA       1.49 
##  5  2021 Evasão                  Técnico em Manut… Femi…   1.49   NA       1.49 
##  6  2017 Evasão                  Técnico em Manut… Masc…  NA       0.493   0.493
##  7  2018 Evasão                  Técnico em Manut… Masc…  NA       0.455   0.455
##  8  2019 Evasão                  Técnico em Manut… Masc…  NA       0.513   0.513
##  9  2020 Evasão                  Técnico em Manut… Masc…  NA       0.741   0.741
## 10  2021 Evasão                  Técnico em Manut… Masc…  NA       0.741   0.741
## # … with abbreviated variable names ¹​percentual_evasao_mulher,
## #   ²​percentual_evasao_homem, ³​percentual_evasao_geral_manu
evasao_geral_manu_graf <- ggplot(evasao_geral_manu, aes(x = as.factor(ano), y = percentual_evasao_geral_manu, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão por sexo para o curso de Manut. e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_geral_manu, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + coord_flip()

print(evasao_geral_manu_graf)

ggsave("dados_percentual_evasao_Geral_Manu.png", evasao_geral_manu_graf)
## Saving 7 x 5 in image
#Evasao por sexo para Informática
evasao_geral_infor <- bind_rows(dado_info_Mul, dado_info)%>%
  mutate(percentual_evasao_geral_info = coalesce(percentual_evasao_mulher, percentual_evasao_homem))

print(evasao_geral_infor)
## # A tibble: 10 × 7
## # Groups:   Situação de Matrícula, percentual_evasao_mulher [5]
##      ano `Situação de Matrícula` `Nome de Curso`   Sexo  perce…¹ perce…² perce…³
##    <dbl> <chr>                   <chr>             <chr>   <dbl>   <dbl>   <dbl>
##  1  2017 Evasão                  Técnico em Infor… Femi…  0.0550 NA       0.0550
##  2  2018 Evasão                  Técnico em Infor… Femi…  0.0649 NA       0.0649
##  3  2019 Evasão                  Técnico em Infor… Femi…  0.0739 NA       0.0739
##  4  2020 Evasão                  Técnico em Infor… Femi…  0.108  NA       0.108 
##  5  2021 Evasão                  Técnico em Infor… Femi…  0.108  NA       0.108 
##  6  2017 Evasão                  Técnico em Infor… Masc… NA       0.0350  0.0350
##  7  2018 Evasão                  Técnico em Infor… Masc… NA       0.0433  0.0433
##  8  2019 Evasão                  Técnico em Infor… Masc… NA       0.0463  0.0463
##  9  2020 Evasão                  Técnico em Infor… Masc… NA       0.0734  0.0734
## 10  2021 Evasão                  Técnico em Infor… Masc… NA       0.0734  0.0734
## # … with abbreviated variable names ¹​percentual_evasao_mulher,
## #   ²​percentual_evasao_homem, ³​percentual_evasao_geral_info
evasao_geral_infor_graf <- ggplot(evasao_geral_infor, aes(x = as.factor(ano), y = percentual_evasao_geral_info, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão por sexo para o curso Técnico em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_evasao_geral_info, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + coord_flip()

print(evasao_geral_infor_graf)

ggsave("dados_percentual_evasao_Geral_Infor.png", evasao_geral_infor_graf)
## Saving 7 x 5 in image

1.3 Conclusão do curso pelas mulheres e pelos homens

Para se trabalhar com os dados de conclusão as matriculas que estavam como Integralizada e as Concluídas foram taodas renomeadas para concluídas

#unique(dado_2017$`Situação de Matrícula`)
#unique(dado$`Situação de Matrícula`)
situacao_matricula <- c("Concluída")
sit_mat <- c("Evasão", "Em curso", "Reprovado")
cursos_selcionados <- c("Técnico em Manutenção e Suporte em Informática", "Técnico em Informática")

dado_summary2 = dado_mulher %>%
  filter(`Nome de Curso` %in% cursos_selcionados) %>%
  filter(`Situação de Matrícula`%in% situacao_matricula) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>% 
  mutate(n_alunas = n()) %>% 
  group_by(ano, `Situação de Matrícula`, Sexo, `Nome de Curso`) %>% 
  mutate(total_alunas = sum(n_alunas)) %>%
  summarise(percentual_conclusao_mulher = sum(`Situação de Matrícula` == "Concluída")/first(total_alunas) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Sexo'. You
## can override using the `.groups` argument.
print(dado_summary2)
## # A tibble: 10 × 5
## # Groups:   ano, Situação de Matrícula, Sexo [5]
##      ano `Situação de Matrícula` Sexo     `Nome de Curso`                perce…¹
##    <dbl> <chr>                   <chr>    <chr>                            <dbl>
##  1  2017 Concluída               Feminino Técnico em Informática          0.0419
##  2  2017 Concluída               Feminino Técnico em Manutenção e Supor…  0.375 
##  3  2018 Concluída               Feminino Técnico em Informática          0.0426
##  4  2018 Concluída               Feminino Técnico em Manutenção e Supor…  0.465 
##  5  2019 Concluída               Feminino Técnico em Informática          0.0352
##  6  2019 Concluída               Feminino Técnico em Manutenção e Supor…  0.448 
##  7  2020 Concluída               Feminino Técnico em Informática          0.0730
##  8  2020 Concluída               Feminino Técnico em Manutenção e Supor…  1.18  
##  9  2021 Concluída               Feminino Técnico em Informática          0.0730
## 10  2021 Concluída               Feminino Técnico em Manutenção e Supor…  1.18  
## # … with abbreviated variable name ¹​percentual_conclusao_mulher
#Vendo de forma gráfica o que foi calculado em cima
dado_summary_grafico <- ggplot(dado_summary2, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de evasão Feminina", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))
print(dado_summary_grafico)

# Trabalhando com o curso de Técnico em Técnico em Manutenção e Suporte em Informática

dado_Man <- dado_summary2 %>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_conclusao_mulher)

Man_Fem <- ggplot(dado_Man, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Evasão Feminina no curso de Manut. e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(Man_Fem)

ggsave("dados_percentual_Mulheres_conclusao_Man.png", Man_Fem)
## Saving 7 x 5 in image
# Trabalhando com o curso de Técnico em Informática

dado_info <- dado_summary2 %>%
  filter(`Nome de Curso` == "Técnico em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_conclusao_mulher)

Info_Fem <- ggplot(dado_info, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Evasão Feminina no curso de Manut. e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(Info_Fem)

ggsave("dados_percentual_Mulheres_conclusao_Man.png", Info_Fem)
## Saving 7 x 5 in image
conclusao_mulher <- bind_rows(dado_Man, dado_info)
print(conclusao_mulher)
## # A tibble: 10 × 5
## # Groups:   Situação de Matrícula, percentual_conclusao_mulher [8]
##      ano `Situação de Matrícula` Sexo     `Nome de Curso`                perce…¹
##    <dbl> <chr>                   <chr>    <chr>                            <dbl>
##  1  2017 Concluída               Feminino Técnico em Manutenção e Supor…  0.375 
##  2  2018 Concluída               Feminino Técnico em Manutenção e Supor…  0.465 
##  3  2019 Concluída               Feminino Técnico em Manutenção e Supor…  0.448 
##  4  2020 Concluída               Feminino Técnico em Manutenção e Supor…  1.18  
##  5  2021 Concluída               Feminino Técnico em Manutenção e Supor…  1.18  
##  6  2017 Concluída               Feminino Técnico em Informática          0.0419
##  7  2018 Concluída               Feminino Técnico em Informática          0.0426
##  8  2019 Concluída               Feminino Técnico em Informática          0.0352
##  9  2020 Concluída               Feminino Técnico em Informática          0.0730
## 10  2021 Concluída               Feminino Técnico em Informática          0.0730
## # … with abbreviated variable name ¹​percentual_conclusao_mulher
# Gerando gráfico os os dados femininos para os dois cursos
conclusao_geral_mulher <- ggplot(conclusao_mulher, aes(x = as.factor(ano), y = percentual_conclusao_mulher, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão Feminina nos cursos selecionados", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_mulher, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(conclusao_geral_mulher)

ggsave("dados_percentual_Mulheres_conclusao.png", conclusao_geral_mulher)
## Saving 7 x 5 in image
#Trabalhando com os dados dos alunos para obter o percentual de conclusão dos cursos selecionados
dado_summary2_2 = dado_homem %>%
  filter(`Nome de Curso` %in% cursos_selcionados) %>%
  filter(`Situação de Matrícula` %in% situacao_matricula) %>%
  group_by(ano, `Situação de Matrícula`, `Nome de Curso`) %>% 
  mutate(n_alunos = n()) %>% 
  group_by(ano, `Situação de Matrícula`, Sexo, `Nome de Curso`) %>% 
  mutate(total_alunos = sum(n_alunos)) %>%
  summarise(percentual_conclusao_homem = sum(`Situação de Matrícula` == "Concluída")/first(total_alunos) * 100)
## `summarise()` has grouped output by 'ano', 'Situação de Matrícula', 'Sexo'. You
## can override using the `.groups` argument.
print(dado_summary2_2)
## # A tibble: 10 × 5
## # Groups:   ano, Situação de Matrícula, Sexo [5]
##      ano `Situação de Matrícula` Sexo      `Nome de Curso`               perce…¹
##    <dbl> <chr>                   <chr>     <chr>                           <dbl>
##  1  2017 Concluída               Masculino Técnico em Informática         0.0282
##  2  2017 Concluída               Masculino Técnico em Manutenção e Supo…  0.216 
##  3  2018 Concluída               Masculino Técnico em Informática         0.0263
##  4  2018 Concluída               Masculino Técnico em Manutenção e Supo…  0.241 
##  5  2019 Concluída               Masculino Técnico em Informática         0.0222
##  6  2019 Concluída               Masculino Técnico em Manutenção e Supo…  0.235 
##  7  2020 Concluída               Masculino Técnico em Informática         0.0481
##  8  2020 Concluída               Masculino Técnico em Manutenção e Supo…  0.595 
##  9  2021 Concluída               Masculino Técnico em Informática         0.0481
## 10  2021 Concluída               Masculino Técnico em Manutenção e Supo…  0.595 
## # … with abbreviated variable name ¹​percentual_conclusao_homem
# Trabalhando com o curso de Técnico em Técnico em Manutenção e Suporte em Informática
dado_Man_Mas <- dado_summary2_2 %>%
  filter(`Nome de Curso` == "Técnico em Manutenção e Suporte em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_conclusao_homem)

conclusao_masculina_manu <- ggplot(dado_Man_Mas, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Conclusão masculina no curso de Técnico em Manut. e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(conclusao_masculina_manu)

ggsave("dados_percentual_Homem_conclusao_Man.png", conclusao_masculina_manu)
## Saving 7 x 5 in image
# Trabalhando com o curso de Técnico em Informática
dado_info_Mas <- dado_summary2_2 %>%
  filter(`Nome de Curso` == "Técnico em Informática") %>%
  group_by(`Situação de Matrícula`, percentual_conclusao_homem)

conclusao_masculina_infor <- ggplot(dado_info_Mas, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill = `Situação de Matrícula`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Conclusão masculina no curso de Técnico em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(conclusao_masculina_infor)

ggsave("dados_percentual_Homem_conclusao_Infor.png", conclusao_masculina_infor)
## Saving 7 x 5 in image
conclusao_homem <- bind_rows(dado_Man_Mas, dado_info_Mas)
print(conclusao_homem)
## # A tibble: 10 × 5
## # Groups:   Situação de Matrícula, percentual_conclusao_homem [8]
##      ano `Situação de Matrícula` Sexo      `Nome de Curso`               perce…¹
##    <dbl> <chr>                   <chr>     <chr>                           <dbl>
##  1  2017 Concluída               Masculino Técnico em Manutenção e Supo…  0.216 
##  2  2018 Concluída               Masculino Técnico em Manutenção e Supo…  0.241 
##  3  2019 Concluída               Masculino Técnico em Manutenção e Supo…  0.235 
##  4  2020 Concluída               Masculino Técnico em Manutenção e Supo…  0.595 
##  5  2021 Concluída               Masculino Técnico em Manutenção e Supo…  0.595 
##  6  2017 Concluída               Masculino Técnico em Informática         0.0282
##  7  2018 Concluída               Masculino Técnico em Informática         0.0263
##  8  2019 Concluída               Masculino Técnico em Informática         0.0222
##  9  2020 Concluída               Masculino Técnico em Informática         0.0481
## 10  2021 Concluída               Masculino Técnico em Informática         0.0481
## # … with abbreviated variable name ¹​percentual_conclusao_homem
conclusao_geral_masculina <- ggplot(conclusao_homem, aes(x = as.factor(ano), y = percentual_conclusao_homem, fill =`Nome de Curso`)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão masculina nos cursos selecionados", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_homem, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9))

print(conclusao_geral_masculina)

ggsave("dados_percentual_Homem_conclusao.png", conclusao_geral_masculina)
## Saving 7 x 5 in image
# Trabalhando a visão geral por curso selecionado

#Conclusão por sexo para Manuten. e Suport.

conclusao_geral_manu <- bind_rows(dado_Man, dado_Man_Mas)%>%
  mutate(percentual_conclusao_geral_manu = coalesce(percentual_conclusao_mulher, percentual_conclusao_homem))

print(conclusao_geral_manu)
## # A tibble: 10 × 7
## # Groups:   Situação de Matrícula, percentual_conclusao_mulher [5]
##      ano `Situação de Matrícula` Sexo      Nome de Cur…¹ perce…² perce…³ perce…⁴
##    <dbl> <chr>                   <chr>     <chr>           <dbl>   <dbl>   <dbl>
##  1  2017 Concluída               Feminino  Técnico em M…   0.375  NA       0.375
##  2  2018 Concluída               Feminino  Técnico em M…   0.465  NA       0.465
##  3  2019 Concluída               Feminino  Técnico em M…   0.448  NA       0.448
##  4  2020 Concluída               Feminino  Técnico em M…   1.18   NA       1.18 
##  5  2021 Concluída               Feminino  Técnico em M…   1.18   NA       1.18 
##  6  2017 Concluída               Masculino Técnico em M…  NA       0.216   0.216
##  7  2018 Concluída               Masculino Técnico em M…  NA       0.241   0.241
##  8  2019 Concluída               Masculino Técnico em M…  NA       0.235   0.235
##  9  2020 Concluída               Masculino Técnico em M…  NA       0.595   0.595
## 10  2021 Concluída               Masculino Técnico em M…  NA       0.595   0.595
## # … with abbreviated variable names ¹​`Nome de Curso`,
## #   ²​percentual_conclusao_mulher, ³​percentual_conclusao_homem,
## #   ⁴​percentual_conclusao_geral_manu
conclusao_geral_manu <- ggplot(conclusao_geral_manu, aes(x = as.factor(ano), y = percentual_conclusao_geral_manu, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão por sexo para o curso de Manut. e Suporte em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_geral_manu, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + coord_flip()

print(conclusao_geral_manu)

ggsave("dados_percentual_conclusao_Geral_Manu.png", conclusao_geral_manu)
## Saving 7 x 5 in image
#Evasao por sexo para Informática

conclusao_geral_infor<- bind_rows(dado_info, dado_info_Mas)%>%
  mutate(percentual_conclusao_geral_info = coalesce(percentual_conclusao_mulher, percentual_conclusao_homem))
print(conclusao_geral_infor)
## # A tibble: 10 × 7
## # Groups:   Situação de Matrícula, percentual_conclusao_mulher [5]
##      ano `Situação de Matrícula` Sexo      Nome de Cur…¹ perce…² perce…³ perce…⁴
##    <dbl> <chr>                   <chr>     <chr>           <dbl>   <dbl>   <dbl>
##  1  2017 Concluída               Feminino  Técnico em I…  0.0419 NA       0.0419
##  2  2018 Concluída               Feminino  Técnico em I…  0.0426 NA       0.0426
##  3  2019 Concluída               Feminino  Técnico em I…  0.0352 NA       0.0352
##  4  2020 Concluída               Feminino  Técnico em I…  0.0730 NA       0.0730
##  5  2021 Concluída               Feminino  Técnico em I…  0.0730 NA       0.0730
##  6  2017 Concluída               Masculino Técnico em I… NA       0.0282  0.0282
##  7  2018 Concluída               Masculino Técnico em I… NA       0.0263  0.0263
##  8  2019 Concluída               Masculino Técnico em I… NA       0.0222  0.0222
##  9  2020 Concluída               Masculino Técnico em I… NA       0.0481  0.0481
## 10  2021 Concluída               Masculino Técnico em I… NA       0.0481  0.0481
## # … with abbreviated variable names ¹​`Nome de Curso`,
## #   ²​percentual_conclusao_mulher, ³​percentual_conclusao_homem,
## #   ⁴​percentual_conclusao_geral_info
conclusao_geral_infor <- ggplot(conclusao_geral_infor, aes(x = as.factor(ano), y = percentual_conclusao_geral_info, fill = Sexo)) +
  geom_bar(stat = "identity", position = position_dodge()) +
  labs(title = "Percentual de conclusão por sexo para o curso Técnico em Informática", x = "", y = "") +
  geom_text(aes(label = format(round(percentual_conclusao_geral_info, 2), nsmall = 2)), vjust = 1.5, color = "black", position = position_dodge(width = 0.9)) + coord_flip()

print(conclusao_geral_infor)

ggsave("dados_percentual_conclusao_Geral_Infor.png", conclusao_geral_infor)
## Saving 7 x 5 in image