Cursos por área

Artes e Humanidades

  • ARQUITETURA E URBANISMO
  • LETRAS/INGLÊS
  • LETRAS/LIBRAS

Ciências da Vida

  • PÓS-GRADUAÇÃO EM AGRONOMIA / FITOTECNIA
  • PÓS-GRADUAÇÃO EM CIÊNCIA ANIMAL
  • PÓS-GRADUAÇÃO EM MANEJO DE SOLO E ÁGUA
  • MESTRADO EM PRODUÇÃO ANIMAL
  • PÓS-GRADUAÇÃO EM CIÊNCIA ANIMAL
  • PÓS-GRADUAÇÃO EM ECOLOGIA E CONSERVAÇÃO
  • PÓS-GRADUAÇÃO EM FITOTECNIA
  • PÓS-GRADUAÇÃO EM MANEJO DE SOLO E ÁGUA
  • AGRONOMIA
  • BIOTECNOLOGIA
  • ECOLOGIA
  • ENGENHARIA AGRÍCOLA E AMBIENTAL
  • ENGENHARIA DE PESCA
  • ENGENHARIA FLORESTAL
  • MEDICINA VETERINÁRIA
  • ZOOTECNIA
  • RESIDÊNCIA EM ÁREA PROFISSIONAL DA SAÚDE

Ciências Físicas

  • MESTRADO PROFISSIONAL EM MATEMÁTICA
  • PÓS-GRADUAÇÃO EM ENSINO DE FÍSICA
  • MATEMÁTICA

Ciências Sociais

  • PÓS-GRADUAÇÃO EM AMBIENTE, TECNOLOGIA E SOCIEDADE

Clínicas

  • MEDICINA

Direito

  • DIREITO

Educação

  • MESTRADO EM ENSINO
  • EDUCAÇÃO DO CAMPO
  • A ESCOLA E A CIDADE: POLÍTICAS PÚBLICAS EDUCACIONAIS
  • EDUCAÇÃO ESCOLAR QUILOMBOLA
  • EDUCAÇÃO INTERDISCIPLINAR
  • ESPECIALIZAÇÃO EM CONTABILIDADE E PLANEJAMENTO TRIBUTÁRIO
  • ESPECIALIZAÇÃO EM GESTÃO ESTRATÉGICA DE SERVIÇOS

Empresas e Economia

  • ADMINISTRAÇÃO
  • CIÊNCIAS CONTÁBEIS

Engenharia e Tecnologia

  • MESTRADO EM CIÊNCIA E ENGENHARIA DE MATERIAIS
  • CIÊNCIA E TECNOLOGIA
  • CIÊNCIA E TECNOLOGIA.
  • ENGENHARIA AMBIENTAL E SANITÁRIA
  • ENGENHARIA CIVIL
  • ENGENHARIA DE ENERGIA
  • ENGENHARIA DE PETRÓLEO
  • ENGENHARIA DE PRODUÇÃO
  • ENGENHARIA ELÉTRICA
  • ENGENHARIA MECÂNICA
  • ENGENHARIA QUÍMICA

Informática

  • PÓS-GRADUAÇÃO EM CIÊNCIA DA COMPUTAÇÃO
  • PÓS-GRADUAÇÃO EM SISTEMAS DE COMUNICAÇÃO E AUTOMAÇÃO
  • CIÊNCIA DA COMPUTAÇÃO
  • COMPUTAÇÃO
  • COMPUTAÇÃO E INFORMÁTICA
  • ENGENHARIA DE COMPUTAÇÃO
  • SISTEMAS DE INFORMAÇÃO
  • TECNOLOGIA DA INFORMAÇÃO

FTE da graduação por área:

library(dplyr)
library(readxl)
library(readr)
library(DT)

setwd("G:/Drives compartilhados/ESTATISTICA/THE_IMPACT_2022")

# Abrir carga horária média por curso:
carga_horaria_cursos_graduacao_ufersa <- read_excel("cargahorariacursosgraduacaoUfersaprograd.xlsx", 
                                                       col_types = c("skip", "text", "skip", 
                                                                     "text", "skip", "skip", "skip", "skip", 
                                                                     "skip", "numeric"))
#View(carga_horaria_cursos_graduacao_ufersa)

colnames(carga_horaria_cursos_graduacao_ufersa) <- c("curso","campus","CH_media")

# Abrir conjunto de dados dos alunos 2020.1
alunos2020.1 <- read_csv("Discentes da Graduacao 20201.csv",
                         locale = locale(encoding = "ISO-8859-1")) # %>% tidyr::drop_na("carga_horaria_total")
#View(alunos2020.1) 

# Abrir conjunto de dados dos alunos 2020.1
alunos2020.2 <- read_csv("Discentes da Graduacao 20202.csv",
                         locale = locale(encoding = "ISO-8859-1")) #%>% tidyr::drop_na("carga_horaria_total")
#View(alunos2020.2) 


# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", 
                                         sheet = "area_turno", col_types = c("text", "skip", "text"))


# Pegando cada curso e tirando a média (independente de turno e campus)
carga_horaria_cursos_graduacao_ufersa %>% 
  group_by(curso) %>% 
  summarise(., CH_media = mean(CH_media)) -> carga_horaria_cursos_graduacao_ufersa


# INNER JOIN
inner_join(alunos2020.1, carga_horaria_cursos_graduacao_ufersa, by="curso") %>% 
  inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2020.1

# INNER JOIN
inner_join(alunos2020.2, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
  inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2020.2


# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2020.1$identificador, alunos2020.2$identificador)

# Dados destes alunos no semestre 1:
alunos2020.1 %>% filter(., alunos2020.1$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_1

# Dados destes alunos no semestre 2:
alunos2020.2 %>% filter(., alunos2020.2$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_2

alunos_em_comum_total = data.frame(identificador = alunos_em_comum_1$identificador,
                                   curso = alunos_em_comum_1$curso,
                                   ano_ingresso = alunos_em_comum_1$ano_ingresso,
                                   sexo = alunos_em_comum_1$sexo,
                                   carga_horaria_total =  alunos_em_comum_1$carga_horaria_total +
                                     alunos_em_comum_2$carga_horaria_total, 
                                   CH_media = alunos_em_comum_1$CH_media,
                                   Area = alunos_em_comum_1$Area,
                                   pnaes = alunos_em_comum_1$pnaes)

alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
  alunos_em_comum_total

# FTE dos alunos em comum que recebem auxilio pnaes
alunos_em_comum_total %>% filter(., !is.na(pnaes)) -> pnaes_comum
#pnaes_comum$FTE_individual %>% sum

# FTE dos alunos ingressantes em 2020:
alunos_em_comum_total %>% filter(ano_ingresso == "2020") -> ingressantes_comum
#ingressantes_comum$FTE_individual %>% sum


# Por área de conhecimento ------------------------------------------------

FTE_Area <- function(alunos, Areas_THE){
  tabela_por_Area = data.frame(Area = NA, FTE = NA, Matriculados = NA)
  
  for(i in 1:length(Areas_THE)){
    alunos_Area = alunos %>% filter(., Area == Areas_THE[i]) 
    
    tabela_por_Area %>% rbind(., data.frame(Area = Areas_THE[i], 
                                            Matriculados = nrow(alunos_Area),
                                            FTE = sum(alunos_Area$FTE_individual))) -> tabela_por_Area
    
  }
  
  return(tabela_por_Area[-1, ])
}


# <1> Alunos que cursaram os dois semestres:

alunos_em_comum_total$Area %>% unique -> Areas_THE
#alunos_em_comum_total$FTE_individual[is.na(alunos_em_comum_total$FTE_individual)] <- 0 

tabela_por_Area = FTE_Area(alunos_em_comum_total, Areas_THE)


# <2> Alunos identificadordos apenas em 2020.1:
alunos2020.1 %>% filter(., !(alunos2020.1$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Area(., Areas_THE) -> tabela_por_Area2020.1 

# pnaes 
alunos2020.1 %>% filter(., !(alunos2020.1$identificador %in% alunos_em_comum) &
                          !is.na(pnaes)) %>% 
  arrange(., identificador) %>% 
  mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) -> pnaes_2020.1 

#pnaes_2020.1$FTE_individual %>% sum

# ingressantes 
alunos2020.1 %>% filter(., !(alunos2020.1$identificador %in% alunos_em_comum) &
                          (ano_ingresso == "2020")) %>% 
  arrange(., identificador) %>% 
  mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) -> ingressantes_2020.1 

#ingressantes_2020.1$FTE_individual %>% sum


# <3> Alunos matriculados apenas em 2020.2:
alunos2020.2 %>% filter(., !(alunos2020.2$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Area(., Areas_THE) -> tabela_por_Area2020.2

# pnaes 
alunos2020.2 %>% filter(., !(alunos2020.2$identificador %in% alunos_em_comum) &
                          !is.na(pnaes)) %>% 
  arrange(., identificador) %>% 
  mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) -> pnaes_2020.2 

#pnaes_2020.2$FTE_individual %>% sum

# ingressantes 
alunos2020.2 %>% filter(., !(alunos2020.2$identificador %in% alunos_em_comum) &
                          (ano_ingresso == "2020")) %>% 
  arrange(., identificador) %>% 
  mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) -> ingressantes_2020.2 

#ingressantes_2020.2$FTE_individual %>% sum


cbind(Area = tabela_por_Area$Area, tabela_por_Area[ ,2:3] + 
        tabela_por_Area2020.1[ ,2:3] + 
        tabela_por_Area2020.2[ ,2:3]) -> tabela_final_grad_area

tabela_final_grad_area %>% 
  datatable(., rownames = FALSE) %>% 
  formatRound(columns=c('Matriculados', 'FTE'), digits=3) 
# FTE TOTAL
tabela_final_grad_area[,2:3] %>% colSums  
##          FTE Matriculados 
##     6248.274     9299.000
# FTE pnaes
pnaes_2020.1$FTE_individual %>% sum + 
  pnaes_2020.2$FTE_individual %>% sum +
  pnaes_comum$FTE_individual %>% sum
## [1] 2168.201
# FTE ingressantes
ingressantes_comum$FTE_individual %>% sum +
  ingressantes_2020.1$FTE_individual %>% sum +
  ingressantes_2020.2$FTE_individual %>% sum
## [1] 1229.329
# FTE ingressantes por sexo
full_join(ingressantes_comum %>% group_by(sexo) %>% summarise(FTE = sum(FTE_individual)),
ingressantes_2020.1 %>% group_by(sexo) %>% summarise(FTE = sum(FTE_individual)), 
by="sexo")  %>% 
  full_join(., ingressantes_2020.2 %>% group_by(sexo) %>% 
              summarise(FTE = sum(FTE_individual)), by = "sexo") %>% 
  mutate(FTE_TOTAL = FTE.x+FTE.y+FTE) %>% as.data.frame -> FTE_ingressantes_por_sexo

FTE_ingressantes_por_sexo
##   sexo    FTE.x    FTE.y      FTE FTE_TOTAL
## 1    F 347.6407 14.90840 186.6745  549.2236
## 2    M 449.3405 25.15773 205.6075  680.1057

FTE da graduação por sexo

# FTE por sexo ------------------------------------------------------------


alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$identificador,
                                   curso = alunos_em_comum_1$curso,
                                   carga_horaria_total =  alunos_em_comum_1$carga_horaria_total +
                                     alunos_em_comum_2$carga_horaria_total, 
                                   CH_media = alunos_em_comum_1$CH_media,
                                   Area = alunos_em_comum_1$Area,
                                   sexo = alunos_em_comum_1$sexo)

alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
  alunos_em_comum_total


# Por área de sexo 

sexos_FTE = c("M", "F")

FTE_Sexo <- function(alunos, sexos_THE){
  tabela_por_Sexo = data.frame(sexo = NA, FTE = NA, Matriculados = NA)
  
  for(i in 1:length(sexos_THE)){
    alunos_sexo = alunos %>% filter(., sexo == sexos_THE[i]) 
    
    tabela_por_Sexo %>% rbind(., data.frame(sexo = sexos_THE[i], 
                                            Matriculados = nrow(alunos_sexo),
                                            FTE = sum(alunos_sexo$FTE_individual))) -> tabela_por_Sexo
    
  }
  
  return(tabela_por_Sexo[-1, ])
}

# <1> Alunos que cursaram os dois semestres:

alunos_em_comum_total$sexo %>% unique -> sexos_THE
tabela_por_Sexo = FTE_Sexo(alunos_em_comum_total, sexos_THE)

# <2> Alunos matriculados apenas em 2020.1:
alunos2020.1 %>% filter(., !(alunos2020.1$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Sexo(., sexos_THE) -> tabela_por_Sexo2020.1 

# <3> Alunos identificadordos apenas em 2020.2:
alunos2020.2 %>% filter(., !(alunos2020.2$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Sexo(., sexos_THE) -> tabela_por_Sexo2020.2

# Total 

cbind(Sexo = tabela_por_Sexo$sexo, tabela_por_Sexo[ ,2:3] + 
        tabela_por_Sexo2020.1[ ,2:3] + 
        tabela_por_Sexo2020.2[ ,2:3]) -> tabela_final_grad_sexo


tabela_final_grad_sexo %>% 
  datatable(., rownames = FALSE) %>% 
  formatRound(columns=c('Matriculados', 'FTE'), digits=3) 
# FTE TOTAL
tabela_final_grad_sexo[,2:3] %>% colSums
##          FTE Matriculados 
##     6248.274     9299.000

Graduação, Masculino por área:

# FTE masc. grad. area ----------------------------------------------------

# Abrir conjunto de dados dos alunos 2018.1
alunos2020.1 <- read_csv("Discentes da Graduacao 20201.csv",
                         locale = locale(encoding = "ISO-8859-1")) %>% tidyr::drop_na("carga_horaria_total")
#View(alunos2020.1) 
alunos2020.1 %>% filter(., sexo=="M") -> alunos2020.1

# Abrir conjunto de dados dos alunos 2020.1
alunos2020.2 <- read_csv("Discentes da Graduacao 20202.csv",
                         locale = locale(encoding = "ISO-8859-1")) %>% tidyr::drop_na("carga_horaria_total")
alunos2020.2 %>% filter(., sexo=="M") -> alunos2020.2
#View(alunos2020.2) 


# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno", 
                                         col_types = c("text", "skip", "text"))

# Pegando cada curso e tirando a média (independente de turno e campus)
carga_horaria_cursos_graduacao_ufersa %>% 
  group_by(curso) %>% 
  summarise(., CH_media = mean(CH_media)) -> carga_horaria_cursos_graduacao_ufersa


# INNER JOIN
inner_join(alunos2020.1, carga_horaria_cursos_graduacao_ufersa, by="curso") %>% 
  inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2020.1

# INNER JOIN
inner_join(alunos2020.2, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
  inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2020.2

# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2020.1$identificador, alunos2020.2$identificador)

# Dados destes alunos no semestre 1:
alunos2020.1 %>% filter(., alunos2020.1$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_1 

# Dados destes alunos no semestre 2:
alunos2020.2 %>% filter(., alunos2020.2$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_2

alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$identificador,
                                   curso = alunos_em_comum_1$curso,
                                   carga_horaria_total =  alunos_em_comum_1$carga_horaria_total +
                                     alunos_em_comum_2$carga_horaria_total, 
                                   CH_media = alunos_em_comum_1$CH_media,
                                   Area = alunos_em_comum_1$Area)

alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
  alunos_em_comum_total

# Por área de conhecimento 

FTE_Area <- function(alunos, Areas_THE){
  tabela_por_Area = data.frame(Area = NA, FTE = NA, Matriculados = NA)
  
  for(i in 1:length(Areas_THE)){
    alunos_Area = alunos %>% filter(., Area == Areas_THE[i]) 
    
    tabela_por_Area %>% rbind(., data.frame(Area = Areas_THE[i], 
                                            Matriculados = nrow(alunos_Area),
                                            FTE = sum(alunos_Area$FTE_individual))) -> tabela_por_Area
    
  }
  
  return(tabela_por_Area[-1, ])
}

# <1> Alunos que cursaram os dois semestres:

alunos_em_comum_total$Area %>% unique -> Areas_THE
tabela_por_Area = FTE_Area(alunos_em_comum_total, Areas_THE)

#print(tabela_por_Area$Matriculados %>% sum)

# <2> Alunos matriculados apenas em 2020.1:
alunos2020.1 %>% filter(., !(alunos2020.1$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Area(., Areas_THE) -> tabela_por_Area2020.1 

#print(tabela_por_Area2018.1$Matriculados %>% sum)

# <3> Alunos matriculados apenas em 2020.2:
alunos2020.2 %>% filter(., !(alunos2020.2$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Area(., Areas_THE) -> tabela_por_Area2020.2

#print(tabela_por_Area2018.2$Matriculados %>% sum)

# Total 

cbind(Area = tabela_por_Area$Area, tabela_por_Area[ ,2:3] + 
        tabela_por_Area2020.1[ ,2:3] + 
        tabela_por_Area2020.2[ ,2:3]) -> tabela_final_grad_area_M


tabela_final_grad_area_M %>% 
  datatable(., rownames = FALSE) %>% 
  formatRound(columns=c('Matriculados', 'FTE'), digits=3) 
# FTE TOTAL
tabela_final_grad_area_M[,2:3] %>% colSums
##          FTE Matriculados 
##     3150.877     4939.000

Graduação, Feminino por área:

# FTE fem. grad. area -----------------------------------------------------

# Abrir conjunto de dados dos alunos 2018.1
alunos2020.1 <- read_csv("Discentes da Graduacao 20201.csv",
                         locale = locale(encoding = "ISO-8859-1")) %>% tidyr::drop_na("carga_horaria_total")
#View(alunos2020.1) 
alunos2020.1 %>% filter(., sexo=="F") -> alunos2020.1

# Abrir conjunto de dados dos alunos 2020.1
alunos2020.2 <- read_csv("Discentes da Graduacao 20202.csv",
                         locale = locale(encoding = "ISO-8859-1")) %>% tidyr::drop_na("carga_horaria_total")
alunos2020.2 %>% filter(., sexo=="F") -> alunos2020.2
#View(alunos2020.2) 


# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno", 
                                         col_types = c("text", "skip", "text"))

# Pegando cada curso e tirando a média (independente de turno e campus)
carga_horaria_cursos_graduacao_ufersa %>% 
  group_by(curso) %>% 
  summarise(., CH_media = mean(CH_media)) -> carga_horaria_cursos_graduacao_ufersa



# INNER JOIN
inner_join(alunos2020.1, carga_horaria_cursos_graduacao_ufersa, by="curso") %>% 
  inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2020.1

# INNER JOIN
inner_join(alunos2020.2, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
  inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2020.2

# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2020.1$identificador, alunos2020.2$identificador)

# Dados destes alunos no semestre 1:
alunos2020.1 %>% filter(., alunos2020.1$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_1 

# Dados destes alunos no semestre 2:
alunos2020.2 %>% filter(., alunos2020.2$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_2

alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$identificador,
                                   curso = alunos_em_comum_1$curso,
                                   carga_horaria_total =  alunos_em_comum_1$carga_horaria_total +
                                     alunos_em_comum_2$carga_horaria_total, 
                                   CH_media = alunos_em_comum_1$CH_media,
                                   Area = alunos_em_comum_1$Area)

alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
  alunos_em_comum_total

# Por área de conhecimento 

FTE_Area <- function(alunos, Areas_THE){
  tabela_por_Area = data.frame(Area = NA, FTE = NA, Matriculados = NA)
  
  for(i in 1:length(Areas_THE)){
    alunos_Area = alunos %>% filter(., Area == Areas_THE[i]) 
    
    tabela_por_Area %>% rbind(., data.frame(Area = Areas_THE[i], 
                                            Matriculados = nrow(alunos_Area),
                                            FTE = sum(alunos_Area$FTE_individual))) -> tabela_por_Area
    
  }
  
  return(tabela_por_Area[-1, ])
}

# <1> Alunos que cursaram os dois semestres:

alunos_em_comum_total$Area %>% unique -> Areas_THE
tabela_por_Area = FTE_Area(alunos_em_comum_total, Areas_THE)

#print(tabela_por_Area$Matriculados %>% sum)

# <2> Alunos matriculados apenas em 2020.1:
alunos2020.1 %>% filter(., !(alunos2020.1$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Area(., Areas_THE) -> tabela_por_Area2020.1 

#print(tabela_por_Area2020.1$Matriculados %>% sum)

# <3> Alunos matriculados apenas em 2020.2:
alunos2020.2 %>% filter(., !(alunos2020.2$identificador %in% alunos_em_comum)) %>% 
  arrange(., identificador) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>% 
  FTE_Area(., Areas_THE) -> tabela_por_Area2020.2

#print(tabela_por_Area2018.2$Matriculados %>% sum)

# Total 

cbind(Area = tabela_por_Area$Area, tabela_por_Area[ ,2:3] + 
        tabela_por_Area2020.1[ ,2:3] + 
        tabela_por_Area2020.2[ ,2:3]) -> tabela_final_grad_area_F


tabela_final_grad_area_F %>% 
  datatable(., rownames = FALSE) %>% 
  formatRound(columns=c('Matriculados', 'FTE'), digits=3) 
# FTE TOTAL
tabela_final_grad_area_F[,2:3] %>% colSums
##          FTE Matriculados 
##     3097.397     4360.000

FTE Pós-graduação por sexo:

# FTE pos por sexo --------------------------------------------------------

# Abrir conjunto de dados dos alunos 2020.1
alunos2020.1 = read_csv("./Discentes Mestrado e Doutorado 20201.csv", 
                        locale = locale(encoding = "ISO-8859-1")) 

# Abrir conjunto de dados dos alunos 2020.2
alunos2020.2 = read_csv("Discentes Mestrado e Doutorado 20202.csv", 
                        locale = locale(encoding = "ISO-8859-1"))

# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("cursos_pos_WUR_2021.xlsx", 
                                         col_types = c("text","text"),
                                         sheet = "2020")

# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2020.1$identificador, alunos2020.2$identificador)


# Dados destes alunos no semestre 1:
alunos2020.1 %>% filter(., alunos2020.1$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_1 

# Dados destes alunos no semestre 2:
alunos2020.2 %>% filter(., alunos2020.2$identificador %in% alunos_em_comum) %>% 
  arrange(., identificador) -> alunos_em_comum_2

# Total de alunos nos dois semestres:

# Alunos somente em 2020.1
alunos_so_2020.1 = alunos2020.1 %>% 
  filter(., !(alunos2020.1$identificador %in% alunos_em_comum)) %>% arrange(., identificador)

# Alunos somente em 2020.2
alunos_so_2020.2 = alunos2020.2 %>% 
  filter(., !(alunos2020.2$identificador %in% alunos_em_comum)) %>% arrange(., identificador)

# Masculino
M_comum = alunos_em_comum_1 %>% filter(., sexo=="M") %>% nrow
# Feminino
F_comum = alunos_em_comum_1 %>% filter(., sexo=="F") %>% nrow

# Masculino
M2020.1 = (alunos_so_2020.1 %>% filter(., sexo=="M") %>% nrow)/2
# Feminino
F2020.1 = (alunos_so_2020.1 %>% filter(., sexo=="F") %>% nrow)/2

# Masculino
M2020.2 = (alunos_so_2020.2 %>% filter(., sexo=="M") %>% nrow)/2
# Feminino
F2020.2 = (alunos_so_2020.2 %>% filter(., sexo=="F") %>% nrow)/2

FTE_pos_sexo = data.frame(Masculino = M_comum + M2020.1 + M2020.2, Feminino = F_comum + F2020.1 + F2020.2) %>%
  mutate(Total = Masculino + Feminino)

DT::datatable(FTE_pos_sexo, rownames = FALSE) 

FTE Pós-graduação por área:

# FTE pos por area --------------------------------------------------------

# Adicionando a informação da área:

full_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") -> alunos_em_comum_com_area
alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)
#alunos_em_comum_com_area %>% group_by(Area) %>% summarise(n=n())


inner_join(alunos_so_2020.1, dados_alunos_para_WUR_2016, by="curso") -> alunos2020.1_com_area
alunos2020.1_com_area %>% count(Area) -> FTE_pos_area_2020.1
FTE_pos_area_2020.1$n = FTE_pos_area_2020.1$n/2 
#sum(FTE_pos_area_2020.1$n)

inner_join(alunos_so_2020.2, dados_alunos_para_WUR_2016, by="curso") -> alunos2020.2_com_area
alunos2020.2_com_area %>% count(Area) -> FTE_pos_area_2020.2
FTE_pos_area_2020.2$n = FTE_pos_area_2020.2$n/2 
#sum(FTE_pos_area_2020.2$n)


full_join(FTE_pos_area_comum, FTE_pos_area_2020.1, by="Area") %>% full_join(., FTE_pos_area_2020.2, by="Area") %>%
  mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final

tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area

colnames(FTE_pos_area) = c("Area", "2020.1-2020.2", "so_2020.1", "so2020.2", "FTE")

DT::datatable(FTE_pos_area)
sum(FTE_pos_area$FTE)
## [1] 503

PÓS-GRADUAÇÃO: Masculino por área

# Pos Masc por area -------------------------------------------------------

# Adicionando a informação da área:

inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., sexo=="M") -> alunos_em_comum_com_area

alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)

inner_join(alunos_so_2020.1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., sexo=="M") -> alunos2020.1_com_area
alunos2020.1_com_area %>% count(Area) -> FTE_pos_area_2020.1
FTE_pos_area_2020.1$n = FTE_pos_area_2020.1$n/2 
#sum(FTE_pos_area_2020.1$n)

inner_join(alunos_so_2020.2, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., sexo=="M") -> alunos2020.2_com_area
alunos2020.2_com_area %>% count(Area) -> FTE_pos_area_2020.2
FTE_pos_area_2020.2$n = FTE_pos_area_2020.2$n/2 
#sum(FTE_pos_area_2020.2$n)


full_join(FTE_pos_area_comum, FTE_pos_area_2020.1, by="Area") %>% full_join(., FTE_pos_area_2020.2, by="Area") %>%
  mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final

tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_homens

colnames(FTE_pos_area_homens) = c("Area", "2020.1-2020.2", "so_2020.1", "so2020.2", "FTE")

DT::datatable(FTE_pos_area_homens)
sum(FTE_pos_area_homens$FTE)
## [1] 273.5

PÓS-GRADUAÇÃO: Feminino por área

# Pos fem por area --------------------------------------------------------

# Adicionando a informação da área:

inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., sexo=="F") -> alunos_em_comum_com_area

alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)

inner_join(alunos_so_2020.1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., sexo=="F") -> alunos2020.1_com_area
alunos2020.1_com_area %>% count(Area) -> FTE_pos_area_2020.1
FTE_pos_area_2020.1$n = FTE_pos_area_2020.1$n/2 
#sum(FTE_pos_area_2020.1$n)

inner_join(alunos_so_2020.2, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., sexo=="F") -> alunos2020.2_com_area
alunos2020.2_com_area %>% count(Area) -> FTE_pos_area_2020.2
FTE_pos_area_2020.2$n = FTE_pos_area_2020.2$n/2 
#sum(FTE_pos_area_2020.2$n)


full_join(FTE_pos_area_comum, FTE_pos_area_2020.1, by="Area") %>% full_join(., FTE_pos_area_2020.2, by="Area") %>%
  mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final

tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_F

colnames(FTE_pos_area_F) = c("Area", "2020.1-2020.2", "so_2020.1", "so2020.2", "FTE")

DT::datatable(FTE_pos_area_F)
sum(FTE_pos_area_F$FTE)
## [1] 228.5

FTE GERAL (graduação + pós) por área:

# FTE geral por area ------------------------------------------------------

tabela_final_FTE_area = full_join(FTE_pos_area[,c(1,5)], tabela_final_grad_area[,c(1,2)], by="Area")

tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area


FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y)
colnames(FTE_geral_area) = c("Area", "FTE_posGrad", "FTE_Grad", "FTE_Geral")


DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_posGrad', 'FTE_Grad', 'FTE_Geral'), digits=3)
sum(FTE_geral_area$FTE_Geral)
## [1] 6751.274

FTE pós por nível (mestrado e doutorado)

# FTE pos por nivel -------------------------------------------------------

# Mestrado
M_comum = alunos_em_comum_1 %>% filter(., !startsWith(curso, "DOUTORADO")) %>% nrow
# doutorado
D_comum = alunos_em_comum_1 %>% filter(., startsWith(curso, "DOUTORADO")) %>% nrow

# Mestrado
M2020.1 = (alunos_so_2020.1 %>% 
             filter(., !startsWith(curso, "DOUTORADO")) %>% nrow)/2 # só ficou metade do ano, conta como meio aluno equi
# doutorado
D2020.1 = (alunos_so_2020.1 %>% filter(., startsWith(curso, "DOUTORADO")) %>% nrow)/2

# mestrado
M2020.2 = (alunos_so_2020.2 %>% 
             filter(., !startsWith(curso, "DOUTORADO")) %>% nrow)/2
# doutorado
D2020.2 = (alunos_so_2020.2 %>% filter(., startsWith(curso, "DOUTORADO")) %>% nrow)/2

FTE_pos_nivel_pos = data.frame(Mestrado = M_comum + M2020.1 + M2020.2, Doutorado = D_comum + D2020.1 + D2020.2) %>%
  mutate(Total = Mestrado + Doutorado)

DT::datatable(FTE_pos_nivel_pos, rownames = FALSE) 

FTE Mestrado por área

# Adicionando a informação da área:

inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., !startsWith(curso, "DOUTORADO")) -> alunos_em_comum_com_area

alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)

inner_join(alunos_so_2020.1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., !startsWith(curso, "DOUTORADO")) -> alunos2020.1_com_area
alunos2020.1_com_area %>% count(Area) -> FTE_pos_area_2020.1
FTE_pos_area_2020.1$n = FTE_pos_area_2020.1$n/2 
#sum(FTE_pos_area_2020.1$n)

inner_join(alunos_so_2020.2, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., !startsWith(curso, "DOUTORADO")) -> alunos2020.2_com_area
alunos2020.2_com_area %>% count(Area) -> FTE_pos_area_2020.2
FTE_pos_area_2020.2$n = FTE_pos_area_2020.2$n/2 
#sum(FTE_pos_area_2020.2$n)


full_join(FTE_pos_area_comum, FTE_pos_area_2020.1, by="Area") %>% full_join(., FTE_pos_area_2020.2, by="Area") %>%
  mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final

tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_M

colnames(FTE_pos_area_M) = c("Area", "2020.1-2020.2", "so_2020.1", "so2020.2", "FTE")

DT::datatable(FTE_pos_area_M)
sum(FTE_pos_area_M$FTE)
## [1] 409.5

FTE doutorado por área

# FTE doutorado por area --------------------------------------------------

# Adicionando a informação da área:

inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., startsWith(curso, "DOUTORADO")) -> alunos_em_comum_com_area

alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)

inner_join(alunos_so_2020.1, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., startsWith(curso, "DOUTORADO")) -> alunos2020.1_com_area
alunos2020.1_com_area %>% count(Area) -> FTE_pos_area_2020.1
FTE_pos_area_2020.1$n = FTE_pos_area_2020.1$n/2 
#sum(FTE_pos_area_2020.1$n)

inner_join(alunos_so_2020.2, dados_alunos_para_WUR_2016, by="curso") %>% 
  filter(., startsWith(curso, "DOUTORADO")) -> alunos2020.2_com_area
alunos2020.2_com_area %>% count(Area) -> FTE_pos_area_2020.2
FTE_pos_area_2020.2$n = FTE_pos_area_2020.2$n/2 
#sum(FTE_pos_area_2020.2$n)


full_join(FTE_pos_area_comum, FTE_pos_area_2020.1, by="Area") %>% full_join(., FTE_pos_area_2020.2, by="Area") %>%
  mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final

tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_M

colnames(FTE_pos_area_M) = c("Area", "2020.1-2020.2", "so_2020.1", "so2020.2", "FTE")

DT::datatable(FTE_pos_area_M)

FTE GERAL (graduação + pós) por sexo:

# FTE geral (graduacao + pos) por sexo

datatable(tabela_final_grad_sexo$FTE + FTE_pos_sexo[1:2]) %>% formatRound(columns=c('Masculino', 'Feminino'), digits=3) 

FTE geral: Masculino

# FTE geral masc ----------------------------------------------------------

# tabela_final_FTE_area = full_join(tabela_final_grad_area_M[,c(1,2)], FTE_pos_area_M[,c(1,5)], by="Area")
# 
# tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
# tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area
# 
# 
# FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y) 
# colnames(FTE_geral_area) = c("Area", "FTE_Grad", "FTE_posGrad", "FTE_Geral")
# 
# 
# DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_Grad', 'FTE_posGrad', 'FTE_Geral'), digits=3)
# 
# 
# sum(FTE_geral_area$FTE_Geral)


tabela_final_FTE_area = full_join(tabela_final_grad_area_M[,c(1,2)], FTE_pos_area_homens[,c(1,5)], by="Area")

tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area


FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y) 
colnames(FTE_geral_area) = c("Area", "FTE_Grad", "FTE_posGrad", "FTE_Geral")


DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_Grad', 'FTE_posGrad', 'FTE_Geral'), digits=3)
sum(FTE_geral_area$FTE_Geral)
## [1] 3424.377

FTE geral: Feminino

# FTE geral fem -----------------------------------------------------------

tabela_final_FTE_area = full_join(tabela_final_grad_area_F[,c(1,2)], FTE_pos_area_F[,c(1,5)], by="Area")

tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area


FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y) 
colnames(FTE_geral_area) = c("Area", "FTE_Grad", "FTE_posGrad", "FTE_Geral")


DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_Grad', 'FTE_posGrad', 'FTE_Geral'), digits=3) 
sum(FTE_geral_area$FTE_Geral)
## [1] 3325.897

FTE da UFERSA - (graduação + pós)

# FTE da UFERSA (graduacao + pos) -----------------------------------------

sum(tabela_final_grad_sexo$FTE + FTE_pos_sexo[1:2])
## [1] 6750.274

Número de formados

Graduação

# Numero de formados ------------------------------------------------------

# graduacao
graduados <- read_csv("Alunos que colaram grau em cursos de graduação nos semestres 2020.csv", 
                      locale = locale(encoding = "ISO-8859-1"))
#dim(graduados)

pos_graduados <- read_csv("Alunos de mestrado e doutorado que defenderam no ano de 2020.csv", 
                          locale = locale(encoding = "ISO-8859-1"))

pos_graduados$curso <- gsub(",","",pos_graduados$curso)

#dim(pos_graduados)


# Graduacao ---------------------------------------------------------------

# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno", col_types = c("text", "skip", "text")) 


dados_alunos_para_WUR_2016 %>% filter(., !startsWith(curso, "PÓS-GRADUAÇÃO")) %>%
  filter(., !startsWith(curso, "MESTRADO")) %>%
  filter(., !startsWith(curso, "RESIDÊNCIA")) %>%
  filter(., !startsWith(curso, "ESPECIALIZAÇÃO")) -> graduacoes

left_join(graduados, graduacoes, by="curso") -> formados_grad

# todos os que estavam como NA na area eram de BCT:
#formados_grad %>% filter(., is.na(Area)) #%>% View
#formados_grad %>% tidyr::replace_na(list(Area="Engenharia e Tecnologia")) -> formados_grad

formados_grad %>% group_by(Area) %>% summarise(n = n()) -> qt.graduados

DT::datatable(qt.graduados, rownames = FALSE)

Mestrado

# MESTRADO ----------------------------------------------------------------
pos_cursos <- read_excel("./cursos_pos_WUR_2021.xlsx", col_types = c("text","text"))


pos_graduados %>% filter(startsWith(curso, "MESTRADO")) -> formados_mestrado

left_join(formados_mestrado, pos_cursos, by="curso") -> formados_mestrado

# eliminando os sem area (sao do doutorado)
formados_mestrado[complete.cases(formados_mestrado$Area),] -> formados_mestrado

# todos os que estavam como NA na area eram de BCT:

formados_mestrado %>% group_by(Area) %>% summarise(n = n()) -> qt.mestres

DT::datatable(qt.mestres, rownames = FALSE)

Doutorado

# Doutorado ---------------------------------------------------------------

pos_graduados %>% filter(startsWith(curso, "DOUTORADO")) -> formados_doutorado

left_join(formados_doutorado, pos_cursos, by="curso") -> formados_doutorado

formados_doutorado %>% group_by(Area) %>% summarise(n = n()) -> qt.doutores

DT::datatable(qt.doutores, rownames = FALSE)

Total de formados (graduação + pós)

(graduados %>% dim)[1] + (pos_graduados %>% dim)[1]
## [1] 1133

Formados em cursos relativos a água e agricultura

# Graduados em cursos relativos a agua ------------------------------------

# headcount dos alunos em cursos relativos a água (2019.2):
filtro_agua_grad = c("AGRONOMIA", "ECOLOGIA","ENGENHARIA AGRÍCOLA E AMBIENTAL",
                     "ENGENHARIA AMBIENTAL E SANITÁRIA", "ENGENHARIA DE PESCA",
                     "ENGENHARIA FLORESTAL", "MEDICINA VETERINÁRIA")



filtro_agua_pos = c("MESTRADO EM MANEJO DE SOLO E ÁGUA", "MESTRADO EM PRODUÇÃO ANIMAL",
                    "MESTRADO EM FITOTECNIA", "MESTRADO EM CIÊNCIA ANIMAL", 
                    "DOUTORADO EM MANEJO DE SOLO E ÁGUA",
                    "DOUTORADO EM AGRONOMIA / FITOTECNIA", "DOUTORADO EM CIÊNCIA ANIMAL",
                    "MESTRADO EM ECOLOGIA E CONSERVAÇÃO") 

(graduados %>% filter(curso %in% filtro_agua_grad) %>% dim)[1] +
(pos_graduados %>% filter(curso %in% filtro_agua_pos) %>% dim)[1]
## [1] 186

Formados em licenciaturas

This is the headcount number of graduates at all levels from your institution who gained a qualification that entitled them to teach at primary school level, referring to year 2019.

Incluídos os cursos de Letras/ Libras, Letras/Inglês, Computação e Informática, Computação (EAD).

# Graduados em LICENCIATURAS ------------------------------------

# headcount dos alunos em cursos relativos a água (2020.2):
filtro_lic_grad = c("LETRAS/INGLÊS", "LETRAS / LIBRAS", "MATEMÁTICA", "COMPUTAÇÃO",
                    "COMPUTAÇÃO E INFORMÁTICA")

(graduados %>% filter(curso %in% filtro_agua_grad) %>% dim)[1] 
## [1] 88

Proporção de graduados do sexo feminino STEM, Medicine and Arts/humanities/social sciences

# Graduados por area ------------------------------------------------------

# headcount
# 1: STEM - Ciência, Tecnologia, Engenharias e Matematica

filtro_STEM = c("BIOTECNOLOGIA", "CIÊNCIA DA COMPUTAÇÃO", "COMPUTAÇÃO", 
                "COMPUTAÇÃO E INFORMÁTICA",                              
                "ENGENHARIA AGRÍCOLA E AMBIENTAL", "ENGENHARIA AMBIENTAL E SANITÁRIA", 
                "ENGENHARIA CIVIL",                            
                "ENGENHARIA DE COMPUTAÇÃO", "ENGENHARIA DE PESCA", "ENGENHARIA DE PETRÓLEO",                       
                "ENGENHARIA DE PRODUÇÃO","ENGENHARIA ELÉTRICA","ENGENHARIA FLORESTAL",                        
                "ENGENHARIA MECÂNICA","ENGENHARIA QUÍMICA",
                "INTERDISCIPLINAR EM CIÊNCIA E TECNOLOGIA",     
                "INTERDISCIPLINAR EM CIÊNCIA E TECNOLOGIA.",
                "INTERDISCIPLINAR EM TECNOLOGIA DA INFORMAÇÃO",
                "MATEMÁTICA","SISTEMAS DE INFORMAÇÃO")

filtro_STEM_pos = c("MESTRADO EM CIÊNCIA DA COMPUTAÇÃO",                 
                    "MESTRADO EM CIÊNCIA E ENGENHARIA DE MATERIAIS",     
                    "MESTRADO EM ENGENHARIA ELÉTRICA",                   
                    "MESTRADO EM ENSINO DE FÍSICA",                      
                    "MESTRADO PROFISSIONAL EM MATEMÁTICA")               

(graduados %>% filter(curso %in% filtro_STEM) %>% dim)[1] +
(pos_graduados %>% filter(curso %in% filtro_STEM_pos) %>% dim)[1]
## [1] 724
# feminino
graduados %>% filter(curso %in% filtro_STEM & sexo == "F") %>% nrow +
pos_graduados %>% filter(curso %in% filtro_STEM_pos & sexo == "F") %>% nrow
## [1] 243
# 2: Medicine

# ainda não temos formados neste curso.

# 3: Artes e humanidades/ciencias sociais

# headcount
filtro_humanidades_grad = c("ADMINISTRAÇÃO","CIÊNCIAS CONTÁBEIS","DIREITO",
                            "LETRAS/INGLÊS","LETRAS / LIBRAS")                             


filtro_humanidades_pos = c("MESTRADO EM ADMINISTRAÇÃO PÚBLICA EM REDE NACIONAL",
                           "MESTRADO EM COGNIÇÃO TECNOLOGIAS E INSTITUIÇÕES",
                           "MESTRADO EM ENSINO",
                           "MESTRADO EM AMBIENTE TECNOLOGIA E SOCIEDADE")       

(graduados %>% filter(curso %in% filtro_humanidades_grad) %>% dim)[1] +
  (pos_graduados %>% filter(curso %in% filtro_humanidades_pos) %>% dim)[1]
## [1] 210
# feminino
graduados %>% filter(curso %in% filtro_humanidades_grad & sexo == "F") %>% nrow +
  pos_graduados %>% filter(curso %in% filtro_humanidades_pos & sexo == "F") %>% nrow 
## [1] 142

Percentual de ingressantes de primeira geração

Aqui, utilizamos a pesquisa realizada via SIGAA para estimar o total de ingressantes que são os primeiros de sua família próxima a iniciar um curso superior. Consideramos os alunos de graduação.

# Estudantes de primeira geracao ------------------------------------------

# Numero de estudantes que sao os primeiros da 
# familia a cursar o ensino superior, 
# segundo a pesquisa feita no SIGAA

questionario_tratado <- read_excel("./questionario (11).xlsx")
#View(questionario_tratado)

# questionario respondido por 5010 alunos
questionario_tratado %>% 
  mutate(resposta_dummy = ifelse(primeiro == "Sim", 1, 0)) -> questionario


# Number of first-generation students starting a degree 

questionario %>% filter(nivel=="Graduação") %>% 
  group_by(primeiro) %>% summarise(n=n()) %>% 
  mutate(percentual = n / sum(n)) -> percentual_quest

# extrapolando o resultado, 39.5 % dos ingressantes sao os primeiros da familia:
# 1229.329 * 0.395
1229.329 * 0.395
## [1] 485.585
# Percentual de mulheres na graduacao que responderam sim a pergunta:

questionario %>% filter(nivel=="Graduação") %>% 
  group_by(primeiro, sexo) %>% summarise(n=n()) %>% 
  mutate(percentual = n / sum(n)) %>% 
  filter(primeiro == "Sim" & sexo=="Feminino") -> percentual_quest_fem

percentual_quest_fem$percentual * (FTE_ingressantes_por_sexo %>% filter(sexo=="F"))$FTE_TOTAL
## [1] 236.9266