library(dplyr)
library(readxl)
library(readr)
library(DT)
setwd("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/")
# Abrir carga horária média por curso:
carga_horaria_cursos_graduacao_ufersa <- read_excel("cargahorariacursosgraduacaoUfersaprograd.xlsx",
col_types = c("skip", "text", "skip",
"text", "skip", "skip", "skip",
"skip", "skip", "skip", "skip",
"numeric"))
colnames(carga_horaria_cursos_graduacao_ufersa) <- c("curso","campus","CH_media")
# Abrir conjunto de dados dos alunos 2018.1
alunos2018.1 <- read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20181.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
#alunos2018.1 = alunos2018.1[!(startsWith(alunos2018.1$curso, "MESTRADO") | startsWith(alunos2018.1$curso, "DOUTORADO")), ]
# Abrir conjunto de dados dos alunos 2018.2
alunos2018.2 <- read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20182.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>% tidyr::drop_na("carga_horaria_total")
#alunos2018.2 = alunos2018.2[!(startsWith(alunos2018.1$curso, "MESTRADO") | startsWith(alunos2018.1$curso, "DOUTORADO")), ]
# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno", col_types = c("text", "skip", "text"))
# Pegando cada curso e tirando a média (independente de turno e campus)
carga_horaria_cursos_graduacao_ufersa %>%
group_by(curso) %>%
summarise(., CH_media = mean(CH_media)) -> carga_horaria_cursos_graduacao_ufersa
# INNER JOIN
inner_join(alunos2018.1, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2018.1
# INNER JOIN
inner_join(alunos2018.2, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2018.2
# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2018.1$matricula, alunos2018.2$matricula)
# Dados destes alunos no semestre 1:
alunos2018.1 %>% filter(., alunos2018.1$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_1
# Dados destes alunos no semestre 2:
alunos2018.2 %>% filter(., alunos2018.2$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_2
alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$matricula,
curso = alunos_em_comum_1$curso,
carga_horaria_total = alunos_em_comum_1$carga_horaria_total +
alunos_em_comum_2$carga_horaria_total,
CH_media = alunos_em_comum_1$CH_media,
Area = alunos_em_comum_1$Area)
alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
alunos_em_comum_total
# Por área de conhecimento ------------------------------------------------
FTE_Area <- function(alunos, Areas_THE){
tabela_por_Area = data.frame(Area = NA, FTE = NA, Matriculados = NA)
for(i in 1:length(Areas_THE)){
alunos_Area = alunos %>% filter(., Area == Areas_THE[i])
tabela_por_Area %>% rbind(., data.frame(Area = Areas_THE[i],
Matriculados = nrow(alunos_Area),
FTE = sum(alunos_Area$FTE_individual))) -> tabela_por_Area
}
return(tabela_por_Area[-1, ])
}
# <1> Alunos que cursaram os dois semestres:
alunos_em_comum_total$Area %>% unique -> Areas_THE
#alunos_em_comum_total$FTE_individual[is.na(alunos_em_comum_total$FTE_individual)] <- 0
tabela_por_Area = FTE_Area(alunos_em_comum_total, Areas_THE)
# <2> Alunos matriculados apenas em 2018.1:
alunos2018.1 %>% filter(., !(alunos2018.1$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Area(., Areas_THE) -> tabela_por_Area2018.1
# <3> Alunos matriculados apenas em 2018.2:
alunos2018.2 %>% filter(., !(alunos2018.2$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Area(., Areas_THE) -> tabela_por_Area2018.2
#print(tabela_por_Area2018.1$Matriculados %>% sum)
#print(tabela_por_Area2018.2$Matriculados %>% sum)
# Total
cbind(Area = tabela_por_Area$Area, tabela_por_Area[ ,2:3] +
tabela_por_Area2018.1[ ,2:3] +
tabela_por_Area2018.2[ ,2:3]) -> tabela_final_grad_area
tabela_final_grad_area %>%
datatable(., rownames = FALSE) %>%
formatRound(columns=c('Matriculados', 'FTE'), digits=3) ## FTE Matriculados
## 7444.617 9886.000
# FTE por sexo ------------------------------------------------------------
alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$matricula,
curso = alunos_em_comum_1$curso,
carga_horaria_total = alunos_em_comum_1$carga_horaria_total +
alunos_em_comum_2$carga_horaria_total,
CH_media = alunos_em_comum_1$CH_media,
Area = alunos_em_comum_1$Area,
sexo = alunos_em_comum_1$sexo)
alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
alunos_em_comum_total
# Por área de sexo
sexos_FTE = c("M", "F")
FTE_Sexo <- function(alunos, sexos_THE){
tabela_por_Sexo = data.frame(sexo = NA, FTE = NA, Matriculados = NA)
for(i in 1:length(sexos_THE)){
alunos_sexo = alunos %>% filter(., sexo == sexos_THE[i])
tabela_por_Sexo %>% rbind(., data.frame(sexo = sexos_THE[i],
Matriculados = nrow(alunos_sexo),
FTE = sum(alunos_sexo$FTE_individual))) -> tabela_por_Sexo
}
return(tabela_por_Sexo[-1, ])
}
# <1> Alunos que cursaram os dois semestres:
alunos_em_comum_total$sexo %>% unique -> sexos_THE
tabela_por_Sexo = FTE_Sexo(alunos_em_comum_total, sexos_THE)
# <2> Alunos matriculados apenas em 2018.1:
alunos2018.1 %>% filter(., !(alunos2018.1$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Sexo(., sexos_THE) -> tabela_por_Sexo2018.1
# <3> Alunos matriculados apenas em 2018.2:
alunos2018.2 %>% filter(., !(alunos2018.2$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Sexo(., sexos_THE) -> tabela_por_Sexo2018.2
# Total
cbind(Sexo = tabela_por_Sexo$sexo, tabela_por_Sexo[ ,2:3] +
tabela_por_Sexo2018.1[ ,2:3] +
tabela_por_Sexo2018.2[ ,2:3]) -> tabela_final_grad_sexo
tabela_final_grad_sexo %>%
datatable(., rownames = FALSE) %>%
formatRound(columns=c('Matriculados', 'FTE'), digits=3) ## FTE Matriculados
## 7444.617 9886.000
# FTE masc. grad. area ----------------------------------------------------
# Abrir conjunto de dados dos alunos 2018.1
alunos2018.1 = read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20181.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
alunos2018.1 %>% filter(., sexo=="M") -> alunos2018.1
# Abrir conjunto de dados dos alunos 2018.2
alunos2018.2 = read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20182.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
alunos2018.2 %>% filter(., sexo=="M") -> alunos2018.2
# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno",
col_types = c("text", "skip", "text"))
# Pegando cada curso e tirando a média (independente de turno e campus)
carga_horaria_cursos_graduacao_ufersa %>%
group_by(curso) %>%
summarise(., CH_media = mean(CH_media)) -> carga_horaria_cursos_graduacao_ufersa
# INNER JOIN
inner_join(alunos2018.1, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2018.1
# INNER JOIN
inner_join(alunos2018.2, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2018.2
# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2018.1$matricula, alunos2018.2$matricula)
# Dados destes alunos no semestre 1:
alunos2018.1 %>% filter(., alunos2018.1$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_1
# Dados destes alunos no semestre 2:
alunos2018.2 %>% filter(., alunos2018.2$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_2
alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$matricula,
curso = alunos_em_comum_1$curso,
carga_horaria_total = alunos_em_comum_1$carga_horaria_total +
alunos_em_comum_2$carga_horaria_total,
CH_media = alunos_em_comum_1$CH_media,
Area = alunos_em_comum_1$Area)
alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
alunos_em_comum_total
# Por área de conhecimento
FTE_Area <- function(alunos, Areas_THE){
tabela_por_Area = data.frame(Area = NA, FTE = NA, Matriculados = NA)
for(i in 1:length(Areas_THE)){
alunos_Area = alunos %>% filter(., Area == Areas_THE[i])
tabela_por_Area %>% rbind(., data.frame(Area = Areas_THE[i],
Matriculados = nrow(alunos_Area),
FTE = sum(alunos_Area$FTE_individual))) -> tabela_por_Area
}
return(tabela_por_Area[-1, ])
}
# <1> Alunos que cursaram os dois semestres:
alunos_em_comum_total$Area %>% unique -> Areas_THE
tabela_por_Area = FTE_Area(alunos_em_comum_total, Areas_THE)
#print(tabela_por_Area$Matriculados %>% sum)
# <2> Alunos matriculados apenas em 2018.1:
alunos2018.1 %>% filter(., !(alunos2018.1$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Area(., Areas_THE) -> tabela_por_Area2018.1
#print(tabela_por_Area2018.1$Matriculados %>% sum)
# <3> Alunos matriculados apenas em 2018.2:
alunos2018.2 %>% filter(., !(alunos2018.2$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Area(., Areas_THE) -> tabela_por_Area2018.2
#print(tabela_por_Area2018.2$Matriculados %>% sum)
# Total
cbind(Area = tabela_por_Area$Area, tabela_por_Area[ ,2:3] +
tabela_por_Area2018.1[ ,2:3] +
tabela_por_Area2018.2[ ,2:3]) -> tabela_final_grad_area_M
tabela_final_grad_area_M %>%
datatable(., rownames = FALSE) %>%
formatRound(columns=c('Matriculados', 'FTE'), digits=3) ## FTE Matriculados
## 4316.505 5775.000
# FTE fem. grad. area -----------------------------------------------------
# Abrir conjunto de dados dos alunos 2018.1
alunos2018.1 = read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20181.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
alunos2018.1 %>% filter(., sexo=="F") -> alunos2018.1
# Abrir conjunto de dados dos alunos 2018.2
alunos2018.2 = read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20182.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
alunos2018.2 %>% filter(., sexo=="F") -> alunos2018.2
# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno",
col_types = c("text", "skip", "text"))
# Pegando cada curso e tirando a média (independente de turno e campus)
carga_horaria_cursos_graduacao_ufersa %>%
group_by(curso) %>%
summarise(., CH_media = mean(CH_media)) -> carga_horaria_cursos_graduacao_ufersa
# INNER JOIN
inner_join(alunos2018.1, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2018.1
# INNER JOIN
inner_join(alunos2018.2, carga_horaria_cursos_graduacao_ufersa, by="curso") %>%
inner_join(., dados_alunos_para_WUR_2016, by="curso") -> alunos2018.2
# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2018.1$matricula, alunos2018.2$matricula)
# Dados destes alunos no semestre 1:
alunos2018.1 %>% filter(., alunos2018.1$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_1
# Dados destes alunos no semestre 2:
alunos2018.2 %>% filter(., alunos2018.2$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_2
alunos_em_comum_total = data.frame(matricula = alunos_em_comum_1$matricula,
curso = alunos_em_comum_1$curso,
carga_horaria_total = alunos_em_comum_1$carga_horaria_total +
alunos_em_comum_2$carga_horaria_total,
CH_media = alunos_em_comum_1$CH_media,
Area = alunos_em_comum_1$Area)
alunos_em_comum_total %>% mutate(., FTE_individual = carga_horaria_total/(2*CH_media)) ->
alunos_em_comum_total
# Por área de conhecimento
FTE_Area <- function(alunos, Areas_THE){
tabela_por_Area = data.frame(Area = NA, FTE = NA, Matriculados = NA)
for(i in 1:length(Areas_THE)){
alunos_Area = alunos %>% filter(., Area == Areas_THE[i])
tabela_por_Area %>% rbind(., data.frame(Area = Areas_THE[i],
Matriculados = nrow(alunos_Area),
FTE = sum(alunos_Area$FTE_individual))) -> tabela_por_Area
}
return(tabela_por_Area[-1, ])
}
# <1> Alunos que cursaram os dois semestres:
alunos_em_comum_total$Area %>% unique -> Areas_THE
tabela_por_Area = FTE_Area(alunos_em_comum_total, Areas_THE)
#print(tabela_por_Area$Matriculados %>% sum)
# <2> Alunos matriculados apenas em 2018.1:
alunos2018.1 %>% filter(., !(alunos2018.1$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(.,FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Area(., Areas_THE) -> tabela_por_Area2018.1
#print(tabela_por_Area2018.1$Matriculados %>% sum)
# <3> Alunos matriculados apenas em 2018.2:
alunos2018.2 %>% filter(., !(alunos2018.2$matricula %in% alunos_em_comum)) %>%
arrange(., nome) %>% mutate(., FTE_individual=carga_horaria_total/(2*CH_media)) %>%
FTE_Area(., Areas_THE) -> tabela_por_Area2018.2
#print(tabela_por_Area2018.2$Matriculados %>% sum)
# Total
cbind(Area = tabela_por_Area$Area, tabela_por_Area[ ,2:3] +
tabela_por_Area2018.1[ ,2:3] +
tabela_por_Area2018.2[ ,2:3]) -> tabela_final_grad_area_F
tabela_final_grad_area_F %>%
datatable(., rownames = FALSE) %>%
formatRound(columns=c('Matriculados', 'FTE'), digits=3) ## FTE Matriculados
## 3128.112 4111.000
# FTE pos por sexo --------------------------------------------------------
# Abrir conjunto de dados dos alunos 2018.1
alunos2018.1 = read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20181.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
mestrado2018.1 = alunos2018.1[startsWith(alunos2018.1$curso, "MESTRADO"), ]
doutorado2018.1 = alunos2018.1[startsWith(alunos2018.1$curso, "DOUTORADO"), ]
alunos2018.1 = rbind(mestrado2018.1, doutorado2018.1)
# Abrir conjunto de dados dos alunos 2018.2
alunos2018.2 = read.csv("C:/Users/geisa.vasconcelos/workspace/trabalho/THE_rankings/Ranking2020/Alunos20182.csv",
sep=";", header=TRUE, encoding = "UTF-8", stringsAsFactors = FALSE) %>%
tidyr::drop_na("carga_horaria_total")
mestrado2018.2 = alunos2018.2[startsWith(alunos2018.2$curso, "MESTRADO"), ]
doutorado2018.2 = alunos2018.2[startsWith(alunos2018.2$curso, "DOUTORADO"), ]
alunos2018.2 = rbind(mestrado2018.2, doutorado2018.2)
# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("cursos_pos_WUR.xlsx", col_types = c("text","text"))
# Conjunto dos alunos que estudaram o primeiro e segundo semestres:
alunos_em_comum = intersect(alunos2018.1$matricula, alunos2018.2$matricula)
# Dados destes alunos no semestre 1:
alunos2018.1 %>% filter(., alunos2018.1$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_1
# Dados destes alunos no semestre 2:
alunos2018.2 %>% filter(., alunos2018.2$matricula %in% alunos_em_comum) %>%
arrange(., nome) -> alunos_em_comum_2
# Total de alunos nos dois semestres:
# Alunos somente em 2018.1
alunos_so_2018.1 = alunos2018.1 %>%
filter(., !(alunos2018.1$matricula %in% alunos_em_comum)) %>% arrange(., nome)
# Alunos somente em 2018.2
alunos_so_2018.2 = alunos2018.2 %>%
filter(., !(alunos2018.2$matricula %in% alunos_em_comum)) %>% arrange(., nome)
# Masculino
M_comum = alunos_em_comum_1 %>% filter(., sexo=="M") %>% nrow
# Feminino
F_comum = alunos_em_comum_1 %>% filter(., sexo=="F") %>% nrow
# Masculino
M2018.1 = (alunos_so_2018.1 %>% filter(., sexo=="M") %>% nrow)/2
# Feminino
F2018.1 = (alunos_so_2018.1 %>% filter(., sexo=="F") %>% nrow)/2
# Masculino
M2018.2 = (alunos_so_2018.2 %>% filter(., sexo=="M") %>% nrow)/2
# Feminino
F2018.2 = (alunos_so_2018.2 %>% filter(., sexo=="F") %>% nrow)/2
FTE_pos_sexo = data.frame(Masculino = M_comum + M2018.1 + M2018.2, Feminino = F_comum + F2018.1 + F2018.2) %>%
mutate(Total = Masculino + Feminino)
DT::datatable(FTE_pos_sexo, rownames = FALSE) # FTE pos por area --------------------------------------------------------
# Adicionando a informação da área:
inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") -> alunos_em_comum_com_area
alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)
inner_join(alunos_so_2018.1, dados_alunos_para_WUR_2016, by="curso") -> alunos2018.1_com_area
alunos2018.1_com_area %>% count(Area) -> FTE_pos_area_2018.1
FTE_pos_area_2018.1$n = FTE_pos_area_2018.1$n/2
#sum(FTE_pos_area_2018.1$n)
inner_join(alunos_so_2018.2, dados_alunos_para_WUR_2016, by="curso") -> alunos2018.2_com_area
alunos2018.2_com_area %>% count(Area) -> FTE_pos_area_2018.2
FTE_pos_area_2018.2$n = FTE_pos_area_2018.2$n/2
#sum(FTE_pos_area_2018.2$n)
left_join(FTE_pos_area_comum, FTE_pos_area_2018.1, by="Area") %>% left_join(., FTE_pos_area_2018.2, by="Area") %>%
mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final
tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area
colnames(FTE_pos_area) = c("Area", "2018.1-2018.2", "so_2018.1", "so2018.2", "FTE")
DT::datatable(FTE_pos_area)## [1] 563
# Pos Masc por area -------------------------------------------------------
# Adicionando a informação da área:
inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., sexo=="M") -> alunos_em_comum_com_area
alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)
inner_join(alunos_so_2018.1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., sexo=="M") -> alunos2018.1_com_area
alunos2018.1_com_area %>% count(Area) -> FTE_pos_area_2018.1
FTE_pos_area_2018.1$n = FTE_pos_area_2018.1$n/2
#sum(FTE_pos_area_2018.1$n)
inner_join(alunos_so_2018.2, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., sexo=="M") -> alunos2018.2_com_area
alunos2018.2_com_area %>% count(Area) -> FTE_pos_area_2018.2
FTE_pos_area_2018.2$n = FTE_pos_area_2018.2$n/2
#sum(FTE_pos_area_2018.2$n)
left_join(FTE_pos_area_comum, FTE_pos_area_2018.1, by="Area") %>% left_join(., FTE_pos_area_2018.2, by="Area") %>%
mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final
tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_M
colnames(FTE_pos_area_M) = c("Area", "2018.1-2018.2", "so_2018.1", "so2018.2", "FTE")
DT::datatable(FTE_pos_area_M)## [1] 327
# Pos fem por area --------------------------------------------------------
# Adicionando a informação da área:
inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., sexo=="F") -> alunos_em_comum_com_area
alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)
inner_join(alunos_so_2018.1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., sexo=="F") -> alunos2018.1_com_area
alunos2018.1_com_area %>% count(Area) -> FTE_pos_area_2018.1
FTE_pos_area_2018.1$n = FTE_pos_area_2018.1$n/2
#sum(FTE_pos_area_2018.1$n)
inner_join(alunos_so_2018.2, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., sexo=="F") -> alunos2018.2_com_area
alunos2018.2_com_area %>% count(Area) -> FTE_pos_area_2018.2
FTE_pos_area_2018.2$n = FTE_pos_area_2018.2$n/2
#sum(FTE_pos_area_2018.2$n)
full_join(FTE_pos_area_comum, FTE_pos_area_2018.1, by="Area") %>% full_join(., FTE_pos_area_2018.2, by="Area") %>%
mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final
tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_F
colnames(FTE_pos_area_F) = c("Area", "2018.1-2018.2", "so_2018.1", "so2018.2", "FTE")
DT::datatable(FTE_pos_area_F)## [1] 236
# FTE geral por area ------------------------------------------------------
tabela_final_FTE_area = full_join(FTE_pos_area[,c(1,5)], tabela_final_grad_area[,c(1,2)], by="Area")
tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area
FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y)
colnames(FTE_geral_area) = c("Area", "FTE_Grad", "FTE_posGrad", "FTE_Geral")
DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_posGrad', 'FTE_Grad', 'FTE_Geral'), digits=3)## [1] 8007.617
# Masculino
M_comum = alunos_em_comum_1 %>% filter(., startsWith(curso, "MESTRADO")) %>% nrow
# Feminino
D_comum = alunos_em_comum_1 %>% filter(., startsWith(curso, "DOUTORADO")) %>% nrow
# Masculino
M2018.1 = (alunos_so_2018.1 %>% filter(., startsWith(curso, "MESTRADO")) %>% nrow)/2 # só ficou metade do ano, conta como meio aluno equi
# Feminino
D2018.1 = (alunos_so_2018.1 %>% filter(., startsWith(curso, "DOUTORADO")) %>% nrow)/2
# Masculino
M2018.2 = (alunos_so_2018.2 %>% filter(., startsWith(curso, "MESTRADO")) %>% nrow)/2
# Feminino
D2018.2 = (alunos_so_2018.2 %>% filter(., startsWith(curso, "DOUTORADO")) %>% nrow)/2
FTE_pos_nivel_pos = data.frame(Mestrado = M_comum + M2018.1 + M2018.2, Doutorado = D_comum + D2018.1 + D2018.2) %>%
mutate(Total = Mestrado + Doutorado)
DT::datatable(FTE_pos_nivel_pos, rownames = FALSE) # Adicionando a informação da área:
inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., startsWith(curso, "MESTRADO")) -> alunos_em_comum_com_area
alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)
inner_join(alunos_so_2018.1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., startsWith(curso, "MESTRADO")) -> alunos2018.1_com_area
alunos2018.1_com_area %>% count(Area) -> FTE_pos_area_2018.1
FTE_pos_area_2018.1$n = FTE_pos_area_2018.1$n/2
#sum(FTE_pos_area_2018.1$n)
inner_join(alunos_so_2018.2, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., startsWith(curso, "MESTRADO")) -> alunos2018.2_com_area
alunos2018.2_com_area %>% count(Area) -> FTE_pos_area_2018.2
FTE_pos_area_2018.2$n = FTE_pos_area_2018.2$n/2
#sum(FTE_pos_area_2018.2$n)
left_join(FTE_pos_area_comum, FTE_pos_area_2018.1, by="Area") %>% left_join(., FTE_pos_area_2018.2, by="Area") %>%
mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final
tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_M
colnames(FTE_pos_area_M) = c("Area", "2018.1-2018.2", "so_2018.1", "so2018.2", "FTE")
DT::datatable(FTE_pos_area_M)## [1] 420.5
# Adicionando a informação da área:
inner_join(alunos_em_comum_1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., startsWith(curso, "DOUTORADO")) -> alunos_em_comum_com_area
alunos_em_comum_com_area %>% count(Area) -> FTE_pos_area_comum
#sum(FTE_pos_area_comum$n)
inner_join(alunos_so_2018.1, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., startsWith(curso, "DOUTORADO")) -> alunos2018.1_com_area
alunos2018.1_com_area %>% count(Area) -> FTE_pos_area_2018.1
FTE_pos_area_2018.1$n = FTE_pos_area_2018.1$n/2
#sum(FTE_pos_area_2018.1$n)
inner_join(alunos_so_2018.2, dados_alunos_para_WUR_2016, by="curso") %>%
filter(., startsWith(curso, "DOUTORADO")) -> alunos2018.2_com_area
alunos2018.2_com_area %>% count(Area) -> FTE_pos_area_2018.2
FTE_pos_area_2018.2$n = FTE_pos_area_2018.2$n/2
#sum(FTE_pos_area_2018.2$n)
left_join(FTE_pos_area_comum, FTE_pos_area_2018.1, by="Area") %>% left_join(., FTE_pos_area_2018.2, by="Area") %>%
mutate(FTE = rowSums(select(., n.x:n), na.rm=TRUE)) -> tabela_final
tabela_final[is.na(tabela_final)] <- 0
tabela_final %>% as.data.frame() -> FTE_pos_area_M
colnames(FTE_pos_area_M) = c("Area", "2018.1-2018.2", "so_2018.1", "so2018.2", "FTE")
DT::datatable(FTE_pos_area_M)# FTE geral masc ----------------------------------------------------------
tabela_final_FTE_area = full_join(tabela_final_grad_area_M[,c(1,2)], FTE_pos_area_M[,c(1,5)], by="Area")
tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area
FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y)
colnames(FTE_geral_area) = c("Area", "FTE_Grad", "FTE_posGrad", "FTE_Geral")
DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_Grad', 'FTE_posGrad', 'FTE_Geral'), digits=3) ## [1] 4459.005
# FTE geral fem -----------------------------------------------------------
tabela_final_FTE_area = full_join(tabela_final_grad_area_F[,c(1,2)], FTE_pos_area_F[,c(1,5)], by="Area")
tabela_final_FTE_area[is.na(tabela_final_FTE_area)] <- 0
tabela_final_FTE_area %>% as.data.frame() -> FTE_geral_area
FTE_geral_area = FTE_geral_area %>% mutate(FTE_total_area = FTE.x + FTE.y)
colnames(FTE_geral_area) = c("Area", "FTE_Grad", "FTE_posGrad", "FTE_Geral")
DT::datatable(FTE_geral_area, rownames=FALSE) %>% formatRound(columns=c('FTE_Grad', 'FTE_posGrad', 'FTE_Geral'), digits=3) ## [1] 3364.112
## [1] 8007.617
## [1] 1191 7
pos_graduados <- read_excel("graduados 2018 (Impact Ranking 2020).xlsx",
sheet = "defesa pg 2018")
# Graduacao ---------------------------------------------------------------
# Abrir áreas dos cursos
dados_alunos_para_WUR_2016 <- read_excel("dados alunos para WUR 2016.xlsx", sheet = "area_turno", col_types = c("text", "skip", "text"))
dados_alunos_para_WUR_2016 %>% filter(., !startsWith(curso, "PÓS-GRADUAÇÃO")) %>%
filter(., !startsWith(curso, "MESTRADO")) %>%
filter(., !startsWith(curso, "RESIDÊNCIA")) %>%
filter(., !startsWith(curso, "ESPECIALIZAÇÃO")) -> graduacoes
left_join(graduados, graduacoes, by="curso") -> formados_grad
# todos os que estavam como NA na area eram de BCT:
#formados_grad %>% filter(., is.na(Area)) #%>% View
formados_grad %>% tidyr::replace_na(list(Area="Engenharia e Tecnologia")) -> formados_grad
formados_grad %>% group_by(Area) %>% summarise(n = n()) -> qt.graduados
DT::datatable(qt.graduados, rownames = FALSE)# MESTRADO ----------------------------------------------------------------
pos_cursos <- read_excel("cursos_pos_WUR.xlsx", col_types = c("text","text"))
pos_graduados %>% filter(startsWith(curso, "MESTRADO")) -> formados_mestrado
left_join(formados_mestrado, pos_cursos, by="curso") -> formados_mestrado
# eliminando os sem area (sao do doutorado)
formados_mestrado[complete.cases(formados_mestrado$Area),] -> formados_mestrado
# todos os que estavam como NA na area eram de BCT:
formados_mestrado %>% group_by(Area) %>% summarise(n = n()) -> qt.mestres
DT::datatable(qt.mestres, rownames = FALSE)# Doutorado ---------------------------------------------------------------
pos_graduados %>% filter(startsWith(curso, "DOUTORADO")) -> formados_doutorado
left_join(formados_doutorado, pos_cursos, by="curso") -> formados_doutorado
formados_doutorado %>% group_by(Area) %>% summarise(n = n()) -> qt.doutores
DT::datatable(qt.doutores, rownames = FALSE)Desenvolvido por Kássio Camelo
kassio.silva@ufersa.edu.br