library(readr)
library(dplyr)
Base3 <- read_delim("D:/UFPE/2018.1/Estatistica_Computacional/DADOS/DM_DOCENTE.CSV",
"|",
escape_double = FALSE,
col_types = cols(CO_CATEGORIA_ADMINISTRATIVA = col_character(),
CO_DOCENTE = col_character(),
CO_DOCENTE_IES = col_character(),
CO_ESCOLARIDADE_DOCENTE = col_character(),
CO_MUNICIPIO_NASCIMENTO = col_character(),
CO_NACIONALIDADE_DOCENTE = col_character(),
CO_ORGANIZACAO_ACADEMICA = col_character(),
CO_PAIS_DOCENTE = col_character(),
CO_SITUACAO_DOCENTE = col_character(),
CO_UF_NASCIMENTO = col_character()),
locale = locale(encoding = "ISO-8859-1"),
trim_ws = TRUE)
base5perc <- Base3 %>% sample_frac(size=0.05)
categoria_quantidade <- data.frame(table(base5perc$DS_CATEGORIA_ADMINISTRATIVA))
porcentagem <- (categoria_quantidade[2]/dim(base5perc)[1])*100
tab <- data.frame(categoria_quantidade, porcentagem)
colnames(tab) <- c("Categoria", "Quantidade", "Porcentagem")
library(knitr)
kable(tab)
| Categoria | Quantidade | Porcentagem |
|---|---|---|
| Especial | 254 | 1.2776017 |
| Privada com fins lucrativos | 4740 | 23.8418591 |
| Privada sem fins lucrativos | 6190 | 31.1352548 |
| Pública Estadual | 2699 | 13.5757759 |
| Pública Federal | 5848 | 29.4150194 |
| Pública Municipal | 150 | 0.7544892 |
library(ggplot2)
p<-ggplot(data=tab, aes(x=tab$Categoria, y=tab$Quantidade)) +
geom_bar(stat="identity", fill="steelblue") +
theme_minimal() +
ggtitle("Grafico de barra Categoria versus Quantidade") +
ylab("Quantidade") + xlab("Categoria")
plot(p + coord_flip())
AULA DIA 19/03
Primeiramente, criamos uma tabela de busca relacionado ao estado de Pernambuco (UF = 26).
library(stringr)
library(DT)
## Warning: package 'DT' was built under R version 3.4.4
pernambuco <- base5perc %>%
select(NO_IES, DS_CATEGORIA_ADMINISTRATIVA, CO_MUNICIPIO_NASCIMENTO) %>%
transmute(Nome = NO_IES,
Categoria = DS_CATEGORIA_ADMINISTRATIVA,
Codigo = as.character(CO_MUNICIPIO_NASCIMENTO)) %>%
mutate (UF = str_sub(string = Codigo, start=1, end=2)) %>%
group_by(UF, Categoria) %>%
summarise(n = n()) %>%
mutate(freq = n/sum(n)) %>%
#count() %>%
filter(UF == "26") %>%
arrange(desc(n))%>%
mutate(Categoria = factor(Categoria, levels = Categoria))
pernambuco %>% datatable()
pernambuco %>%
ggplot(aes(x = reorder(Categoria, n), y= n, fill= Categoria)) +
geom_bar(stat = "identity") +
guides(fill = "none") +
coord_flip() +
labs(x = "Categoria", y = "Total", title = "Numero de instituicoes por categoria", subtitle = "Estado de Pernambuco") +
geom_label(aes(label = paste(round(100*freq), "%", sep = ""))) +
scale_fill_brewer(palette = "BuGn",direction = -1)
PE_PB <- base5perc %>%
select(NO_IES, DS_CATEGORIA_ADMINISTRATIVA, CO_MUNICIPIO_NASCIMENTO) %>%
transmute(Nome = NO_IES,
Categoria = DS_CATEGORIA_ADMINISTRATIVA,
Codigo = as.character(CO_MUNICIPIO_NASCIMENTO)) %>%
mutate (UF = str_sub(string = Codigo, start=1, end=2)) %>%
group_by(UF, Categoria) %>%
summarise(n = n()) %>%
mutate(freq = n/sum(n)) %>%
#count() %>%
filter(UF == "26" | UF == "25") %>%
arrange(desc(n))
PE_PB %>% mutate(Estado = if_else(UF == "26", "Pernambuco", "Paraiba")) %>%
ggplot(aes(x = reorder(Categoria,n), y= n, fill=Estado)) + geom_bar(stat = "identity") + coord_flip()
PE_PB %>% mutate(Estado = if_else(UF == "26", "Pernambuco", "Paraiba")) %>%
ggplot(aes(x = reorder(Categoria,n), y= n, fill=Estado)) + geom_bar(stat = "identity", position = "dodge") + coord_flip()
PE_PB %>% mutate(Estado = if_else(UF == "26", "Pernambuco", "Paraiba")) %>%
ggplot(aes(x = reorder(Categoria,n), y= n, fill=UF)) + geom_bar(stat = "identity", position = "dodge") + coord_flip() + facet_wrap(~Estado) + guides(fill="none")