Carregando o conjunto de dados

library(readr)
library(dplyr)
Base3 <- read_delim("D:/UFPE/2018.1/Estatistica_Computacional/DADOS/DM_DOCENTE.CSV", 
                    "|", 
                    escape_double = FALSE, 
                    col_types = cols(CO_CATEGORIA_ADMINISTRATIVA = col_character(),
                                     CO_DOCENTE = col_character(), 
                                     CO_DOCENTE_IES = col_character(), 
                                     CO_ESCOLARIDADE_DOCENTE = col_character(), 
                                     CO_MUNICIPIO_NASCIMENTO = col_character(), 
                                     CO_NACIONALIDADE_DOCENTE = col_character(), 
                                     CO_ORGANIZACAO_ACADEMICA = col_character(), 
                                     CO_PAIS_DOCENTE = col_character(), 
                                     CO_SITUACAO_DOCENTE = col_character(), 
                                     CO_UF_NASCIMENTO = col_character()), 
                    locale = locale(encoding = "ISO-8859-1"), 
                    trim_ws = TRUE)
base5perc <- Base3 %>% sample_frac(size=0.05)

Tabela com as categorias

categoria_quantidade <- data.frame(table(base5perc$DS_CATEGORIA_ADMINISTRATIVA))
porcentagem <- (categoria_quantidade[2]/dim(base5perc)[1])*100
tab <- data.frame(categoria_quantidade, porcentagem)
colnames(tab) <- c("Categoria", "Quantidade", "Porcentagem")

library(knitr)
kable(tab)
Categoria Quantidade Porcentagem
Especial 254 1.2776017
Privada com fins lucrativos 4740 23.8418591
Privada sem fins lucrativos 6190 31.1352548
Pública Estadual 2699 13.5757759
Pública Federal 5848 29.4150194
Pública Municipal 150 0.7544892

Grafico de barras

library(ggplot2)
p<-ggplot(data=tab, aes(x=tab$Categoria, y=tab$Quantidade)) +
  geom_bar(stat="identity", fill="steelblue") +
  theme_minimal() + 
  ggtitle("Grafico de barra Categoria versus Quantidade") +
  ylab("Quantidade") + xlab("Categoria")
plot(p + coord_flip())

AULA DIA 19/03

Primeiramente, criamos uma tabela de busca relacionado ao estado de Pernambuco (UF = 26).

library(stringr)
library(DT)
## Warning: package 'DT' was built under R version 3.4.4
pernambuco <- base5perc %>% 
  select(NO_IES, DS_CATEGORIA_ADMINISTRATIVA, CO_MUNICIPIO_NASCIMENTO) %>%
  transmute(Nome = NO_IES, 
            Categoria = DS_CATEGORIA_ADMINISTRATIVA,
            Codigo = as.character(CO_MUNICIPIO_NASCIMENTO)) %>% 
  mutate (UF = str_sub(string = Codigo, start=1, end=2)) %>% 
  group_by(UF, Categoria) %>% 
  summarise(n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  #count() %>% 
  filter(UF == "26") %>% 
  arrange(desc(n))%>%
  mutate(Categoria = factor(Categoria, levels = Categoria))


pernambuco %>% datatable()
pernambuco %>% 
  ggplot(aes(x = reorder(Categoria, n), y= n, fill= Categoria)) +
  geom_bar(stat = "identity") +
  guides(fill = "none") +
  coord_flip() +
  labs(x = "Categoria", y = "Total", title = "Numero de instituicoes por categoria", subtitle = "Estado de Pernambuco") +
  geom_label(aes(label = paste(round(100*freq), "%", sep = ""))) +
  scale_fill_brewer(palette = "BuGn",direction = -1)

PE_PB <- base5perc %>% 
  select(NO_IES, DS_CATEGORIA_ADMINISTRATIVA, CO_MUNICIPIO_NASCIMENTO) %>%
  transmute(Nome = NO_IES, 
            Categoria = DS_CATEGORIA_ADMINISTRATIVA,
            Codigo = as.character(CO_MUNICIPIO_NASCIMENTO)) %>% 
  mutate (UF = str_sub(string = Codigo, start=1, end=2)) %>% 
  group_by(UF, Categoria) %>% 
  summarise(n = n()) %>% 
  mutate(freq = n/sum(n)) %>% 
  #count() %>% 
  filter(UF == "26" | UF == "25") %>% 
  arrange(desc(n)) 
PE_PB %>% mutate(Estado = if_else(UF == "26", "Pernambuco", "Paraiba")) %>% 
  ggplot(aes(x = reorder(Categoria,n), y= n, fill=Estado)) + geom_bar(stat = "identity") + coord_flip() 

PE_PB %>% mutate(Estado = if_else(UF == "26", "Pernambuco", "Paraiba")) %>% 
  ggplot(aes(x = reorder(Categoria,n), y= n, fill=Estado)) + geom_bar(stat = "identity", position = "dodge") + coord_flip() 

PE_PB %>% mutate(Estado = if_else(UF == "26", "Pernambuco", "Paraiba")) %>% 
  ggplot(aes(x = reorder(Categoria,n), y= n, fill=UF)) + geom_bar(stat = "identity", position = "dodge") + coord_flip() + facet_wrap(~Estado) + guides(fill="none")