library(tidyselect)
library(tidyverse)
## ── Attaching packages ─────────────────────── tidyverse 1.2.1 ──
## ✔ ggplot2 2.2.1 ✔ purrr 0.2.4
## ✔ tibble 1.3.4 ✔ dplyr 0.7.4
## ✔ tidyr 0.7.2 ✔ stringr 1.3.0
## ✔ readr 1.1.1 ✔ forcats 0.2.0
## ── Conflicts ────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::contains() masks tidyselect::contains()
## ✖ dplyr::ends_with() masks tidyselect::ends_with()
## ✖ dplyr::everything() masks tidyselect::everything()
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ✖ dplyr::matches() masks tidyselect::matches()
## ✖ dplyr::num_range() masks tidyselect::num_range()
## ✖ dplyr::one_of() masks tidyselect::one_of()
## ✖ dplyr::starts_with() masks tidyselect::starts_with()
##Importando uma base de dados
library(readr)
base2 <- read_delim("DM_DOCENTE.CSV", "|",
escape_double = FALSE, col_types = cols(CO_CATEGORIA_ADMINISTRATIVA = col_character(),
CO_COR_RACA_DOCENTE = col_character(),
CO_DOCENTE = col_character(), CO_DOCENTE_IES = col_character(),
CO_ESCOLARIDADE_DOCENTE = col_character(),
CO_IES = col_character(), CO_MUNICIPIO_NASCIMENTO = col_character(),
CO_NACIONALIDADE_DOCENTE = col_character(),
CO_ORGANIZACAO_ACADEMICA = col_character(),
CO_PAIS_DOCENTE = col_character(),
CO_REGIME_TRABALHO = col_character(),
CO_SITUACAO_DOCENTE = col_character(),
CO_UF_NASCIMENTO = col_character()),
locale = locale(encoding = "ISO-8859-1"),
trim_ws = TRUE)
###Para diminuir a base geral e trabalhar com uma base menor
base5perc <- base2 %>% sample_frac(size = .05)
saveRDS(base5perc,"base5perc.rds")