Aula 4 - Estatística Computacional

library(tidyselect)
library(tidyverse)

## ── Attaching packages ─────────────────────── tidyverse 1.2.1 ──

## ✔ ggplot2 2.2.1     ✔ purrr   0.2.4
## ✔ tibble  1.3.4     ✔ dplyr   0.7.4
## ✔ tidyr   0.7.2     ✔ stringr 1.3.0
## ✔ readr   1.1.1     ✔ forcats 0.2.0

## ── Conflicts ────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::contains()    masks tidyselect::contains()
## ✖ dplyr::ends_with()   masks tidyselect::ends_with()
## ✖ dplyr::everything()  masks tidyselect::everything()
## ✖ dplyr::filter()      masks stats::filter()
## ✖ dplyr::lag()         masks stats::lag()
## ✖ dplyr::matches()     masks tidyselect::matches()
## ✖ dplyr::num_range()   masks tidyselect::num_range()
## ✖ dplyr::one_of()      masks tidyselect::one_of()
## ✖ dplyr::starts_with() masks tidyselect::starts_with()

##Importando uma base de dados

library(readr)
base2 <- read_delim("DM_DOCENTE.CSV", "|", 
                    escape_double = FALSE, col_types = cols(CO_CATEGORIA_ADMINISTRATIVA = col_character(), 
                                                            CO_COR_RACA_DOCENTE = col_character(), 
                                                            CO_DOCENTE = col_character(), CO_DOCENTE_IES = col_character(), 
                                                            CO_ESCOLARIDADE_DOCENTE = col_character(), 
                                                            CO_IES = col_character(), CO_MUNICIPIO_NASCIMENTO = col_character(), 
                                                            CO_NACIONALIDADE_DOCENTE = col_character(), 
                                                            CO_ORGANIZACAO_ACADEMICA = col_character(), 
                                                            CO_PAIS_DOCENTE = col_character(), 
                                                            CO_REGIME_TRABALHO = col_character(), 
                                                            CO_SITUACAO_DOCENTE = col_character(), 
                                                            CO_UF_NASCIMENTO = col_character()), 
                    locale = locale(encoding = "ISO-8859-1"), 
                    trim_ws = TRUE)

###Para diminuir a base geral e trabalhar com uma base menor
base5perc <- base2 %>% sample_frac(size = .05)
saveRDS(base5perc,"base5perc.rds")

Aula 4 - Estatística Computacional

Ana Cláudia Lima

12/03/2018