setwd("C:/Users/admin/Dropbox/UFGD/2019_02_Disciplinas/Topicos_Estatistica_R/1_Aula/Dados_Aula_01")
getwd()
## [1] "C:/Users/admin/Dropbox/UFGD/2019_02_Disciplinas/Topicos_Estatistica_R/1_Aula"
dir()
## [1] "Aula_1_Link_Apresentaca.txt" "Aula1Apresentacao.pdf"
## [3] "Dados_Aula_01" "fig"
## [5] "Rotina_Aula_01.html" "Rotina_Aula_01.Rmd"
## [7] "rsconnect"
Para baixar os dados a serem utilizados a seguir, faço o download em: Baixar dados
Entrando com os dados
setwd("C:/Users/admin/Dropbox/UFGD/2019_02_Disciplinas/Topicos_Estatistica_R/1_Aula/Dados_Aula_01")
dados <- read.csv2("Tabela_Bus2.csv")
head(dados)
## N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 1 1 solteiro ensino fundamental NA 4.00 26
## 2 2 casado ensino fundamental 1 4.56 32
## 3 3 casado ensino fundamental 2 5.25 36
## 4 4 solteiro ensino m\xe9dio NA 5.73 20
## 5 5 solteiro ensino fundamental NA 6.26 40
## 6 6 casado ensino fundamental 0 6.66 28
## Regiao_de_Procedencia
## 1 interior
## 2 capital
## 3 capital
## 4 outra
## 5 outra
## 6 interior
tail(dados)
## N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 31 31 solteiro superior NA 16.22 31
## 32 32 casado ensino m\xe9dio 1 16.61 36
## 33 33 casado superior 3 17.26 43
## 34 34 solteiro superior NA 18.75 33
## 35 35 casado ensino m\xe9dio 2 19.40 48
## 36 36 casado superior 3 23.30 42
## Regiao_de_Procedencia
## 31 outra
## 32 interior
## 33 capital
## 34 capital
## 35 capital
## 36 interior
class(dados)
## [1] "data.frame"
str(dados)
## 'data.frame': 36 obs. of 7 variables:
## $ N : int 1 2 3 4 5 6 7 8 9 10 ...
## $ Estado_Civil : chr "solteiro" "casado" "casado" "solteiro" ...
## $ Grau_de_Instrucao : chr "ensino fundamental" "ensino fundamental" "ensino fundamental" "ensino m\xe9dio" ...
## $ N_de_Filhos : int NA 1 2 NA NA 0 NA NA 1 NA ...
## $ Salario_Min : num 4 4.56 5.25 5.73 6.26 6.66 6.86 7.39 7.59 7.44 ...
## $ Idade : int 26 32 36 20 40 28 41 43 34 23 ...
## $ Regiao_de_Procedencia: chr "interior" "capital" "capital" "outra" ...
summary(dados)
## N Estado_Civil Grau_de_Instrucao N_de_Filhos
## Min. : 1.00 Length:36 Length:36 Min. :0.00
## 1st Qu.: 9.75 Class :character Class :character 1st Qu.:1.00
## Median :18.50 Mode :character Mode :character Median :2.00
## Mean :18.50 Mean :1.65
## 3rd Qu.:27.25 3rd Qu.:2.00
## Max. :36.00 Max. :5.00
## NA's :16
## Salario_Min Idade Regiao_de_Procedencia
## Min. : 4.000 Min. :20.00 Length:36
## 1st Qu.: 7.553 1st Qu.:30.00 Class :character
## Median :10.165 Median :34.50 Mode :character
## Mean :11.122 Mean :34.58
## 3rd Qu.:14.060 3rd Qu.:40.00
## Max. :23.300 Max. :48.00
##
nome <- c("João", "Maria", "José", "Ana")
idade <- c(15, 32, 33, 41)
adulto <- c(FALSE, TRUE, TRUE, TRUE)
uf <- c("DF", "SP", "MG", "MS")
clientes <- data.frame(nome, idade, adulto, uf)
clientes
## nome idade adulto uf
## 1 João 15 FALSE DF
## 2 Maria 32 TRUE SP
## 3 José 33 TRUE MG
## 4 Ana 41 TRUE MS
str(clientes)
## 'data.frame': 4 obs. of 4 variables:
## $ nome : chr "João" "Maria" "José" "Ana"
## $ idade : num 15 32 33 41
## $ adulto: logi FALSE TRUE TRUE TRUE
## $ uf : chr "DF" "SP" "MG" "MS"
summary(dados)
## N Estado_Civil Grau_de_Instrucao N_de_Filhos
## Min. : 1.00 Length:36 Length:36 Min. :0.00
## 1st Qu.: 9.75 Class :character Class :character 1st Qu.:1.00
## Median :18.50 Mode :character Mode :character Median :2.00
## Mean :18.50 Mean :1.65
## 3rd Qu.:27.25 3rd Qu.:2.00
## Max. :36.00 Max. :5.00
## NA's :16
## Salario_Min Idade Regiao_de_Procedencia
## Min. : 4.000 Min. :20.00 Length:36
## 1st Qu.: 7.553 1st Qu.:30.00 Class :character
## Median :10.165 Median :34.50 Mode :character
## Mean :11.122 Mean :34.58
## 3rd Qu.:14.060 3rd Qu.:40.00
## Max. :23.300 Max. :48.00
##
is.na(dados$N_de_Filhos)
## [1] TRUE FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE TRUE FALSE TRUE
## [13] TRUE FALSE FALSE TRUE FALSE FALSE TRUE TRUE FALSE TRUE TRUE FALSE
## [25] FALSE FALSE TRUE FALSE FALSE FALSE TRUE FALSE FALSE TRUE FALSE FALSE
ifelse(dados$Salario_Min < 4, "Baixo Salário", "Alto Salário")
## [1] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [6] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [11] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [16] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [21] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [26] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [31] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [36] "Alto Salário"
# Guardando em um objeto
bs <- ifelse(dados$Salario_Min < 4, "Baixo Salário", "Alto Salário")
# Acrescentando ao banco de dados
dados$bs <- bs
dados[4, ]
## N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 4 4 solteiro ensino m\xe9dio NA 5.73 20
## Regiao_de_Procedencia bs
## 4 outra Alto Salário
dados[4:10, ]
## N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 4 4 solteiro ensino m\xe9dio NA 5.73 20
## 5 5 solteiro ensino fundamental NA 6.26 40
## 6 6 casado ensino fundamental 0 6.66 28
## 7 7 solteiro ensino fundamental NA 6.86 41
## 8 8 solteiro ensino fundamental NA 7.39 43
## 9 9 casado ensino m\xe9dio 1 7.59 34
## 10 10 solteiro ensino m\xe9dio NA 7.44 23
## Regiao_de_Procedencia bs
## 4 outra Alto Salário
## 5 outra Alto Salário
## 6 interior Alto Salário
## 7 interior Alto Salário
## 8 capital Alto Salário
## 9 capital Alto Salário
## 10 outra Alto Salário
dados[c(3,7), ]
## N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 3 3 casado ensino fundamental 2 5.25 36
## 7 7 solteiro ensino fundamental NA 6.86 41
## Regiao_de_Procedencia bs
## 3 capital Alto Salário
## 7 interior Alto Salário
dados[5, 2]
## [1] "solteiro"
dados[, "Idade"]
## [1] 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32
## [26] 35 46 29 40 35 31 36 43 33 48 42
dados[5, "Idade"]
## [1] 40