Entrada de Dados

setwd("C:/Users/admin/Dropbox/UFGD/2019_02_Disciplinas/Topicos_Estatistica_R/1_Aula/Dados_Aula_01")
getwd()
## [1] "C:/Users/admin/Dropbox/UFGD/2019_02_Disciplinas/Topicos_Estatistica_R/1_Aula"
dir()
## [1] "Aula_1_Link_Apresentaca.txt" "Aula1Apresentacao.pdf"      
## [3] "Dados_Aula_01"               "fig"                        
## [5] "Rotina_Aula_01.html"         "Rotina_Aula_01.Rmd"         
## [7] "rsconnect"
setwd("C:/Users/admin/Dropbox/UFGD/2019_02_Disciplinas/Topicos_Estatistica_R/1_Aula/Dados_Aula_01")
dados <- read.csv2("Tabela_Bus2.csv")
head(dados)
##   N Estado_Civil  Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 1 1     solteiro ensino fundamental          NA        4.00    26
## 2 2       casado ensino fundamental           1        4.56    32
## 3 3       casado ensino fundamental           2        5.25    36
## 4 4     solteiro    ensino m\xe9dio          NA        5.73    20
## 5 5     solteiro ensino fundamental          NA        6.26    40
## 6 6       casado ensino fundamental           0        6.66    28
##   Regiao_de_Procedencia
## 1              interior
## 2               capital
## 3               capital
## 4                 outra
## 5                 outra
## 6              interior
tail(dados)
##     N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 31 31     solteiro          superior          NA       16.22    31
## 32 32       casado   ensino m\xe9dio           1       16.61    36
## 33 33       casado          superior           3       17.26    43
## 34 34     solteiro          superior          NA       18.75    33
## 35 35       casado   ensino m\xe9dio           2       19.40    48
## 36 36       casado          superior           3       23.30    42
##    Regiao_de_Procedencia
## 31                 outra
## 32              interior
## 33               capital
## 34               capital
## 35               capital
## 36              interior
class(dados)
## [1] "data.frame"
str(dados)
## 'data.frame':    36 obs. of  7 variables:
##  $ N                    : int  1 2 3 4 5 6 7 8 9 10 ...
##  $ Estado_Civil         : chr  "solteiro" "casado" "casado" "solteiro" ...
##  $ Grau_de_Instrucao    : chr  "ensino fundamental" "ensino fundamental" "ensino fundamental" "ensino m\xe9dio" ...
##  $ N_de_Filhos          : int  NA 1 2 NA NA 0 NA NA 1 NA ...
##  $ Salario_Min          : num  4 4.56 5.25 5.73 6.26 6.66 6.86 7.39 7.59 7.44 ...
##  $ Idade                : int  26 32 36 20 40 28 41 43 34 23 ...
##  $ Regiao_de_Procedencia: chr  "interior" "capital" "capital" "outra" ...
summary(dados)
##        N         Estado_Civil       Grau_de_Instrucao   N_de_Filhos  
##  Min.   : 1.00   Length:36          Length:36          Min.   :0.00  
##  1st Qu.: 9.75   Class :character   Class :character   1st Qu.:1.00  
##  Median :18.50   Mode  :character   Mode  :character   Median :2.00  
##  Mean   :18.50                                         Mean   :1.65  
##  3rd Qu.:27.25                                         3rd Qu.:2.00  
##  Max.   :36.00                                         Max.   :5.00  
##                                                        NA's   :16    
##   Salario_Min         Idade       Regiao_de_Procedencia
##  Min.   : 4.000   Min.   :20.00   Length:36            
##  1st Qu.: 7.553   1st Qu.:30.00   Class :character     
##  Median :10.165   Median :34.50   Mode  :character     
##  Mean   :11.122   Mean   :34.58                        
##  3rd Qu.:14.060   3rd Qu.:40.00                        
##  Max.   :23.300   Max.   :48.00                        
## 

Tipos de Variáveis

nome <- c("João", "Maria", "José", "Ana")
idade <- c(15, 32, 33, 41)
adulto <- c(FALSE, TRUE, TRUE, TRUE)
uf <- c("DF", "SP", "MG", "MS")
clientes <- data.frame(nome, idade, adulto, uf)
clientes
##    nome idade adulto uf
## 1  João    15  FALSE DF
## 2 Maria    32   TRUE SP
## 3  José    33   TRUE MG
## 4   Ana    41   TRUE MS
str(clientes)
## 'data.frame':    4 obs. of  4 variables:
##  $ nome  : chr  "João" "Maria" "José" "Ana"
##  $ idade : num  15 32 33 41
##  $ adulto: logi  FALSE TRUE TRUE TRUE
##  $ uf    : chr  "DF" "SP" "MG" "MS"

Valores Faltantes

summary(dados)
##        N         Estado_Civil       Grau_de_Instrucao   N_de_Filhos  
##  Min.   : 1.00   Length:36          Length:36          Min.   :0.00  
##  1st Qu.: 9.75   Class :character   Class :character   1st Qu.:1.00  
##  Median :18.50   Mode  :character   Mode  :character   Median :2.00  
##  Mean   :18.50                                         Mean   :1.65  
##  3rd Qu.:27.25                                         3rd Qu.:2.00  
##  Max.   :36.00                                         Max.   :5.00  
##                                                        NA's   :16    
##   Salario_Min         Idade       Regiao_de_Procedencia
##  Min.   : 4.000   Min.   :20.00   Length:36            
##  1st Qu.: 7.553   1st Qu.:30.00   Class :character     
##  Median :10.165   Median :34.50   Mode  :character     
##  Mean   :11.122   Mean   :34.58                        
##  3rd Qu.:14.060   3rd Qu.:40.00                        
##  Max.   :23.300   Max.   :48.00                        
## 
is.na(dados$N_de_Filhos)
##  [1]  TRUE FALSE FALSE  TRUE  TRUE FALSE  TRUE  TRUE FALSE  TRUE FALSE  TRUE
## [13]  TRUE FALSE FALSE  TRUE FALSE FALSE  TRUE  TRUE FALSE  TRUE  TRUE FALSE
## [25] FALSE FALSE  TRUE FALSE FALSE FALSE  TRUE FALSE FALSE  TRUE FALSE FALSE

Função de Lógica

ifelse(dados$Salario_Min < 4, "Baixo Salário", "Alto Salário")
##  [1] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
##  [6] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [11] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [16] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [21] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [26] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [31] "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário" "Alto Salário"
## [36] "Alto Salário"
# Guardando em um objeto
bs <- ifelse(dados$Salario_Min < 4, "Baixo Salário", "Alto Salário")

# Acrescentando ao banco de dados
dados$bs <- bs

Manipulação de dados

dados[4, ]
##   N Estado_Civil Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 4 4     solteiro   ensino m\xe9dio          NA        5.73    20
##   Regiao_de_Procedencia           bs
## 4                 outra Alto Salário
dados[4:10, ]
##     N Estado_Civil  Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 4   4     solteiro    ensino m\xe9dio          NA        5.73    20
## 5   5     solteiro ensino fundamental          NA        6.26    40
## 6   6       casado ensino fundamental           0        6.66    28
## 7   7     solteiro ensino fundamental          NA        6.86    41
## 8   8     solteiro ensino fundamental          NA        7.39    43
## 9   9       casado    ensino m\xe9dio           1        7.59    34
## 10 10     solteiro    ensino m\xe9dio          NA        7.44    23
##    Regiao_de_Procedencia           bs
## 4                  outra Alto Salário
## 5                  outra Alto Salário
## 6               interior Alto Salário
## 7               interior Alto Salário
## 8                capital Alto Salário
## 9                capital Alto Salário
## 10                 outra Alto Salário
dados[c(3,7), ]
##   N Estado_Civil  Grau_de_Instrucao N_de_Filhos Salario_Min Idade
## 3 3       casado ensino fundamental           2        5.25    36
## 7 7     solteiro ensino fundamental          NA        6.86    41
##   Regiao_de_Procedencia           bs
## 3               capital Alto Salário
## 7              interior Alto Salário
dados[5, 2]
## [1] "solteiro"
dados[, "Idade"]
##  [1] 26 32 36 20 40 28 41 43 34 23 33 27 37 44 30 38 31 39 25 37 30 34 41 26 32
## [26] 35 46 29 40 35 31 36 43 33 48 42
dados[5, "Idade"]
## [1] 40