Introdução

Vamos trabalhar com importação, manipulação e construção de tabelas no R. Vamos ver também as proporções e gráficos de pizza.

Importação de arquivos no R

Carregar do RData

load("C:/Users/eduar/Base_de_dados-master/CARROS.RData")

Importar do excel

library(readxl)
IDH <- read_excel("/Users/eduar/Base_de_dados-master/IDH_por_regiao.XLS", 
                  sheet = "Dados")
View(IDH)

Importar do CSV

library(readr)
Familias <- read_delim("/Users/eduar/Base_de_dados-master/Familias2.csv",
                        delim = ";", escape_double = FALSE,
                        locale = locale(encoding = "WINDOWS-1252"),
                        trim_ws = TRUE)
## Rows: 120 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (4): local, p.a.p, instr, renda
## dbl (2): familia, tam
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(Familias)

Limpeza de dados

CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0, "Gas", "Alc")
class(CARROS$Tipodecombustivel)
## [1] "character"
#Problema corrigido

CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0, "Auto", "Manual")
class(CARROS$TipodeMarcha)
## [1] "character"
#Problema resolvido
  
#Substituir vírgula por ponto
Familias$renda = gsub(",", ".", Familias$renda)
class(Familias$renda)
## [1] "character"
Familias$renda = as.numeric(Familias$renda)
class(Familias$renda)
## [1] "numeric"
summary(Familias)
##     familia          local              p.a.p              instr          
##  Min.   :  1.00   Length:120         Length:120         Length:120        
##  1st Qu.: 30.75   Class :character   Class :character   Class :character  
##  Median : 60.50   Mode  :character   Mode  :character   Mode  :character  
##  Mean   : 60.50                                                           
##  3rd Qu.: 90.25                                                           
##  Max.   :120.00                                                           
##                                                                           
##       tam            renda      
##  Min.   :1.000   Min.   : 0.10  
##  1st Qu.:3.750   1st Qu.: 3.90  
##  Median :4.000   Median : 5.40  
##  Mean   :4.492   Mean   : 6.34  
##  3rd Qu.:5.000   3rd Qu.: 8.15  
##  Max.   :9.000   Max.   :25.70  
##                  NA's   :1
Familias$renda_real = Familias$renda*1320
class(Familias$renda_real)
## [1] "numeric"

Tabela simples (univariado)

tabela_comb = table(CARROS$Tipodecombustivel)
tabela_comb
## 
## Alc Gas 
##  14  18
tabela_marcha = table(CARROS$TipodeMarcha)
tabela_marcha
## 
##   Auto Manual 
##     19     13
tabela_local = table(Familias$local)
tabela_local
## 
##   Encosta do Morro        Monte Verde Parque da Figueira 
##                 37                 40                 43
tabela_reg = table(IDH$Região)
tabela_reg
## 
## Norte    SE   Sul 
##   449  1666  1159

Proporções

prop.table(tabela_local)*100
## 
##   Encosta do Morro        Monte Verde Parque da Figueira 
##           30.83333           33.33333           35.83333
prop.table(tabela_comb)*100
## 
##   Alc   Gas 
## 43.75 56.25
prop.table(tabela_marcha)*100
## 
##   Auto Manual 
## 59.375 40.625

Pizzas

pie(tabela_comb)

pie(tabela_comb, col = c("green", "pink"))

pie(tabela_marcha, col = c("red", "blue"))

pie(tabela_local,col=c("skyblue","royalblue","darkblue"))

pie(tabela_local,col=c("tomato1","tomato3","tomato4"))

Conclusão

é fácil fazer gráficos de pizza no R

o R é demais! E o R e fácil