Introdução

Hoje vamos ver como importar a base de dados, como transformar varíaveis e como fazer um gráfico de pizza.

Oops, não só pizza mas também tabela e proporção.

Importação

Nesse segmento vou importar uma basse de dados no formato Rdata, xlsx e csv.

Importando do Rdata

Para carregar uma base do Rdata podemos fazer o seguinte código:

# carregando a base de dados CARROS.rdata
load("C:/Users/15781634711/Desktop/Base_de_dados-master/CARROS.RData")

Importando do excel

Para carregar uma base do excel podemos fazer o seguinte código:

# carregando a base de dados do Excel
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
Base_IDH <- read_excel("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\IDH_por_regiao.XLS", 
                       sheet = "Dados")

Importando do CSV

Para carregar uma base do CSV podemos fazer o seguinte código:

# carregando base de dados familia2
library(readr)
## Warning: package 'readr' was built under R version 4.2.3
Familias2 <- read_delim("C:\\Users\\15781634711\\Desktop\\Base_de_dados-master\\Familias2.csv", 
                        delim = ";", escape_double = FALSE, locale = locale(encoding = "WINDOWS-1252"), 
                        trim_ws = TRUE)
## Rows: 120 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (4): local, p.a.p, instr, renda
## dbl (2): familia, tam
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Transformação dos dados

Aqui vamos mexer nas varíaveis renda e instrução da base famílias2 e tipo de marcha e tipo de combustível da base CARROS.

Obs: O salário mínimo em 12/04/2023 é de R$1.320,00

# Transformação do tipo de marcha
class (CARROS$TipodeMarcha)
## [1] "numeric"
CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0, "Automático", "Manual")
# Transformação do tipo de combustível
CARROS$Tipodecombustivel = ifelse (CARROS$Tipodecombustivel==0, "Gasolina", "Álcool")

# Renda em reais
Familias2$renda = gsub(',','.', Familias2$renda)
Familias2$renda = as.numeric(Familias2$renda)
Familias2$renda_real = Familias2$renda*1320
# Tranformação na Instrução
Familias2$educa = gsub('Sem Instrução', '1.Sem instrução', Familias2$instr)
Familias2$educa = gsub('Sem Instrução', '1.Sem instrução', Familias2$educa)
Familias2$educa = gsub('Ensino fundamental', '2.Ensino fundamental', Familias2$educa)
Familias2$educa = gsub('Ensino médio', '3.Ensino médio', Familias2$educa)

Tabelas

Vamos criar algumas tabelas para as varíaveis qualitativas no R.

# Frequencia de uso do p.a.p
tabela_pap = table(Familias2$p.a.p)
tabela_pap
## 
## Não usa     Usa 
##      42      78
# tabela combustivel
tabela_Combustivel = table (CARROS$Tipodecombustivel)
tabela_Combustivel
## 
##   Álcool Gasolina 
##       14       18
# tabela marcha
tabela_marcha = table(CARROS$TipodeMarcha)
tabela_marcha
## 
## Automático     Manual 
##         19         13
# Moradia
tabela_moradia = table(Familias2$local)

# instrução
tabela_educa = table(Familias2$educa)

Gráficos e proporção

Agora vamos criar gráficos e calcular as propções das varíaveis.

# proporção
round(prop.table(tabela_pap)*100,1)
## 
## Não usa     Usa 
##      35      65
round(prop.table(tabela_marcha)*100,1)
## 
## Automático     Manual 
##       59.4       40.6
round(prop.table(tabela_Combustivel)*100,1)
## 
##   Álcool Gasolina 
##     43.8     56.2
round(prop.table(tabela_moradia)*100,1)
## 
##   Encosta do Morro        Monte Verde Parque da Figueira 
##               30.8               33.3               35.8
round(prop.table(tabela_educa)*100,1)
## 
##      1.Sem instrução 2.Ensino fundamental       3.Ensino médio 
##                 31.7                 31.7                 36.7
# gráficos
pie(tabela_pap, col=c("black","white"))

pie(tabela_moradia, col=c("magenta4","blue","yellow"))

barplot(tabela_educa, col = c("red","blue","blue"))

Gráfico de Waffle

library(waffle)
## Warning: package 'waffle' was built under R version 4.2.3
## Carregando pacotes exigidos: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
parts = c(Não = 35, Sim = 65)
waffle(parts,colors = c("black","green"))