R Markdown

Introdução

Hoje vamos ver como importar a base de dados, como transformar variáveis e como fazer um gráfico de pizza.

Ops, não só pizza, mas também tabela e proporção.

Importação

Nesse segmento vou importar bases de dados do formato **RData*, xlsx* e csv**.

Importando do RData

Para carregar uma base do RData, podemos fazer o seguinte código.

##Carregando a base de dados CARROS.RData
load("C:/Users/47869212890/Desktop/Base_de_dados-master/CARROS.RData")
##Carregando um arquivo no Excel
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.3
base_IDH <- read_excel("C:/Users/47869212890/Desktop/Base_de_dados-master/IDH_por_regiao.XLS", 
                       sheet = "Dados")
View(base_IDH)
##Carregando o CSV (comma separated values)
library(readr)
## Warning: package 'readr' was built under R version 4.2.3
Familias <- read_delim("C:/Users/47869212890/Desktop/Base_de_dados-master/Familias2.csv", 
                        delim = ";", escape_double = FALSE, locale = locale(encoding = "WINDOWS-1252"), 
                        trim_ws = TRUE)
## Rows: 120 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (4): local, p.a.p, instr, renda
## dbl (2): familia, tam
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

Limpeza de dados / Transformação dos dados

Aqui vamos mexer nas vavriáveis renda da base família, tipo de macha da base carros e tipo de combustível também na base carros.

informação importante: O salário minimo em 12/04 é de R$1.320.00

#Familias$renda_real = (Familias$renda*1320)

class(Familias$renda)
## [1] "character"
Familias$renda = gsub(',','.',Familias$renda)

Familias$renda = as.numeric(Familias$renda)

class(Familias$renda)
## [1] "numeric"
Familias$renda_real = Familias$renda*1320
class(Familias$renda)
## [1] "numeric"
Familias$renda_real = Familias$renda*1320

Tabelas

Vamos criar algumas tabelas para variável qualitativa

Tabela

#———————————————————————————

tabela_pap = table(Familias$p.a.p) tabela_pap

proporção

prop.table(tabela_pap)100 prop.table(tabela_local)100

tabela_local = table(Familias$local) tabela_local

round(prop.table(tabela_instru)100 round(prop.table(tabela_instru)100,2

pie(tabela_pap) pie(tabela_local)

pie(tabela_pap,col=c(“green”,“pink”)) pie(tabela_local,col = c(“#749aab”,“#7a74ab”,“#b06464”))

Gráficos de barra para variaveis ordinais

Familias$educa = gsub('Sem instrução','1.Sem Instrução',Familias$instr)
Familias$educa = gsub('Ensino Fundamental','2.Ensino Fundamental',Familias$instr)
Familias$educa = gsub('Ensino Médio','3.Ensino Médio',Familias$instr)

tabela_instr = table(Familias$instr)
barplot(tabela_instr,col="pink")

32% dos chefes de famílias não tem escolaridade.

Um gráfico novo.

O meu primeiro gráfico de waffle.

tabela_pap prop.table(tabela_pap)

library(waffle)
## Warning: package 'waffle' was built under R version 4.2.3
## Carregando pacotes exigidos: ggplot2
## Warning: package 'ggplot2' was built under R version 4.2.3
waffle(c(35.,65))

# ?waffle
partes <- c(Não=35,Sim=65)
waffle(partes)

waffle(partes,colors = c("blue","green"))