Na segunda aula de R aprendemos a utilizar os seguintes códigos e as seguintes importações

Introdução

Hoje vamos ver como importar a base de dados, como TRANSFORMAR VARIAVEIS E COMO FAZ UM GRÁFICO DE PIZZA.

Importação

Nessa parte irei importar as bases de dados utilizadas do formato RData, XLSX e CSV

Importação do RData

Para carregar uma base do RData, podemos fazer o seguinte código.

# Carregando a base de dados CARROS.RData- dados do RData 
load("C:/Users/06179351732/Desktop/Base_de_dados-master/CARROS.RData")

Importação do Exel

Para carregar uma base do Exel, pode,os fazer o seguinte

# Carregando um arquivo do EXEL no R 
library(readxl)
base_IDH <- read_excel("C:/Users/06179351732/Desktop/Base_de_dados-master/IDH_por_regiao.XLS", 
                       sheet = "Dados")
View(base_IDH)

Importação do CSV

Para carregar uma base de dados do CSV, podemos fazer o seguinte

# carregando arquivo modelo CSV (Comma-separated values/ separado por virgulas) no R 

library(readr)
Familias <- read_delim("C:/Users/06179351732/Desktop/Base_de_dados-master/Familias2.csv", 
                        delim = ";", escape_double = FALSE, locale = locale(encoding = "WINDOWS-1252"), 
                        trim_ws = TRUE)
## Rows: 120 Columns: 6
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ";"
## chr (4): local, p.a.p, instr, renda
## dbl (2): familia, tam
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.
View(Familias)

Limpeza de dados/ Transformação dos dados

aqui vamos aprender a mexer nas variáveis Renada da base familia, tipo de marcha da base de carros e tipo de combustivel tambem da base de carros.

Informação importante: o salario minimo em 12 de abril de 2023 é de R$1320,00
# transformação do tipo de marcha 
class(CARROS$TipodeMarcha)
## [1] "numeric"
class(CARROS$Tipodecombustivel)
## [1] "numeric"
CARROS$TipodeMarcha = ifelse(CARROS$TipodeMarcha==0,"Automatico","Manual")

#CARROS$TipodeCombustivel = ifelse(CARROS$TipodeCombustivel==0,"Gas","Alcool")
CARROS$Tipodecombustivel = ifelse(CARROS$Tipodecombustivel==0,'Gas','Alc')

class(CARROS$TipodeCombustivel)
## [1] "NULL"
summary(CARROS)
##    Kmporlitro      Cilindros         Preco             HP       
##  Min.   :10.40   Min.   :4.000   Min.   : 71.1   Min.   : 52.0  
##  1st Qu.:15.43   1st Qu.:4.000   1st Qu.:120.8   1st Qu.: 96.5  
##  Median :19.20   Median :6.000   Median :196.3   Median :123.0  
##  Mean   :20.09   Mean   :6.188   Mean   :230.7   Mean   :146.7  
##  3rd Qu.:22.80   3rd Qu.:8.000   3rd Qu.:326.0   3rd Qu.:180.0  
##  Max.   :33.90   Max.   :8.000   Max.   :472.0   Max.   :335.0  
##  Amperagem_circ_eletrico      Peso            RPM        Tipodecombustivel 
##  Min.   :2.760           Min.   :1.513   Min.   :14.50   Length:32         
##  1st Qu.:3.080           1st Qu.:2.581   1st Qu.:16.89   Class :character  
##  Median :3.695           Median :3.325   Median :17.71   Mode  :character  
##  Mean   :3.597           Mean   :3.217   Mean   :17.85                     
##  3rd Qu.:3.920           3rd Qu.:3.610   3rd Qu.:18.90                     
##  Max.   :4.930           Max.   :5.424   Max.   :22.90                     
##  TipodeMarcha        NumdeMarchas   NumdeValvulas  
##  Length:32          Min.   :3.000   Min.   :1.000  
##  Class :character   1st Qu.:3.000   1st Qu.:2.000  
##  Mode  :character   Median :4.000   Median :2.000  
##                     Mean   :3.688   Mean   :2.812  
##                     3rd Qu.:4.000   3rd Qu.:4.000  
##                     Max.   :5.000   Max.   :8.000
#Familias$renda_REAL =Familias$renda*1320

Familias$renda = gsub(',','.',Familias$renda)
class(Familias$renda)
## [1] "character"
Familias$renda= as.numeric(Familias$renda)
class(Familias$renda)
## [1] "numeric"
Familias$renda_real =Familias$renda*1320

Tabelas

Aqui aprendemos a criar tabelas, utilizamos o gráfico de pizza!!

Aprendemos que no R tem 600 e pouca cores e caso queira mudar elas devemos utilizar o Google e digitar #ffffff para conseguir ter acesso a mais cores

tabela_pap = table(Familias$p.a.p)
tabela_pap
## 
## Não usa     Usa 
##      42      78
# proporção
prop.table(tabela_pap)
## 
## Não usa     Usa 
##    0.35    0.65
prop.table(tabela_pap)*100
## 
## Não usa     Usa 
##      35      65
# proporção de quem mora no Parque da Figueira

tabela_local = table(Familias$local)
tabela_local
## 
##   Encosta do Morro        Monte Verde Parque da Figueira 
##                 37                 40                 43
prop.table(tabela_local)
## 
##   Encosta do Morro        Monte Verde Parque da Figueira 
##          0.3083333          0.3333333          0.3583333

Gráficos de Pizza

PAP

pie(tabela_pap)

pie(tabela_pap,col=c("black","red"))

Local

pie(tabela_local,col=c("#ff05c5","#5e207d","#c0a7c9"))

Gráfico de barras

Esses são para variaveis ordinárias. Gráficos de pizza são muito limitados. Não servem para variáveis ordináriasnem em situaçõesque tem muita categoria. Pois alem de ficar visivelmente feio, não é de fácil entendimento

Familias$educa = gsub('Sem Instrução', '1.Sem Instrução',Familias$instr)
Familias$educa = gsub('Ensino Fundamental', '2.Ensino Fundamental',Familias$educa)
Familias$educa = gsub('Ensino Medio', '3.Ensino Medio',Familias$educa)

tabela_educa = table(Familias$educa)

barplot(tabela_educa,col="#f20ac0")

barplot(tabela_educa,col=c("#f20ac0","#f20ac0", "purple"))

obs:. 32% dos chefes de familia não tem escolaridade.

Um gráfico novo

Meu primeiro gráfico waffle.

library(waffle)
## Carregando pacotes exigidos: ggplot2
parts <- c(NÃO=35, SIM=65)

waffle(parts, colors = c("#f20ac0","purple"))