#———————————————————————- # Passo 1 - Carregar arquivos do RDATA e importar arquivos do excel #———————————————————————-]
library(readxl)
Familias <- read_excel("C:/Users/alons/Base_de_dados-master/Familias.xls")
View(Familias)
load("C:/Users/alons/Base_de_dados-master/Bussab.RData")
load("C:/Users/alons/Base_de_dados-master/CARROS_cat.RData")
#———————————————————————- # Passo 2 - Olhar as bases de dados #———————————————————————-
#———————————————————————- #Passo 3 - Limpeza dos dados #———————————————————————-
names(Bussab)
## [1] "Casado" "Instr" "Filhos" "Renda"
## [5] "Idade" "Proced" "Casado_fator" "Instru\xe7\xe3o"
names(Bussab) [8] = "Escolaridade"
Bussab$Escolaridade = iconv(Bussab$Escolaridade, "latin1","UTF-8")
Bussab$Casado_fator = iconv(Bussab$Casado_fator, "latin1","UTF-8")
library(dplyr)
##
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
##
## filter, lag
## Os seguintes objetos são mascarados por 'package:base':
##
## intersect, setdiff, setequal, union
Bussab = Bussab %>% select(-Casado,-Instr)
#———————————————————————- #Passo 4 - Perguntas de pesquisa #———————————————————————-
1.Quem tem escolaridade não precisa de PAP? 2.Quem mora no bairro Monte Verde não precisa de PAP? 3.Quem m´dia não é casdo? 4.Quem é da capital não é casado? 5.A audi tem mais carros automaticos que chevrolet? 6. Os modelos 2008 são automáticos?
#———————————————————————- #Passo 5 - Operacionalizar #———————————————————————-
variável resposta (variável dependendente) P.A.P (familias) Casado (Bussab) Transmissão (Carros)
Variáveis explicativas escolaridade, bairro (famílias) escolariade, proc (Bussab) fabricante, ano (Carros)
#———————————————————————- # Passo 6 - Estatísticas (qualitativas vs quantitativas) #———————————————————————-
T1 = table(Familias$instr,Familias$p.a.p)
round(prop.table(T1,1)*100,digits = 1)
##
## Não usa Usa
## Ensino fundamental 42.1 57.9
## Ensino médio 43.2 56.8
## Sem Instrução 18.4 81.6
#conclusão parcial
#temos mais pessoas usando o ensino fundamental
#mas o ensini médio ainda é alto
bp <- barplot(T1,col=c("skyblue","tomato3","lightyellow"),
main = "Gráfico 1 - uso do progrma alimentar de escoloaridade",
horiz = FALSE,beside = TRUE,
legend.text = rownames(T1),
args.legend = list(x = "topleft"))
percentual <- round(prop.table(T1,1)*100,digits=1)
percentual
##
## Não usa Usa
## Ensino fundamental 42.1 57.9
## Ensino médio 43.2 56.8
## Sem Instrução 18.4 81.6
rotulo <- paste0(percentual,"%")
rotulo
## [1] "42.1%" "43.2%" "18.4%" "57.9%" "56.8%" "81.6%"
text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")
#———————————————————————- #Resposta 2 #———————————————————————-
T2 = table(Familias$local,Familias$p.a.p)
T2
##
## Não usa Usa
## Encosta do Morro 12 25
## Monte Verde 18 22
## Parque da Figueira 12 31
prop.table(T2,1)*100
##
## Não usa Usa
## Encosta do Morro 32.43243 67.56757
## Monte Verde 45.00000 55.00000
## Parque da Figueira 27.90698 72.09302
prop.table(T2,2)*100
##
## Não usa Usa
## Encosta do Morro 28.57143 32.05128
## Monte Verde 42.85714 28.20513
## Parque da Figueira 28.57143 39.74359
round(prop.table(T2,1)*100,digits = 2)
##
## Não usa Usa
## Encosta do Morro 32.43 67.57
## Monte Verde 45.00 55.00
## Parque da Figueira 27.91 72.09
barplot(T2)
bp <- barplot(T2,col=c("green","purple","lightyellow"),
main = "Gráfico moradores de monte verde",
horiz = FALSE,beside = TRUE,
legend.text = rownames(T2),
args.legend = list(x = "topleft"))
percentual <- round(prop.table(T2,1)*100,digits=1)
percentual
##
## Não usa Usa
## Encosta do Morro 32.4 67.6
## Monte Verde 45.0 55.0
## Parque da Figueira 27.9 72.1
rotulo <- paste0(percentual,"%")
rotulo
## [1] "32.4%" "45%" "27.9%" "67.6%" "55%" "72.1%"
text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")
#———————————————————————- #Resposta 3 #———————————————————————-
T3 = table(Bussab$Escolaridade,Bussab$Casado_fator)
T3
##
## Não Sim
## Fundamental 6 6
## Médio 7 11
## Superior 3 3
prop.table(T3,1)*100
##
## Não Sim
## Fundamental 50.00000 50.00000
## Médio 38.88889 61.11111
## Superior 50.00000 50.00000
round(prop.table(T3,1)*100,digits = 2)
##
## Não Sim
## Fundamental 50.00 50.00
## Médio 38.89 61.11
## Superior 50.00 50.00
barplot(T3)
bp <- barplot(T3,col=c("white","orange","skyblue"),
main = "Gráfico casados por nível de escolaridade",
horiz = FALSE,beside = TRUE,
legend.text = rownames(T3),
args.legend = list(x = "topleft"))
percentual <- round(prop.table(T3,1)*100,digits=1)
percentual
##
## Não Sim
## Fundamental 50.0 50.0
## Médio 38.9 61.1
## Superior 50.0 50.0
rotulo <- paste0(percentual,"%")
rotulo
## [1] "50%" "38.9%" "50%" "50%" "61.1%" "50%"
text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")
##Conclusão