#———————————————————————- # Passo 1 - Carregar arquivos do RDATA e importar arquivos do excel #———————————————————————-]

library(readxl)
Familias <- read_excel("C:/Users/alons/Base_de_dados-master/Familias.xls")
View(Familias)

load("C:/Users/alons/Base_de_dados-master/Bussab.RData")

load("C:/Users/alons/Base_de_dados-master/CARROS_cat.RData")

#———————————————————————- # Passo 2 - Olhar as bases de dados #———————————————————————-

#———————————————————————- #Passo 3 - Limpeza dos dados #———————————————————————-

names(Bussab)
## [1] "Casado"          "Instr"           "Filhos"          "Renda"          
## [5] "Idade"           "Proced"          "Casado_fator"    "Instru\xe7\xe3o"
names(Bussab) [8] = "Escolaridade"

Bussab$Escolaridade = iconv(Bussab$Escolaridade, "latin1","UTF-8")
Bussab$Casado_fator = iconv(Bussab$Casado_fator, "latin1","UTF-8")

library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
Bussab = Bussab %>% select(-Casado,-Instr)

#———————————————————————- #Passo 4 - Perguntas de pesquisa #———————————————————————-

1.Quem tem escolaridade não precisa de PAP? 2.Quem mora no bairro Monte Verde não precisa de PAP? 3.Quem m´dia não é casdo? 4.Quem é da capital não é casado? 5.A audi tem mais carros automaticos que chevrolet? 6. Os modelos 2008 são automáticos?

#———————————————————————- #Passo 5 - Operacionalizar #———————————————————————-

variável resposta (variável dependendente) P.A.P (familias) Casado (Bussab) Transmissão (Carros)

Variáveis explicativas escolaridade, bairro (famílias) escolariade, proc (Bussab) fabricante, ano (Carros)

#———————————————————————- # Passo 6 - Estatísticas (qualitativas vs quantitativas) #———————————————————————-

T1 = table(Familias$instr,Familias$p.a.p)

round(prop.table(T1,1)*100,digits = 1)
##                     
##                      Não usa  Usa
##   Ensino fundamental    42.1 57.9
##   Ensino médio          43.2 56.8
##   Sem Instrução         18.4 81.6
#conclusão parcial
#temos mais pessoas usando o ensino fundamental
#mas o ensini médio ainda é alto

bp <- barplot(T1,col=c("skyblue","tomato3","lightyellow"),
main = "Gráfico 1 - uso do progrma alimentar de escoloaridade",
horiz = FALSE,beside = TRUE,
legend.text = rownames(T1),
args.legend = list(x = "topleft"))

percentual <- round(prop.table(T1,1)*100,digits=1)
percentual
##                     
##                      Não usa  Usa
##   Ensino fundamental    42.1 57.9
##   Ensino médio          43.2 56.8
##   Sem Instrução         18.4 81.6
rotulo <- paste0(percentual,"%")
rotulo
## [1] "42.1%" "43.2%" "18.4%" "57.9%" "56.8%" "81.6%"
text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")

#———————————————————————- #Resposta 2 #———————————————————————-

T2 = table(Familias$local,Familias$p.a.p)
T2
##                     
##                      Não usa Usa
##   Encosta do Morro        12  25
##   Monte Verde             18  22
##   Parque da Figueira      12  31
prop.table(T2,1)*100
##                     
##                       Não usa      Usa
##   Encosta do Morro   32.43243 67.56757
##   Monte Verde        45.00000 55.00000
##   Parque da Figueira 27.90698 72.09302
prop.table(T2,2)*100
##                     
##                       Não usa      Usa
##   Encosta do Morro   28.57143 32.05128
##   Monte Verde        42.85714 28.20513
##   Parque da Figueira 28.57143 39.74359
round(prop.table(T2,1)*100,digits = 2)
##                     
##                      Não usa   Usa
##   Encosta do Morro     32.43 67.57
##   Monte Verde          45.00 55.00
##   Parque da Figueira   27.91 72.09
barplot(T2)

bp <- barplot(T2,col=c("green","purple","lightyellow"),
main = "Gráfico moradores de monte verde",
horiz = FALSE,beside = TRUE,
legend.text = rownames(T2),
args.legend = list(x = "topleft"))

percentual <- round(prop.table(T2,1)*100,digits=1)
percentual
##                     
##                      Não usa  Usa
##   Encosta do Morro      32.4 67.6
##   Monte Verde           45.0 55.0
##   Parque da Figueira    27.9 72.1
rotulo <- paste0(percentual,"%")
rotulo
## [1] "32.4%" "45%"   "27.9%" "67.6%" "55%"   "72.1%"
text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")

#———————————————————————- #Resposta 3 #———————————————————————-

T3 = table(Bussab$Escolaridade,Bussab$Casado_fator)
T3
##              
##               Não Sim
##   Fundamental   6   6
##   Médio         7  11
##   Superior      3   3
prop.table(T3,1)*100
##              
##                    Não      Sim
##   Fundamental 50.00000 50.00000
##   Médio       38.88889 61.11111
##   Superior    50.00000 50.00000
round(prop.table(T3,1)*100,digits = 2)
##              
##                 Não   Sim
##   Fundamental 50.00 50.00
##   Médio       38.89 61.11
##   Superior    50.00 50.00
barplot(T3)

bp <- barplot(T3,col=c("white","orange","skyblue"),
main = "Gráfico casados por nível de escolaridade",              
horiz = FALSE,beside = TRUE,              
legend.text = rownames(T3),
args.legend = list(x = "topleft"))

percentual <- round(prop.table(T3,1)*100,digits=1)
percentual
##              
##                Não  Sim
##   Fundamental 50.0 50.0
##   Médio       38.9 61.1
##   Superior    50.0 50.0
rotulo <- paste0(percentual,"%")
rotulo
## [1] "50%"   "38.9%" "50%"   "50%"   "61.1%" "50%"
text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")

##Conclusão