#introdução

library(readxl)
Familias <- read_excel("C:/Users/Maria Helena/Desktop/Base_de_dados-master/Familias.xls")
View(Familias)

load("C:/Users/Maria Helena/Desktop/Base_de_dados-master/Bussab.RData")


load("C:/Users/Maria Helena/Desktop/Base_de_dados-master/CARROS_cat.RData")
library(readxl)
# Passo 1 # carregar arquivos do RData # importar arquivos do excel
# passo 2 # olhar as bases de dados
summary(Bussab)
##      Casado           Instr            Filhos         Renda       
##  Min.   :0.0000   Min.   :0.0000   Min.   :0.00   Min.   : 4.000  
##  1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:1.00   1st Qu.: 7.553  
##  Median :1.0000   Median :1.0000   Median :2.00   Median :10.165  
##  Mean   :0.5556   Mean   :0.8333   Mean   :1.65   Mean   :11.122  
##  3rd Qu.:1.0000   3rd Qu.:1.0000   3rd Qu.:2.00   3rd Qu.:14.060  
##  Max.   :1.0000   Max.   :2.0000   Max.   :5.00   Max.   :23.300  
##                                    NA's   :16                     
##      Idade            Proced   Casado_fator          Instru\xe7\xe3o
##  Min.   :21.00   Capital :11   Sim   :20    Fundamental:12          
##  1st Qu.:30.75   Interior:12   N\xe3o:16    M\xe9dio   :18          
##  Median :34.50   Outro   :13                Superior   : 6          
##  Mean   :35.06                                                      
##  3rd Qu.:41.00                                                      
##  Max.   :49.00                                                      
## 
#str(Bussab)
# passo 3
# Limpeza dos dados
names(Bussab)
## [1] "Casado"          "Instr"           "Filhos"          "Renda"          
## [5] "Idade"           "Proced"          "Casado_fator"    "Instru\xe7\xe3o"
names(Bussab)[8] <- "Escolaridade"

Bussab$Escolaridade <- iconv(Bussab$Escolaridade, "latin1", "UTF-8")
Bussab$Casado_fator <- iconv(Bussab$Casado_fator, "latin1", "UTF-8")

library(dplyr)
## 
## Anexando pacote: 'dplyr'
## Os seguintes objetos são mascarados por 'package:stats':
## 
##     filter, lag
## Os seguintes objetos são mascarados por 'package:base':
## 
##     intersect, setdiff, setequal, union
Bussab %>% select(Escolaridade)
##    Escolaridade
## 1   Fundamental
## 2   Fundamental
## 3   Fundamental
## 4         Médio
## 5   Fundamental
## 6   Fundamental
## 7   Fundamental
## 8   Fundamental
## 9         Médio
## 10        Médio
## 11        Médio
## 12  Fundamental
## 13        Médio
## 14  Fundamental
## 15        Médio
## 16        Médio
## 17        Médio
## 18  Fundamental
## 19     Superior
## 20        Médio
## 21        Médio
## 22        Médio
## 23  Fundamental
## 24     Superior
## 25        Médio
## 26  Fundamental
## 27        Médio
## 28        Médio
## 29        Médio
## 30        Médio
## 31     Superior
## 32        Médio
## 33     Superior
## 34     Superior
## 35        Médio
## 36     Superior
library(dplyr)
Bussab = Bussab %>% select(-Casado,-Instr)
#passo 4

#1. Quem tem escolaridade media nao precisa do P.A.P? #2. Quem mora no bairro Monte Verde nao precisa de P.A.P? #3. Quem tem escolaridade media nao eh casado? #4. Quem eh da capital nao eh casado? #5. a audi tem carros automaticos que a chevrolet? #6. os modelos 2008 sao automaticos?

#———————————————————- #Passo 5 # Operacionalizar #———————————————————- Variavel resposta (variavel dependente) P.A.P (Familias) Casado(Bussab) Transmissão (Carros)

Variáveis explicativas (variaveis independentes) escolaridade, bairro(familias) escolaridade, proc(Bussab) frabicante, ano(carros)

#————————————————————- #passo 6 # Estatísticas (qualitativas vs qualitativas) #————————————————————-

T1 = table(Familias$instr,Familias$p.a.p)
T1 
##                     
##                      Não usa Usa
##   Ensino fundamental      16  22
##   Ensino médio            19  25
##   Sem Instrução            7  31
prop.table(T1,1)
##                     
##                        Não usa       Usa
##   Ensino fundamental 0.4210526 0.5789474
##   Ensino médio       0.4318182 0.5681818
##   Sem Instrução      0.1842105 0.8157895
prop.table(T1,2)
##                     
##                        Não usa       Usa
##   Ensino fundamental 0.3809524 0.2820513
##   Ensino médio       0.4523810 0.3205128
##   Sem Instrução      0.1666667 0.3974359
round(prop.table(T1,1)*100, digits = 1)
##                     
##                      Não usa  Usa
##   Ensino fundamental    42.1 57.9
##   Ensino médio          43.2 56.8
##   Sem Instrução         18.4 81.6

#conclusao parcial #temos mais pessoas #mas o percentual

barplot(T1)

bp <- barplot(T1, col=c("skyblue", "tomato3", "lightyellow"),
              main = "Gráfico 1 - Uso do Programa Popular por Alimentação por Escolaridade",
              horiz = FALSE,beside=TRUE,
              legend.text = rownames(T1),
              args.legend = list(x = "topleft"))

#text(bp, 2, rotulo,cex=1.6,pos=3,col = "black")

percentual <- round(prop.table(T1, 1)*100, digits =1)
percentual
##                     
##                      Não usa  Usa
##   Ensino fundamental    42.1 57.9
##   Ensino médio          43.2 56.8
##   Sem Instrução         18.4 81.6
rotulo <- paste0(percentual,"%")
rotulo
## [1] "42.1%" "43.2%" "18.4%" "57.9%" "56.8%" "81.6%"
text(bp, 0, rotulo,cex=1.6,pos=3,col = "black")

T2 = table(Familias$local,Familias$p.a.p)
T2
##                     
##                      Não usa Usa
##   Encosta do Morro        12  25
##   Monte Verde             18  22
##   Parque da Figueira      12  31
barplot(T2)

prop.table(T2,1)
##                     
##                        Não usa       Usa
##   Encosta do Morro   0.3243243 0.6756757
##   Monte Verde        0.4500000 0.5500000
##   Parque da Figueira 0.2790698 0.7209302
prop.table(T2,2)
##                     
##                        Não usa       Usa
##   Encosta do Morro   0.2857143 0.3205128
##   Monte Verde        0.4285714 0.2820513
##   Parque da Figueira 0.2857143 0.3974359
percentual2 = round(prop.table(T2,1)*100,1)
percentual2
##                     
##                      Não usa  Usa
##   Encosta do Morro      32.4 67.6
##   Monte Verde           45.0 55.0
##   Parque da Figueira    27.9 72.1
rotulo2 = paste0(percentual2,"%")
rotulo2
## [1] "32.4%" "45%"   "27.9%" "67.6%" "55%"   "72.1%"
bp2 <- barplot(T2, col=c("skyblue", "tomato3", "gold"),
              main = "Gráfico 1 - Uso do Programa Popular por Alimentação Popular por Bairro",
              horiz = FALSE,beside=TRUE,
              legend.text = rownames(T2),
              args.legend = list(x = "topleft"))

text(bp, 2, rotulo2,cex=1.6,pos=3,col = "black")

T3 = table(Bussab$Escolaridade,Bussab$Casado_fator)
T3
##              
##               Não Sim
##   Fundamental   6   6
##   Médio         7  11
##   Superior      3   3
percentual3 <- round(prop.table(T3, 1)*100, digits =1)
percentual
##                     
##                      Não usa  Usa
##   Ensino fundamental    42.1 57.9
##   Ensino médio          43.2 56.8
##   Sem Instrução         18.4 81.6
prop.table(T3,1)
##              
##                     Não       Sim
##   Fundamental 0.5000000 0.5000000
##   Médio       0.3888889 0.6111111
##   Superior    0.5000000 0.5000000
prop.table(T3,2)
##              
##                  Não    Sim
##   Fundamental 0.3750 0.3000
##   Médio       0.4375 0.5500
##   Superior    0.1875 0.1500
prop.table(T3,1)*100
##              
##                    Não      Sim
##   Fundamental 50.00000 50.00000
##   Médio       38.88889 61.11111
##   Superior    50.00000 50.00000
round(prop.table(T3,1)*100, digits = 1)
##              
##                Não  Sim
##   Fundamental 50.0 50.0
##   Médio       38.9 61.1
##   Superior    50.0 50.0
barplot(T3)

bp3 <- barplot(T3, col=c("skyblue", "tomato3", "black"),
              main = "Gráfico 3 - Casados com escolaridade",
              horiz = FALSE,beside=TRUE,
              legend.text = rownames(T3),
              args.legend = list(x = "topleft"))


rotulo3 <- paste0 (percentual3, "%")
rotulo3
## [1] "50%"   "38.9%" "50%"   "50%"   "61.1%" "50%"
text(bp, 3, rotulo3,cex=2,pos=3,col = "gold")