library(rio)
data=import("DRE Lima.csv")
str(data)
## 'data.frame':    2015 obs. of  150 variables:
##  $ CUESTIONARIO      : int  257 392 450 493 711 729 1016 1165 1264 1736 ...
##  $ cod_ie            : int  3830 3822 3642 3709 3794 7623 3775 3710 3638 3839 ...
##  $ ESTRATO           : chr  "Inicial_Urbano" "Inicial_Urbano" "Primaria_Urbano" "Inicial_Urbano" ...
##  $ D_REGION          : chr  "DRE LIMA METROPOLITANA" "DRE LIMA METROPOLITANA" "DRE LIMA METROPOLITANA" "DRE LIMA METROPOLITANA" ...
##  $ cod_area          : int  1 1 1 1 1 1 1 1 1 1 ...
##  $ dominio_geografico: chr  "LIMA METROPOLITANA" "LIMA METROPOLITANA" "LIMA METROPOLITANA" "LIMA METROPOLITANA" ...
##  $ NIVEL             : int  1 1 2 1 1 1 2 2 1 3 ...
##  $ FACTOR_EXPANSION  : num  12.9 18.4 16.2 10.3 14.7 ...
##  $ P1                : int  1 1 1 1 2 2 1 2 1 2 ...
##  $ P2                : int  1 1 1 1 NA NA 1 NA 2 NA ...
##  $ P3                : int  NA NA NA NA NA NA NA NA 1 NA ...
##  $ P4                : int  3 1 1 1 NA NA 1 NA 1 NA ...
##  $ P5                : int  NA 1 1 1 NA NA 1 NA 1 NA ...
##  $ P1_1              : int  NA 2 2 2 NA NA 1 NA 2 NA ...
##  $ P1_2              : int  NA 54 53 54 NA NA 50 NA 54 NA ...
##  $ P1_3              : int  NA 5 4 2 NA NA 9 NA 7 NA ...
##  $ P1_4              : int  NA 2 2 2 NA NA 2 NA 2 NA ...
##  $ P1_5              : int  NA 1 2 2 NA NA 2 NA 1 NA ...
##  $ P1_6              : int  NA 26 26 23 NA NA 170 NA 21 NA ...
##  $ P1_7              : int  NA 1 1 1 NA NA 2 NA 1 NA ...
##  $ P1_7_esp          : chr  "" "" "" "" ...
##  $ P1_8              : int  NA 4 1 1 NA NA NA NA 1 NA ...
##  $ P1_9_A_LV_HORA    : int  NA 3 3 4 NA NA 2 NA 3 NA ...
##  $ P1_9_A_LV_MIN     : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_A_SD_HORA    : int  NA 5 3 8 NA NA 0 NA 0 NA ...
##  $ P1_9_A_SD_MIN     : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_B_LV_HORA    : int  NA 4 2 5 NA NA 1 NA 2 NA ...
##  $ P1_9_B_LV_MIN     : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_B_SD_HORA    : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_B_SD_MIN     : int  NA 30 20 10 NA NA 0 NA 45 NA ...
##  $ P1_9_C_LV_HORA    : int  NA 2 0 1 NA NA 1 NA 1 NA ...
##  $ P1_9_C_LV_MIN     : int  NA 0 40 0 NA NA 0 NA 0 NA ...
##  $ P1_9_C_SD_HORA    : int  NA 0 0 0 NA NA 1 NA 0 NA ...
##  $ P1_9_C_SD_MIN     : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_D_LV_HORA    : int  NA 2 4 2 NA NA 0 NA 2 NA ...
##  $ P1_9_D_LV_MIN     : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_D_SD_HORA    : int  NA 4 5 0 NA NA 6 NA 3 NA ...
##  $ P1_9_D_SD_MIN     : int  NA 0 0 15 NA NA 0 NA 0 NA ...
##  $ P1_9_E_LV_HORA    : int  NA 1 0 1 NA NA 1 NA 0 NA ...
##  $ P1_9_E_LV_MIN     : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_9_E_SD_HORA    : int  NA 2 0 0 NA NA 1 NA 0 NA ...
##  $ P1_9_E_SD_MIN     : int  NA 0 20 0 NA NA 0 NA 45 NA ...
##  $ P1_10             : int  NA 4 1 5 NA NA 3 NA 1 NA ...
##  $ P1_11_A           : int  NA 1 1 0 NA NA 1 NA 1 NA ...
##  $ P1_11_B           : int  NA 1 0 0 NA NA 0 NA 0 NA ...
##  $ P1_11_C           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_11_D           : int  NA 0 0 0 NA NA 1 NA 1 NA ...
##  $ P1_11_E           : int  NA 1 1 0 NA NA 1 NA 1 NA ...
##  $ P1_11_F           : int  NA 1 1 0 NA NA 0 NA 1 NA ...
##  $ P1_11_G           : int  NA 0 0 0 NA NA 0 NA 1 NA ...
##  $ P1_11_H           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_11_I           : int  NA 0 0 0 NA NA 0 NA 1 NA ...
##  $ P1_11_J           : int  NA 0 0 0 NA NA 0 NA 1 NA ...
##  $ P1_11_K           : int  NA 1 0 1 NA NA 0 NA 1 NA ...
##  $ P1_11_L           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_11_M           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_11_M_esp       : chr  "" "" "" "" ...
##  $ P1_11_N           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_12             : int  NA 1 1 3 NA NA 1 NA 1 NA ...
##  $ P1_12_esp         : chr  "" "" "" "" ...
##  $ P1_13             : int  NA 1 2 1 NA NA 1 NA 1 NA ...
##  $ P1_14_A           : int  NA 0 NA 0 NA NA 0 NA 0 NA ...
##  $ P1_14_B           : int  NA 0 NA 0 NA NA 0 NA 0 NA ...
##  $ P1_14_C           : int  NA 1 NA 1 NA NA 1 NA 0 NA ...
##  $ P1_14_D           : int  NA 0 NA 0 NA NA 0 NA 0 NA ...
##  $ P1_14_E           : int  NA 1 NA 0 NA NA 0 NA 0 NA ...
##  $ P1_14_F           : int  NA 0 NA 0 NA NA 0 NA 1 NA ...
##  $ P1_14_F_esp       : chr  "" "" "" "" ...
##  $ P1_15_A           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_15_B           : int  NA 1 0 0 NA NA 0 NA 1 NA ...
##  $ P1_15_C           : int  NA 1 1 0 NA NA 1 NA 1 NA ...
##  $ P1_15_D           : int  NA 1 1 1 NA NA 1 NA 0 NA ...
##  $ P1_15_E           : int  NA 0 0 0 NA NA 1 NA 0 NA ...
##  $ P1_15_F           : int  NA 0 0 1 NA NA 0 NA 0 NA ...
##  $ P1_15_G           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_15_H           : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_16             : int  NA 2 2 2 NA NA 2 NA 1 NA ...
##  $ P1_17_A           : int  NA NA NA NA NA NA NA NA 0 NA ...
##  $ P1_17_B           : int  NA NA NA NA NA NA NA NA 0 NA ...
##  $ P1_17_C           : int  NA NA NA NA NA NA NA NA 0 NA ...
##  $ P1_17_D           : int  NA NA NA NA NA NA NA NA 1 NA ...
##  $ P1_17_D_esp       : chr  "" "" "" "" ...
##  $ P1_18             : int  NA 2 1 1 NA NA 1 NA 1 NA ...
##  $ P1_19_A           : int  NA NA 0 1 NA NA 0 NA 1 NA ...
##  $ P1_19_B           : int  NA NA 0 0 NA NA 0 NA 0 NA ...
##  $ P1_19_C           : int  NA NA 1 0 NA NA 1 NA 0 NA ...
##  $ P1_19_D           : int  NA NA 0 0 NA NA 0 NA 0 NA ...
##  $ P1_19_E           : int  NA NA 0 0 NA NA 0 NA 0 NA ...
##  $ P1_19_F           : int  NA NA 0 0 NA NA 0 NA 0 NA ...
##  $ P1_19_F_esp       : chr  "" "" "" "" ...
##  $ P1_20A_A          : int  NA 1 1 1 NA NA 1 NA 0 NA ...
##  $ P1_20B_A          : int  NA 3 3 3 NA NA 3 NA NA NA ...
##  $ P1_20A_B          : int  NA 1 1 1 NA NA 1 NA 0 NA ...
##  $ P1_20B_B          : int  NA 3 3 3 NA NA 3 NA NA NA ...
##  $ P1_20A_C          : int  NA 1 1 1 NA NA 0 NA 0 NA ...
##  $ P1_20B_C          : int  NA 3 3 3 NA NA NA NA NA NA ...
##  $ P1_20A_D          : int  NA 0 0 0 NA NA 0 NA 0 NA ...
##  $ P1_20B_D          : int  NA NA NA NA NA NA NA NA NA NA ...
##  $ P1_20A_E          : int  NA 0 0 0 NA NA 0 NA 1 NA ...
##   [list output truncated]
table(data$P1_1)
## 
##    1    2 
##  258 1067
class(data$P1_1)
## [1] "integer"
data$P1_1=factor(data$P1_1,levels = c(1:2),labels=c("Masculino","Femenino"))
table(data$P1_1)
## 
## Masculino  Femenino 
##       258      1067
library(DescTools)
prop.table(table(data$P1_1))*100
## 
## Masculino  Femenino 
##   19.4717   80.5283
grafico1<-table(data$P1_1)
pie(grafico1)

str(data$P1_2)
##  int [1:2015] NA 54 53 54 NA NA 50 NA 54 NA ...
class(data$P1_2)
## [1] "integer"
summary(data$P1_2)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max.    NA's 
##   23.00   41.00   49.00   48.08   55.00   67.00     691
boxplot(data$P1_2)

str(data$P1_7)
##  int [1:2015] NA 1 1 1 NA NA 2 NA 1 NA ...
class(data$P1_7)
## [1] "integer"
data$P1_7=factor(data$P1_7, levels = c(1:3),labels = c("Nombrado","Contratado por concurso público", "Contratado otra modalidad"))
library(DescTools)
prop.table(table(data$P1_7))*100
## 
##                        Nombrado Contratado por concurso público 
##                      64.7280967                      34.7432024 
##       Contratado otra modalidad 
##                       0.5287009
grafico2<-table(data$P1_7)
barplot(grafico2)

str(data$P1_8)
##  int [1:2015] NA 4 1 1 NA NA NA NA 1 NA ...
class(data$P1_8)
## [1] "integer"
data$P1_8=factor(data$P1_8, levels = c(1:8),labels = c(1:8))
table(data$P1_8)
## 
##   1   2   3   4   5   6   7   8 
## 338 181 158 111  52  17   0   0
prop.table(table(data$P1_8))*100
## 
##         1         2         3         4         5         6         7         8 
## 39.439907 21.120187 18.436406 12.952159  6.067678  1.983664  0.000000  0.000000
summary(data$P1_8)
##    1    2    3    4    5    6    7    8 NA's 
##  338  181  158  111   52   17    0    0 1158
grafico3<-table(data$P1_8)
barplot(grafico3)

str(data$P2_1)
##  int [1:2015] NA 3 2 2 NA NA 3 NA 3 NA ...
class(data$P2_1)
## [1] "integer"
data$P2_1=factor(data$P2_1, levels = c(1:4),labels = c("Presencial","Semi", "Remoto","No precisa"))
table(data$P2_1)
## 
## Presencial       Semi     Remoto No precisa 
##        269        478        535         41
prop.table(table(data$P2_1))*100
## 
## Presencial       Semi     Remoto No precisa 
##  20.332577  36.130008  40.438398   3.099017
grafico4<-table(data$P2_1)
pie(grafico4)

str(data$P2_2)
##  int [1:2015] NA 2 1 1 NA NA 1 NA 1 NA ...
class(data$P2_2)
## [1] "integer"
data$P2_2=factor(data$P2_2,levels = c(1:3),labels = c("Sí retornaria","No retornaria","No precisa"))
table(data$P2_2)
## 
## Sí retornaria No retornaria    No precisa 
##          1018           220            85
prop.table(table(data$P2_2))*100
## 
## Sí retornaria No retornaria    No precisa 
##     76.946334     16.628874      6.424792
grafico5<-table(data$P2_2)
pie(grafico5)

str(data$P2_3_A)
##  int [1:2015] NA 1 NA NA NA NA NA NA NA NA ...
class(data$P2_3_A)
## [1] "integer"
data$P2_3_A=factor(data$P2_3_A,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_A)
## 
##  Si  No 
## 152  68
prop.table(table(data$P2_3_A))*100
## 
##       Si       No 
## 69.09091 30.90909
class(data$P2_3_B)
## [1] "integer"
data$P2_3_B=factor(data$P2_3_B,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_B)
## 
##  Si  No 
## 169  51
prop.table(table(data$P2_3_B))*100
## 
##       Si       No 
## 76.81818 23.18182
class(data$P2_3_C)
## [1] "integer"
data$P2_3_C=factor(data$P2_3_C,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_C)
## 
##  Si  No 
## 125  95
prop.table(table(data$P2_3_C))*100
## 
##       Si       No 
## 56.81818 43.18182
class(data$P2_3_D)
## [1] "integer"
data$P2_3_D=factor(data$P2_3_D,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_D)
## 
##  Si  No 
## 155  65
prop.table(table(data$P2_3_D))*100
## 
##       Si       No 
## 70.45455 29.54545
class(data$P2_3_E)
## [1] "integer"
data$P2_3_E=factor(data$P2_3_E,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_E)
## 
##  Si  No 
## 207  13
prop.table(table(data$P2_3_E))*100
## 
##        Si        No 
## 94.090909  5.909091
class(data$P2_3_F)
## [1] "integer"
data$P2_3_F=factor(data$P2_3_F,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_F)
## 
##  Si  No 
## 205  15
prop.table(table(data$P2_3_F))*100
## 
##        Si        No 
## 93.181818  6.818182