library(rio)
data=import("DRE Lima.csv")
str(data)
## 'data.frame': 2015 obs. of 150 variables:
## $ CUESTIONARIO : int 257 392 450 493 711 729 1016 1165 1264 1736 ...
## $ cod_ie : int 3830 3822 3642 3709 3794 7623 3775 3710 3638 3839 ...
## $ ESTRATO : chr "Inicial_Urbano" "Inicial_Urbano" "Primaria_Urbano" "Inicial_Urbano" ...
## $ D_REGION : chr "DRE LIMA METROPOLITANA" "DRE LIMA METROPOLITANA" "DRE LIMA METROPOLITANA" "DRE LIMA METROPOLITANA" ...
## $ cod_area : int 1 1 1 1 1 1 1 1 1 1 ...
## $ dominio_geografico: chr "LIMA METROPOLITANA" "LIMA METROPOLITANA" "LIMA METROPOLITANA" "LIMA METROPOLITANA" ...
## $ NIVEL : int 1 1 2 1 1 1 2 2 1 3 ...
## $ FACTOR_EXPANSION : num 12.9 18.4 16.2 10.3 14.7 ...
## $ P1 : int 1 1 1 1 2 2 1 2 1 2 ...
## $ P2 : int 1 1 1 1 NA NA 1 NA 2 NA ...
## $ P3 : int NA NA NA NA NA NA NA NA 1 NA ...
## $ P4 : int 3 1 1 1 NA NA 1 NA 1 NA ...
## $ P5 : int NA 1 1 1 NA NA 1 NA 1 NA ...
## $ P1_1 : int NA 2 2 2 NA NA 1 NA 2 NA ...
## $ P1_2 : int NA 54 53 54 NA NA 50 NA 54 NA ...
## $ P1_3 : int NA 5 4 2 NA NA 9 NA 7 NA ...
## $ P1_4 : int NA 2 2 2 NA NA 2 NA 2 NA ...
## $ P1_5 : int NA 1 2 2 NA NA 2 NA 1 NA ...
## $ P1_6 : int NA 26 26 23 NA NA 170 NA 21 NA ...
## $ P1_7 : int NA 1 1 1 NA NA 2 NA 1 NA ...
## $ P1_7_esp : chr "" "" "" "" ...
## $ P1_8 : int NA 4 1 1 NA NA NA NA 1 NA ...
## $ P1_9_A_LV_HORA : int NA 3 3 4 NA NA 2 NA 3 NA ...
## $ P1_9_A_LV_MIN : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_A_SD_HORA : int NA 5 3 8 NA NA 0 NA 0 NA ...
## $ P1_9_A_SD_MIN : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_B_LV_HORA : int NA 4 2 5 NA NA 1 NA 2 NA ...
## $ P1_9_B_LV_MIN : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_B_SD_HORA : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_B_SD_MIN : int NA 30 20 10 NA NA 0 NA 45 NA ...
## $ P1_9_C_LV_HORA : int NA 2 0 1 NA NA 1 NA 1 NA ...
## $ P1_9_C_LV_MIN : int NA 0 40 0 NA NA 0 NA 0 NA ...
## $ P1_9_C_SD_HORA : int NA 0 0 0 NA NA 1 NA 0 NA ...
## $ P1_9_C_SD_MIN : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_D_LV_HORA : int NA 2 4 2 NA NA 0 NA 2 NA ...
## $ P1_9_D_LV_MIN : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_D_SD_HORA : int NA 4 5 0 NA NA 6 NA 3 NA ...
## $ P1_9_D_SD_MIN : int NA 0 0 15 NA NA 0 NA 0 NA ...
## $ P1_9_E_LV_HORA : int NA 1 0 1 NA NA 1 NA 0 NA ...
## $ P1_9_E_LV_MIN : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_9_E_SD_HORA : int NA 2 0 0 NA NA 1 NA 0 NA ...
## $ P1_9_E_SD_MIN : int NA 0 20 0 NA NA 0 NA 45 NA ...
## $ P1_10 : int NA 4 1 5 NA NA 3 NA 1 NA ...
## $ P1_11_A : int NA 1 1 0 NA NA 1 NA 1 NA ...
## $ P1_11_B : int NA 1 0 0 NA NA 0 NA 0 NA ...
## $ P1_11_C : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_11_D : int NA 0 0 0 NA NA 1 NA 1 NA ...
## $ P1_11_E : int NA 1 1 0 NA NA 1 NA 1 NA ...
## $ P1_11_F : int NA 1 1 0 NA NA 0 NA 1 NA ...
## $ P1_11_G : int NA 0 0 0 NA NA 0 NA 1 NA ...
## $ P1_11_H : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_11_I : int NA 0 0 0 NA NA 0 NA 1 NA ...
## $ P1_11_J : int NA 0 0 0 NA NA 0 NA 1 NA ...
## $ P1_11_K : int NA 1 0 1 NA NA 0 NA 1 NA ...
## $ P1_11_L : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_11_M : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_11_M_esp : chr "" "" "" "" ...
## $ P1_11_N : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_12 : int NA 1 1 3 NA NA 1 NA 1 NA ...
## $ P1_12_esp : chr "" "" "" "" ...
## $ P1_13 : int NA 1 2 1 NA NA 1 NA 1 NA ...
## $ P1_14_A : int NA 0 NA 0 NA NA 0 NA 0 NA ...
## $ P1_14_B : int NA 0 NA 0 NA NA 0 NA 0 NA ...
## $ P1_14_C : int NA 1 NA 1 NA NA 1 NA 0 NA ...
## $ P1_14_D : int NA 0 NA 0 NA NA 0 NA 0 NA ...
## $ P1_14_E : int NA 1 NA 0 NA NA 0 NA 0 NA ...
## $ P1_14_F : int NA 0 NA 0 NA NA 0 NA 1 NA ...
## $ P1_14_F_esp : chr "" "" "" "" ...
## $ P1_15_A : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_15_B : int NA 1 0 0 NA NA 0 NA 1 NA ...
## $ P1_15_C : int NA 1 1 0 NA NA 1 NA 1 NA ...
## $ P1_15_D : int NA 1 1 1 NA NA 1 NA 0 NA ...
## $ P1_15_E : int NA 0 0 0 NA NA 1 NA 0 NA ...
## $ P1_15_F : int NA 0 0 1 NA NA 0 NA 0 NA ...
## $ P1_15_G : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_15_H : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_16 : int NA 2 2 2 NA NA 2 NA 1 NA ...
## $ P1_17_A : int NA NA NA NA NA NA NA NA 0 NA ...
## $ P1_17_B : int NA NA NA NA NA NA NA NA 0 NA ...
## $ P1_17_C : int NA NA NA NA NA NA NA NA 0 NA ...
## $ P1_17_D : int NA NA NA NA NA NA NA NA 1 NA ...
## $ P1_17_D_esp : chr "" "" "" "" ...
## $ P1_18 : int NA 2 1 1 NA NA 1 NA 1 NA ...
## $ P1_19_A : int NA NA 0 1 NA NA 0 NA 1 NA ...
## $ P1_19_B : int NA NA 0 0 NA NA 0 NA 0 NA ...
## $ P1_19_C : int NA NA 1 0 NA NA 1 NA 0 NA ...
## $ P1_19_D : int NA NA 0 0 NA NA 0 NA 0 NA ...
## $ P1_19_E : int NA NA 0 0 NA NA 0 NA 0 NA ...
## $ P1_19_F : int NA NA 0 0 NA NA 0 NA 0 NA ...
## $ P1_19_F_esp : chr "" "" "" "" ...
## $ P1_20A_A : int NA 1 1 1 NA NA 1 NA 0 NA ...
## $ P1_20B_A : int NA 3 3 3 NA NA 3 NA NA NA ...
## $ P1_20A_B : int NA 1 1 1 NA NA 1 NA 0 NA ...
## $ P1_20B_B : int NA 3 3 3 NA NA 3 NA NA NA ...
## $ P1_20A_C : int NA 1 1 1 NA NA 0 NA 0 NA ...
## $ P1_20B_C : int NA 3 3 3 NA NA NA NA NA NA ...
## $ P1_20A_D : int NA 0 0 0 NA NA 0 NA 0 NA ...
## $ P1_20B_D : int NA NA NA NA NA NA NA NA NA NA ...
## $ P1_20A_E : int NA 0 0 0 NA NA 0 NA 1 NA ...
## [list output truncated]
table(data$P1_1)
##
## 1 2
## 258 1067
class(data$P1_1)
## [1] "integer"
data$P1_1=factor(data$P1_1,levels = c(1:2),labels=c("Masculino","Femenino"))
table(data$P1_1)
##
## Masculino Femenino
## 258 1067
library(DescTools)
prop.table(table(data$P1_1))*100
##
## Masculino Femenino
## 19.4717 80.5283
grafico1<-table(data$P1_1)
pie(grafico1)

str(data$P1_2)
## int [1:2015] NA 54 53 54 NA NA 50 NA 54 NA ...
class(data$P1_2)
## [1] "integer"
summary(data$P1_2)
## Min. 1st Qu. Median Mean 3rd Qu. Max. NA's
## 23.00 41.00 49.00 48.08 55.00 67.00 691
boxplot(data$P1_2)

str(data$P1_7)
## int [1:2015] NA 1 1 1 NA NA 2 NA 1 NA ...
class(data$P1_7)
## [1] "integer"
data$P1_7=factor(data$P1_7, levels = c(1:3),labels = c("Nombrado","Contratado por concurso público", "Contratado otra modalidad"))
library(DescTools)
prop.table(table(data$P1_7))*100
##
## Nombrado Contratado por concurso público
## 64.7280967 34.7432024
## Contratado otra modalidad
## 0.5287009
grafico2<-table(data$P1_7)
barplot(grafico2)

str(data$P1_8)
## int [1:2015] NA 4 1 1 NA NA NA NA 1 NA ...
class(data$P1_8)
## [1] "integer"
data$P1_8=factor(data$P1_8, levels = c(1:8),labels = c(1:8))
table(data$P1_8)
##
## 1 2 3 4 5 6 7 8
## 338 181 158 111 52 17 0 0
prop.table(table(data$P1_8))*100
##
## 1 2 3 4 5 6 7 8
## 39.439907 21.120187 18.436406 12.952159 6.067678 1.983664 0.000000 0.000000
summary(data$P1_8)
## 1 2 3 4 5 6 7 8 NA's
## 338 181 158 111 52 17 0 0 1158
grafico3<-table(data$P1_8)
barplot(grafico3)

str(data$P2_1)
## int [1:2015] NA 3 2 2 NA NA 3 NA 3 NA ...
class(data$P2_1)
## [1] "integer"
data$P2_1=factor(data$P2_1, levels = c(1:4),labels = c("Presencial","Semi", "Remoto","No precisa"))
table(data$P2_1)
##
## Presencial Semi Remoto No precisa
## 269 478 535 41
prop.table(table(data$P2_1))*100
##
## Presencial Semi Remoto No precisa
## 20.332577 36.130008 40.438398 3.099017
grafico4<-table(data$P2_1)
pie(grafico4)

str(data$P2_2)
## int [1:2015] NA 2 1 1 NA NA 1 NA 1 NA ...
class(data$P2_2)
## [1] "integer"
data$P2_2=factor(data$P2_2,levels = c(1:3),labels = c("Sí retornaria","No retornaria","No precisa"))
table(data$P2_2)
##
## Sí retornaria No retornaria No precisa
## 1018 220 85
prop.table(table(data$P2_2))*100
##
## Sí retornaria No retornaria No precisa
## 76.946334 16.628874 6.424792
grafico5<-table(data$P2_2)
pie(grafico5)

str(data$P2_3_A)
## int [1:2015] NA 1 NA NA NA NA NA NA NA NA ...
class(data$P2_3_A)
## [1] "integer"
data$P2_3_A=factor(data$P2_3_A,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_A)
##
## Si No
## 152 68
prop.table(table(data$P2_3_A))*100
##
## Si No
## 69.09091 30.90909
class(data$P2_3_B)
## [1] "integer"
data$P2_3_B=factor(data$P2_3_B,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_B)
##
## Si No
## 169 51
prop.table(table(data$P2_3_B))*100
##
## Si No
## 76.81818 23.18182
class(data$P2_3_C)
## [1] "integer"
data$P2_3_C=factor(data$P2_3_C,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_C)
##
## Si No
## 125 95
prop.table(table(data$P2_3_C))*100
##
## Si No
## 56.81818 43.18182
class(data$P2_3_D)
## [1] "integer"
data$P2_3_D=factor(data$P2_3_D,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_D)
##
## Si No
## 155 65
prop.table(table(data$P2_3_D))*100
##
## Si No
## 70.45455 29.54545
class(data$P2_3_E)
## [1] "integer"
data$P2_3_E=factor(data$P2_3_E,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_E)
##
## Si No
## 207 13
prop.table(table(data$P2_3_E))*100
##
## Si No
## 94.090909 5.909091
class(data$P2_3_F)
## [1] "integer"
data$P2_3_F=factor(data$P2_3_F,levels = c(0:1),labels = c("Si","No"))
table(data$P2_3_F)
##
## Si No
## 205 15
prop.table(table(data$P2_3_F))*100
##
## Si No
## 93.181818 6.818182