rm(list=ls())
setwd("/home/daniel/Dropbox/U CENTRAL/02 2020/01 Primer semestre 2020/Analisis de datos cuantitativos I/Clases/02") #Fijar directorio de trabajo
library(foreign) #llamar paquete para abrir bases de datos en formato SPSS
library(car) #llamar paquete de administración de bases de datos
## Loading required package: carData
1. Descargar y abrir base de datos.
CEP84 <- read.spss("/home/daniel/Dropbox/U CENTRAL/02 2020/01 Primer semestre 2020/Analisis de datos cuantitativos I/Bases de datos/CEP84/Encuesta CEP 84 Dic 2019 v1.sav",
to.data.frame = TRUE) #Exportar base de datos
names(CEP84) #Ver los nombres de las columnas (variables)
## [1] "ZONA" "PROVINCIA_BD" "COMUNA_BD" "UMP"
## [5] "FECHAFIN" "REGION" "SV_1" "SV_2"
## [9] "SV3_1" "SV3_2" "SV3_3" "SV3_4"
## [13] "SV3_5" "SV3_6" "SV_4" "MB_P1_1"
## [17] "MB_P1_2" "MB_P1_3" "MB_P2" "MB_P3"
## [21] "MB_P4" "MB_P5" "MB_P6" "MB_P7"
## [25] "MB_P8" "MB_P8A" "MB_P9" "MB_P9A"
## [29] "MB_P10_A" "MB_P10_B" "MB_P10_C" "MB_P10_D"
## [33] "MB_P10_E" "MB_P10_F" "MB_P10_G" "MB_P10_H"
## [37] "MB_P10_I" "MB_P10_J" "MB_P10_K" "MB_P10_L"
## [41] "MB_P10_M" "MB_P10_N" "MB_P10_O" "MB_P10_P"
## [45] "MB_P10_Q" "MB_P10_R" "MB_P10_S" "MB_P10_T"
## [49] "MB_P10_U" "MB_P10_V" "MB_P10_W" "MB_P10_X"
## [53] "MB_P10_Y" "MB_P10_Z" "MB_P10_AA" "MB_P10_BB"
## [57] "MB_P10_CC" "MB_P10_DD" "MB_P11_1" "MB_P11_2"
## [61] "MB_P11_3" "MB_P11_4" "MB_P11_5" "MB_P11_6"
## [65] "MB_P11_7" "MB_P11_8" "MB_P11_9" "MB_P11_10"
## [69] "MB_P11_11" "MB_P11_12" "MB_P11_13" "MB_P11_14"
## [73] "MB_P11_15" "MB_P11_16" "MB_P11_17" "MB_P12_1"
## [77] "MB_P12_2" "MB_P13_1" "MB_P13_2" "MB_P13_3"
## [81] "MB_P13_4" "MB_P13_5" "MB_P13_6" "MB_P13_7"
## [85] "MB_P14" "ESP_1" "ESP_2" "ESP_3"
## [89] "ESP_4" "ESP_5_1" "ESP_5_2" "ESP_5_3"
## [93] "ESP_5_4" "ESP_6_1" "ESP_6_2" "ESP_7"
## [97] "ESP_8_1" "ESP_8_2" "ESP_8_3" "ESP_8_4"
## [101] "ESP_8_5" "ESP_8_6" "ESP_8_7" "ESP_8_8"
## [105] "ESP_9_1" "ESP_9_2" "ESP_10_1" "ESP_10_2"
## [109] "ESP_11" "ESP_12" "ESP_13" "ESP_14A1"
## [113] "ESP_14A2" "ESP_14B1" "ESP_14B2" "ESP_14C1"
## [117] "ESP_14C2" "ESP_15A1" "ESP_15A2" "ESP_15B1"
## [121] "ESP_15B2" "ESP_15C1" "ESP_15C2" "ESP_16_1"
## [125] "ESP_16_2" "ESP_17_1" "ESP_17_2" "ESP_17_3"
## [129] "ESP_18_1" "ESP_18_2" "ESP_18_3" "ESP_18_4"
## [133] "ESP_18_5" "ESP_18_6" "ESP_19A" "ESP_19B"
## [137] "ESP_20" "ESP_21" "ESP_22_1" "ESP_22_2"
## [141] "ESP_22_3" "ESP_22_4" "ESP_22_5" "ESP_22_6"
## [145] "ESP_22_7" "ESP_23_1" "ESP_23_2" "ESP_23_3"
## [149] "ESP_23_4" "ESP_23_5" "ESP_23_6" "ESP_23_7"
## [153] "ESP_24" "ESP_25" "ESP_26" "ESP_27"
## [157] "ESP_28" "ESP_29" "ESP_30_1" "ESP_30_2"
## [161] "ESP_30_3" "ESP_30_4" "ESP_31" "ESP_32"
## [165] "ESP_33" "ESP_34" "ESP_35" "ESP_36"
## [169] "ESP_38A" "ESP_38B" "ESP_39" "ESP_40"
## [173] "ESP_41_1" "ESP_41_2" "ESP_41_3" "ESP_41_4"
## [177] "ESP_41_5" "ESP_42_1" "ESP_42_2" "ESP_42_3"
## [181] "ESP_43" "ESP_44" "ESP_45" "ESP_46"
## [185] "ESP_47" "ESP_48A" "ESP_48B" "ESP_49_1"
## [189] "ESP_49_2" "ESP_49_3" "ESP_49_4" "DS_P1"
## [193] "DS_P2_EXACTA" "DS_P2A_DIA" "DS_P2A_MES" "DS_P2A_ANO"
## [197] "DS_P3" "DS_P4" "DS_P5" "DS_P6"
## [201] "DS_P6_OTRO" "DS_P7" "DS_P8" "DS_P9"
## [205] "DS_P10" "DS_P11" "DS_P12" "DS_P13"
## [209] "DS_P14" "DS_P15A" "DS_P15B" "DS_P16"
## [213] "DS_P17" "DS_P18" "DS_P19" "DS_P20"
## [217] "DS_P21" "DS_P22" "DS_P22B" "DS_P23"
## [221] "DS_P23B" "DS_P24" "DS_P25" "DS_P26A"
## [225] "DS_P26A_OTRO" "DS_P26B" "DS_P26B_OTRO" "DS_P26C"
## [229] "DS_P26C_OTRO" "DS_P27" "DS_P28" "DS_P29"
## [233] "DS_P30" "DS_P31" "DS_P32" "DS_P33"
## [237] "DS_P34" "DS_P35" "DS_P36_1" "DS_P36_2"
## [241] "DS_P36_3" "DS_P36_4" "DS_P36_5" "DS_P36_6"
## [245] "DS_P36_7" "DS_P36_8" "DS_P36_9" "DS_P36_10"
## [249] "DS_P36_11" "DS_P36_12" "DS_P36_13" "DS_P36_14"
## [253] "DS_P36_15" "DS_P36_16" "DS_P36_17" "DS_P37_1"
## [257] "DS_P37_2" "PONDERADOR"
2. Recodificar variable Edad en Grupos de Edad (0-14, 15-29, 30-59, 60 y más)
Primero, es necesario gestionar un poco los datos.
table(CEP84$DS_P2_EXACTA) #Ver variable edad
##
## 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35
## 30 12 17 19 13 29 27 31 22 25 20 33 24 33 27 28 24 21
## 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53
## 27 19 27 14 25 21 25 17 19 34 20 24 33 21 27 20 41 23
## 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71
## 25 25 32 36 39 35 31 16 22 28 21 24 21 15 13 25 29 17
## 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89
## 19 13 13 14 14 16 12 10 9 7 12 6 7 2 3 0 2 6
## 90 91 92 93 94 95 96 97 98 99 100
## 2 1 0 1 0 0 0 0 0 1 0
class(CEP84$DS_P2_EXACTA) #Conocer qué tipo de vector es (factor)
## [1] "factor"
CEP84$edad <- as.numeric(CEP84$DS_P2_EXACTA)+17 #Convierto a vector numérico, le sumo 17 para mantener la coherencia de la variable edad y lo guardo en una nueva variable llamada "edad"
Ahora sí, vamos a la recodificación.
3.Calcular estadísticos descriptivos para la variable Edad
summary(CEP84$edad) #Mínimo, cuariles, mediana, media y máximo
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 18.00 33.00 49.00 48.58 62.00 99.00
sd(CEP84$edad) #Desviación estándar
## [1] 17.85131
4. Calcular tabla de frecuencia para la variable Grupos de Edad
table(CEP84$grupos_edad) #tabla de frecuencias simple
##
## Adultos Adultos mayores Jóvenes
## 786 432 278
5. Calcular tabla de frecuencia para la variable Aprobación al gobierno
table(CEP84$MB_P7) #Una primera mirada
##
## 1. - APRUEBA 2. - DESAPRUEBA
## 95 1216
## 3. - NO APRUEBA NI DESAPRUEBA 8. - No sabe
## 156 18
## 9. - No contesta
## 11
#Decido dejar los No sabe y No contesta como NA (perdido)
CEP84$aprobacion <- recode(CEP84$MB_P7, '"1. - APRUEBA"="Aprueba al gobierno";
"2. - DESAPRUEBA"="Desaprueba al gobierno";
"3. - NO APRUEBA NI DESAPRUEBA"="No aprueba ni desaprueba al gobierno";
"8. - No sabe"= NA;
"9. - No contesta"= NA')
table(CEP84$aprobacion) #Tabla de frecuencia
##
## Aprueba al gobierno Desaprueba al gobierno
## 95 1216
## No aprueba ni desaprueba al gobierno
## 156
#Tabla de porcentajes
tabla1 <- table(CEP84$aprobacion) #Tabla de frecuencia
round(prop.table(tabla1),4)*100
##
## Aprueba al gobierno Desaprueba al gobierno
## 6.48 82.89
## No aprueba ni desaprueba al gobierno
## 10.63
5.Calcular tablas cruzada o de contingencia para la variable Grupos de Edad y Aprobación al gobierno
table(CEP84$aprobacion, CEP84$grupos_edad) #Tabla cruzada de frecuencias
##
## Adultos Adultos mayores Jóvenes
## Aprueba al gobierno 44 40 11
## Desaprueba al gobierno 650 323 243
## No aprueba ni desaprueba al gobierno 79 57 20
#Tabla cruzada de porcentajes
tabla2 <- table(CEP84$aprobacion, CEP84$grupos_edad)
round(prop.table(tabla2,2),4)*100
##
## Adultos Adultos mayores Jóvenes
## Aprueba al gobierno 5.69 9.52 4.01
## Desaprueba al gobierno 84.09 76.90 88.69
## No aprueba ni desaprueba al gobierno 10.22 13.57 7.30