rm(list=ls())
setwd("/home/daniel/Dropbox/U CENTRAL/02 2020/01 Primer semestre 2020/Analisis de datos cuantitativos I/Clases/02") #Fijar directorio de trabajo
library(foreign) #llamar paquete para abrir bases de datos en formato SPSS
library(car) #llamar paquete de administración de bases de datos
## Loading required package: carData

1. Descargar y abrir base de datos.

CEP84 <- read.spss("/home/daniel/Dropbox/U CENTRAL/02 2020/01 Primer semestre 2020/Analisis de datos cuantitativos I/Bases de datos/CEP84/Encuesta CEP 84 Dic 2019 v1.sav",
                   to.data.frame = TRUE) #Exportar base de datos
names(CEP84) #Ver los nombres de las columnas (variables)
##   [1] "ZONA"         "PROVINCIA_BD" "COMUNA_BD"    "UMP"         
##   [5] "FECHAFIN"     "REGION"       "SV_1"         "SV_2"        
##   [9] "SV3_1"        "SV3_2"        "SV3_3"        "SV3_4"       
##  [13] "SV3_5"        "SV3_6"        "SV_4"         "MB_P1_1"     
##  [17] "MB_P1_2"      "MB_P1_3"      "MB_P2"        "MB_P3"       
##  [21] "MB_P4"        "MB_P5"        "MB_P6"        "MB_P7"       
##  [25] "MB_P8"        "MB_P8A"       "MB_P9"        "MB_P9A"      
##  [29] "MB_P10_A"     "MB_P10_B"     "MB_P10_C"     "MB_P10_D"    
##  [33] "MB_P10_E"     "MB_P10_F"     "MB_P10_G"     "MB_P10_H"    
##  [37] "MB_P10_I"     "MB_P10_J"     "MB_P10_K"     "MB_P10_L"    
##  [41] "MB_P10_M"     "MB_P10_N"     "MB_P10_O"     "MB_P10_P"    
##  [45] "MB_P10_Q"     "MB_P10_R"     "MB_P10_S"     "MB_P10_T"    
##  [49] "MB_P10_U"     "MB_P10_V"     "MB_P10_W"     "MB_P10_X"    
##  [53] "MB_P10_Y"     "MB_P10_Z"     "MB_P10_AA"    "MB_P10_BB"   
##  [57] "MB_P10_CC"    "MB_P10_DD"    "MB_P11_1"     "MB_P11_2"    
##  [61] "MB_P11_3"     "MB_P11_4"     "MB_P11_5"     "MB_P11_6"    
##  [65] "MB_P11_7"     "MB_P11_8"     "MB_P11_9"     "MB_P11_10"   
##  [69] "MB_P11_11"    "MB_P11_12"    "MB_P11_13"    "MB_P11_14"   
##  [73] "MB_P11_15"    "MB_P11_16"    "MB_P11_17"    "MB_P12_1"    
##  [77] "MB_P12_2"     "MB_P13_1"     "MB_P13_2"     "MB_P13_3"    
##  [81] "MB_P13_4"     "MB_P13_5"     "MB_P13_6"     "MB_P13_7"    
##  [85] "MB_P14"       "ESP_1"        "ESP_2"        "ESP_3"       
##  [89] "ESP_4"        "ESP_5_1"      "ESP_5_2"      "ESP_5_3"     
##  [93] "ESP_5_4"      "ESP_6_1"      "ESP_6_2"      "ESP_7"       
##  [97] "ESP_8_1"      "ESP_8_2"      "ESP_8_3"      "ESP_8_4"     
## [101] "ESP_8_5"      "ESP_8_6"      "ESP_8_7"      "ESP_8_8"     
## [105] "ESP_9_1"      "ESP_9_2"      "ESP_10_1"     "ESP_10_2"    
## [109] "ESP_11"       "ESP_12"       "ESP_13"       "ESP_14A1"    
## [113] "ESP_14A2"     "ESP_14B1"     "ESP_14B2"     "ESP_14C1"    
## [117] "ESP_14C2"     "ESP_15A1"     "ESP_15A2"     "ESP_15B1"    
## [121] "ESP_15B2"     "ESP_15C1"     "ESP_15C2"     "ESP_16_1"    
## [125] "ESP_16_2"     "ESP_17_1"     "ESP_17_2"     "ESP_17_3"    
## [129] "ESP_18_1"     "ESP_18_2"     "ESP_18_3"     "ESP_18_4"    
## [133] "ESP_18_5"     "ESP_18_6"     "ESP_19A"      "ESP_19B"     
## [137] "ESP_20"       "ESP_21"       "ESP_22_1"     "ESP_22_2"    
## [141] "ESP_22_3"     "ESP_22_4"     "ESP_22_5"     "ESP_22_6"    
## [145] "ESP_22_7"     "ESP_23_1"     "ESP_23_2"     "ESP_23_3"    
## [149] "ESP_23_4"     "ESP_23_5"     "ESP_23_6"     "ESP_23_7"    
## [153] "ESP_24"       "ESP_25"       "ESP_26"       "ESP_27"      
## [157] "ESP_28"       "ESP_29"       "ESP_30_1"     "ESP_30_2"    
## [161] "ESP_30_3"     "ESP_30_4"     "ESP_31"       "ESP_32"      
## [165] "ESP_33"       "ESP_34"       "ESP_35"       "ESP_36"      
## [169] "ESP_38A"      "ESP_38B"      "ESP_39"       "ESP_40"      
## [173] "ESP_41_1"     "ESP_41_2"     "ESP_41_3"     "ESP_41_4"    
## [177] "ESP_41_5"     "ESP_42_1"     "ESP_42_2"     "ESP_42_3"    
## [181] "ESP_43"       "ESP_44"       "ESP_45"       "ESP_46"      
## [185] "ESP_47"       "ESP_48A"      "ESP_48B"      "ESP_49_1"    
## [189] "ESP_49_2"     "ESP_49_3"     "ESP_49_4"     "DS_P1"       
## [193] "DS_P2_EXACTA" "DS_P2A_DIA"   "DS_P2A_MES"   "DS_P2A_ANO"  
## [197] "DS_P3"        "DS_P4"        "DS_P5"        "DS_P6"       
## [201] "DS_P6_OTRO"   "DS_P7"        "DS_P8"        "DS_P9"       
## [205] "DS_P10"       "DS_P11"       "DS_P12"       "DS_P13"      
## [209] "DS_P14"       "DS_P15A"      "DS_P15B"      "DS_P16"      
## [213] "DS_P17"       "DS_P18"       "DS_P19"       "DS_P20"      
## [217] "DS_P21"       "DS_P22"       "DS_P22B"      "DS_P23"      
## [221] "DS_P23B"      "DS_P24"       "DS_P25"       "DS_P26A"     
## [225] "DS_P26A_OTRO" "DS_P26B"      "DS_P26B_OTRO" "DS_P26C"     
## [229] "DS_P26C_OTRO" "DS_P27"       "DS_P28"       "DS_P29"      
## [233] "DS_P30"       "DS_P31"       "DS_P32"       "DS_P33"      
## [237] "DS_P34"       "DS_P35"       "DS_P36_1"     "DS_P36_2"    
## [241] "DS_P36_3"     "DS_P36_4"     "DS_P36_5"     "DS_P36_6"    
## [245] "DS_P36_7"     "DS_P36_8"     "DS_P36_9"     "DS_P36_10"   
## [249] "DS_P36_11"    "DS_P36_12"    "DS_P36_13"    "DS_P36_14"   
## [253] "DS_P36_15"    "DS_P36_16"    "DS_P36_17"    "DS_P37_1"    
## [257] "DS_P37_2"     "PONDERADOR"

2. Recodificar variable Edad en Grupos de Edad (0-14, 15-29, 30-59, 60 y más)

Primero, es necesario gestionar un poco los datos.

table(CEP84$DS_P2_EXACTA) #Ver variable edad
## 
##  18  19  20  21  22  23  24  25  26  27  28  29  30  31  32  33  34  35 
##  30  12  17  19  13  29  27  31  22  25  20  33  24  33  27  28  24  21 
##  36  37  38  39  40  41  42  43  44  45  46  47  48  49  50  51  52  53 
##  27  19  27  14  25  21  25  17  19  34  20  24  33  21  27  20  41  23 
##  54  55  56  57  58  59  60  61  62  63  64  65  66  67  68  69  70  71 
##  25  25  32  36  39  35  31  16  22  28  21  24  21  15  13  25  29  17 
##  72  73  74  75  76  77  78  79  80  81  82  83  84  85  86  87  88  89 
##  19  13  13  14  14  16  12  10   9   7  12   6   7   2   3   0   2   6 
##  90  91  92  93  94  95  96  97  98  99 100 
##   2   1   0   1   0   0   0   0   0   1   0
class(CEP84$DS_P2_EXACTA) #Conocer qué tipo de vector es (factor)
## [1] "factor"
CEP84$edad <- as.numeric(CEP84$DS_P2_EXACTA)+17 #Convierto a vector numérico, le sumo 17 para mantener la coherencia de la variable edad y lo guardo en una nueva variable llamada "edad"

Ahora sí, vamos a la recodificación.

3.Calcular estadísticos descriptivos para la variable Edad

summary(CEP84$edad) #Mínimo, cuariles, mediana, media y máximo
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##   18.00   33.00   49.00   48.58   62.00   99.00
sd(CEP84$edad) #Desviación estándar
## [1] 17.85131

4. Calcular tabla de frecuencia para la variable Grupos de Edad

table(CEP84$grupos_edad) #tabla de frecuencias simple
## 
##         Adultos Adultos mayores         Jóvenes 
##             786             432             278

5. Calcular tabla de frecuencia para la variable Aprobación al gobierno

table(CEP84$MB_P7) #Una primera mirada
## 
##                  1. - APRUEBA               2. - DESAPRUEBA 
##                            95                          1216 
## 3. - NO APRUEBA NI DESAPRUEBA                  8. - No sabe 
##                           156                            18 
##              9. - No contesta 
##                            11
#Decido dejar los No sabe y No contesta como NA (perdido)
CEP84$aprobacion <- recode(CEP84$MB_P7, '"1. - APRUEBA"="Aprueba al gobierno"; 
                           "2. - DESAPRUEBA"="Desaprueba al gobierno"; 
                           "3. - NO APRUEBA NI DESAPRUEBA"="No aprueba ni desaprueba al gobierno"; 
                           "8. - No sabe"= NA; 
                           "9. - No contesta"= NA')

table(CEP84$aprobacion) #Tabla de frecuencia
## 
##                  Aprueba al gobierno               Desaprueba al gobierno 
##                                   95                                 1216 
## No aprueba ni desaprueba al gobierno 
##                                  156
#Tabla de porcentajes
tabla1 <- table(CEP84$aprobacion) #Tabla de frecuencia
round(prop.table(tabla1),4)*100
## 
##                  Aprueba al gobierno               Desaprueba al gobierno 
##                                 6.48                                82.89 
## No aprueba ni desaprueba al gobierno 
##                                10.63

5.Calcular tablas cruzada o de contingencia para la variable Grupos de Edad y Aprobación al gobierno

table(CEP84$aprobacion, CEP84$grupos_edad) #Tabla cruzada de frecuencias
##                                       
##                                        Adultos Adultos mayores Jóvenes
##   Aprueba al gobierno                       44              40      11
##   Desaprueba al gobierno                   650             323     243
##   No aprueba ni desaprueba al gobierno      79              57      20
#Tabla cruzada de porcentajes
tabla2 <- table(CEP84$aprobacion, CEP84$grupos_edad)
round(prop.table(tabla2,2),4)*100
##                                       
##                                        Adultos Adultos mayores Jóvenes
##   Aprueba al gobierno                     5.69            9.52    4.01
##   Desaprueba al gobierno                 84.09           76.90   88.69
##   No aprueba ni desaprueba al gobierno   10.22           13.57    7.30