Adjunto encontrara el archivo personas.sav, el cual es una base de datos real, descargada de la pagina del Instituto Nacional de Estadisticas y Censos INEC, y que recoge variables que pretenden medir el nivel socio economico de una muestra de individuos. Como usted notara, el nombre de la mayoria de variables son solo codificaciones pero que tienen etiquetas (labels) que indican lo que se esta midiendo; por ejemplo, en la variable caso09 se observa en la etiqueta que se refiere a si la persona recibe o no un bono economico.

Importe esta base de datos a R y conteste las siguientes preguntas:

Pregunta 1.

Realice un grafico pertinente, donde se puedan visualizar las ciudades a las que pertenecen los ciudadanos encuestados y cuantos individuos fueron entrevistados en cada una de estas ciudades.

per1<-spss.get("personas.sav",use.value.labels=FALSE)
ciudades <- per$ciudad
encuestados <- fdt_cat(ciudades)
plot(encuestados, type = "fb", col = "green", v = T, main = "Encuestados")

Pregunta 2.

Realice una tabla completa de frecuencias para la variable edad. En esta tabla, se debe observar el numero de individuos que tienen una edad entre 60 y 80 anos

mayores <- fdt(per1$edad, start = 60, end = 81,h = 1)
kable(mayores)
Class limits f rf rf(%) cf cf(%)
[60,61) 299 0.0088766 0.8876618 299 0.8876618
[61,62) 174 0.0051657 0.5165657 473 1.4042275
[62,63) 223 0.0066204 0.6620354 696 2.0662629
[63,64) 223 0.0066204 0.6620354 919 2.7282983
[64,65) 183 0.0054328 0.5432846 1102 3.2715829
[65,66) 304 0.0090251 0.9025056 1406 4.1740886
[66,67) 192 0.0057000 0.5700036 1598 4.7440922
[67,68) 169 0.0050172 0.5017219 1767 5.2458140
[68,69) 181 0.0053735 0.5373471 1948 5.7831611
[69,70) 105 0.0031172 0.3117207 2053 6.0948818
[70,71) 189 0.0056110 0.5610973 2242 6.6559791
[71,72) 94 0.0027906 0.2790642 2336 6.9350433
[72,73) 142 0.0042157 0.4215651 2478 7.3566085
[73,74) 111 0.0032953 0.3295333 2589 7.6861418
[74,75) 121 0.0035922 0.3592210 2710 8.0453628
[75,76) 143 0.0042453 0.4245339 2853 8.4698967
[76,77) 107 0.0031766 0.3176582 2960 8.7875549
[77,78) 99 0.0029391 0.2939081 3059 9.0814630
[78,79) 136 0.0040375 0.4037525 3195 9.4852155
[79,80) 64 0.0019000 0.1900012 3259 9.6752167
[80,81) 107 0.0031766 0.3176582 3366 9.9928750
x
start 60
end 81
h 1
right 0

Pregunta 3.

Realice un grafico pertinente que represente la frecuencia relativa acumulada de la variable edad, trabajada en la Pregunta 2. Se debe visualizar el valor de las frecuencias relativas.

plot(mayores, type = "cfph", main = "Fr. rel acu" , xlab = "Int", ylab = "Frec", col = "Blue", v = TRUE)

Pregunta 4

Realice una tabla de frecuencias para el numero de trabajos que tiene una persona.

per$numtrab[is.na(per$numtrab)] <- 0
trabajos <- fdt(per$numtrab, start = 0, end = 5,h=1)
trabajos
##  Class limits     f   rf rf(%)    cf  cf(%)
##         [0,1) 19953 0.59 59.24 19953  59.24
##         [1,2) 13564 0.40 40.27 33517  99.50
##         [2,3)   161 0.00  0.48 33678  99.98
##         [3,4)     5 0.00  0.01 33683 100.00
##         [4,5)     0 0.00  0.00 33683 100.00

Pregunta 5

Realice un grafico pertinente que represente las frecuencias relativas encontradas en la Pregunta 4. Se deben visualizar dichas frecuencias en el grafico.

plot(trabajos, type = "rfh", main = "Histograma Fr. rel", xlab = "Int", ylab = "Frec", col = "red", v = TRUE)

Pregunta 6

Realice una tabla de frecuencias para resumir el ingreso mensual (en dolares) que tienen las personas que perciben un salario por debajo de 5200. Note que en esta variable, el numero 999999 en realidad simboliza un dato perdido NA (asi dice en el diccionario de terminos del INEC) y que, si una persona contesta que ‘No recibre ingresos en dinero’, se le debe asignar el valor de 0. Se solicita ademas que en la tabla de frecuencias se pueda observar al numero de personas que ganan por debajo del salario basico unificado, que para el caso de Ecuador es de $400.

per1$caso07[which(per1$caso07 == 999999)] <- NA
ingresos <- fdt(per1$caso07, start = 0, end = 5200, h = 400)
ingresos
##  Class limits    f   rf rf(%)    cf cf(%)
##       [0,400) 9761 0.29 28.98  9761 28.98
##     [400,800) 2756 0.08  8.18 12517 37.16
##    [800,1200)  671 0.02  1.99 13188 39.15
##   [1200,1600)  238 0.01  0.71 13426 39.86
##   [1600,2000)   45 0.00  0.13 13471 39.99
##   [2000,2400)   63 0.00  0.19 13534 40.18
##   [2400,2800)   29 0.00  0.09 13563 40.27
##   [2800,3200)   33 0.00  0.10 13596 40.36
##   [3200,3600)    9 0.00  0.03 13605 40.39
##   [3600,4000)    1 0.00  0.00 13606 40.39
##   [4000,4400)    7 0.00  0.02 13613 40.41
##   [4400,4800)    4 0.00  0.01 13617 40.43
##   [4800,5200)    4 0.00  0.01 13621 40.44

Pregunta 7

Realice un grafico pertinente que represente las frecuencias relativas encontradas en la Pregunta 6.

plot(ingresos, type = "rfh", main = "His Fr. rel", xlab = "Int", ylab = "Frec", col = "yellow", v = T)

Pregunta 8

Realice una tabla de frecuencias que permita resumir el estado civil de los individuos.

est.civil<- fdt_cat(per$p05, sort = F)
kable(est.civil)
Category f rf rf(%) cf cf(%)
Casado(a) 9161 0.3400772 34.007721 9161 34.00772
Unido / a 3876 0.1438860 14.388596 13037 48.39632
Separado /a 1323 0.0491128 4.911278 14360 53.30760
Divorciado /a 660 0.0245007 2.450070 15020 55.75767
Viudo /a 1179 0.0437672 4.376717 16199 60.13438
Soltero /a 10739 0.3986562 39.865617 26938 100.00000

Pregunta 9

Realice la misma tabla de frecuencias de la Pregunta 8, pero ahora incluya la cuenta del numero de datos perdidos que tiene la variable

levels(per$p05)
## [1] "Casado(a)"     "Unido / a"     "Separado /a"   "Divorciado /a"
## [5] "Viudo /a"      "Soltero /a"
agregados<-addNA(per$p05)#incluimos los valores NA
tfrec2 <- fdt_cat(agregados)
tfrec2