Adjunto encontrara el archivo personas.sav, el cual es una base de datos real, descargada de la pagina del Instituto Nacional de Estadisticas y Censos INEC, y que recoge variables que pretenden medir el nivel socio economico de una muestra de individuos. Como usted notara, el nombre de la mayoria de variables son solo codificaciones pero que tienen etiquetas (labels) que indican lo que se esta midiendo; por ejemplo, en la variable caso09 se observa en la etiqueta que se refiere a si la persona recibe o no un bono economico.
Importe esta base de datos a R y conteste las siguientes preguntas:
Realice un grafico pertinente, donde se puedan visualizar las ciudades a las que pertenecen los ciudadanos encuestados y cuantos individuos fueron entrevistados en cada una de estas ciudades.
per1<-spss.get("personas.sav",use.value.labels=FALSE)
ciudades <- per$ciudad
encuestados <- fdt_cat(ciudades)
plot(encuestados, type = "fb", col = "green", v = T, main = "Encuestados")
Realice una tabla completa de frecuencias para la variable edad. En esta tabla, se debe observar el numero de individuos que tienen una edad entre 60 y 80 anos
mayores <- fdt(per1$edad, start = 60, end = 81,h = 1)
kable(mayores)
|
|
Realice un grafico pertinente que represente la frecuencia relativa acumulada de la variable edad, trabajada en la Pregunta 2. Se debe visualizar el valor de las frecuencias relativas.
plot(mayores, type = "cfph", main = "Fr. rel acu" , xlab = "Int", ylab = "Frec", col = "Blue", v = TRUE)
Realice una tabla de frecuencias para el numero de trabajos que tiene una persona.
per$numtrab[is.na(per$numtrab)] <- 0
trabajos <- fdt(per$numtrab, start = 0, end = 5,h=1)
trabajos
## Class limits f rf rf(%) cf cf(%)
## [0,1) 19953 0.59 59.24 19953 59.24
## [1,2) 13564 0.40 40.27 33517 99.50
## [2,3) 161 0.00 0.48 33678 99.98
## [3,4) 5 0.00 0.01 33683 100.00
## [4,5) 0 0.00 0.00 33683 100.00
Realice un grafico pertinente que represente las frecuencias relativas encontradas en la Pregunta 4. Se deben visualizar dichas frecuencias en el grafico.
plot(trabajos, type = "rfh", main = "Histograma Fr. rel", xlab = "Int", ylab = "Frec", col = "red", v = TRUE)
Realice una tabla de frecuencias para resumir el ingreso mensual (en dolares) que tienen las personas que perciben un salario por debajo de 5200. Note que en esta variable, el numero 999999 en realidad simboliza un dato perdido NA (asi dice en el diccionario de terminos del INEC) y que, si una persona contesta que ‘No recibre ingresos en dinero’, se le debe asignar el valor de 0. Se solicita ademas que en la tabla de frecuencias se pueda observar al numero de personas que ganan por debajo del salario basico unificado, que para el caso de Ecuador es de $400.
per1$caso07[which(per1$caso07 == 999999)] <- NA
ingresos <- fdt(per1$caso07, start = 0, end = 5200, h = 400)
ingresos
## Class limits f rf rf(%) cf cf(%)
## [0,400) 9761 0.29 28.98 9761 28.98
## [400,800) 2756 0.08 8.18 12517 37.16
## [800,1200) 671 0.02 1.99 13188 39.15
## [1200,1600) 238 0.01 0.71 13426 39.86
## [1600,2000) 45 0.00 0.13 13471 39.99
## [2000,2400) 63 0.00 0.19 13534 40.18
## [2400,2800) 29 0.00 0.09 13563 40.27
## [2800,3200) 33 0.00 0.10 13596 40.36
## [3200,3600) 9 0.00 0.03 13605 40.39
## [3600,4000) 1 0.00 0.00 13606 40.39
## [4000,4400) 7 0.00 0.02 13613 40.41
## [4400,4800) 4 0.00 0.01 13617 40.43
## [4800,5200) 4 0.00 0.01 13621 40.44
Realice un grafico pertinente que represente las frecuencias relativas encontradas en la Pregunta 6.
plot(ingresos, type = "rfh", main = "His Fr. rel", xlab = "Int", ylab = "Frec", col = "yellow", v = T)
Realice una tabla de frecuencias que permita resumir el estado civil de los individuos.
est.civil<- fdt_cat(per$p05, sort = F)
kable(est.civil)
| Category | f | rf | rf(%) | cf | cf(%) |
|---|---|---|---|---|---|
| Casado(a) | 9161 | 0.3400772 | 34.007721 | 9161 | 34.00772 |
| Unido / a | 3876 | 0.1438860 | 14.388596 | 13037 | 48.39632 |
| Separado /a | 1323 | 0.0491128 | 4.911278 | 14360 | 53.30760 |
| Divorciado /a | 660 | 0.0245007 | 2.450070 | 15020 | 55.75767 |
| Viudo /a | 1179 | 0.0437672 | 4.376717 | 16199 | 60.13438 |
| Soltero /a | 10739 | 0.3986562 | 39.865617 | 26938 | 100.00000 |
Realice la misma tabla de frecuencias de la Pregunta 8, pero ahora incluya la cuenta del numero de datos perdidos que tiene la variable
levels(per$p05)
## [1] "Casado(a)" "Unido / a" "Separado /a" "Divorciado /a"
## [5] "Viudo /a" "Soltero /a"
agregados<-addNA(per$p05)#incluimos los valores NA
tfrec2 <- fdt_cat(agregados)
tfrec2