Ejercicio

En la página https://www.ecuadorencif ras.gob.ec/encuesta-nacional-multiproposito-de-hogares/, el Instituto Nacional de Estadísticas y Censos ha publicado las bases de datos y resultados de la “Encuesta Nacional Multipropósito de Hogares”. Descarguese las bases de datos en SPSS del periodo vigente (también se adjuntan) y enfóquese en las siguientes:

Pregunta 1.

Importe las tres bases de datos de interés y a partir de ellas cree una nueva base de datos que contenga exclusivamente los individuos que fueron tomados en cuenta para formar parte de la base de datos referentes a “educacion” pero que al mismo tiempo no fueron tomados en cuenta para formar parte de la base de datos referentes a “calidad”. Exclusivamente a partir de esta nueva base de datos, responda todas las siguientes preguntas de este cuestionario.

AYUDA: La base de datos de interés para esta pregunta tiene 4052 individuos

library(Hmisc)
## Warning: package 'Hmisc' was built under R version 4.2.2
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
## Loading required package: ggplot2
## 
## Attaching package: 'Hmisc'
## The following objects are masked from 'package:base':
## 
##     format.pval, units
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.2
## ── Attaching packages
## ───────────────────────────────────────
## tidyverse 1.3.2 ──
## ✔ tibble  3.1.8      ✔ dplyr   1.0.10
## ✔ tidyr   1.3.0      ✔ stringr 1.5.0 
## ✔ readr   2.1.3      ✔ forcats 0.5.2 
## ✔ purrr   1.0.1
## Warning: package 'tibble' was built under R version 4.2.2
## Warning: package 'tidyr' was built under R version 4.2.3
## Warning: package 'readr' was built under R version 4.2.2
## Warning: package 'purrr' was built under R version 4.2.3
## Warning: package 'dplyr' was built under R version 4.2.2
## Warning: package 'stringr' was built under R version 4.2.3
## Warning: package 'forcats' was built under R version 4.2.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter()    masks stats::filter()
## ✖ dplyr::lag()       masks stats::lag()
## ✖ dplyr::src()       masks Hmisc::src()
## ✖ dplyr::summarize() masks Hmisc::summarize()
library(dplyr)
library(fdth)
## Warning: package 'fdth' was built under R version 4.2.2
## 
## Attaching package: 'fdth'
## 
## The following objects are masked from 'package:stats':
## 
##     sd, var
per1<-spss.get("202012_multibdd_personas.sav",use.value.labels=T)


per2<-spss.get("202012_multibdd_educación_actfisica_tics.sav",use.value.labels=T)


per3<-spss.get("202012_multibdd_calidad.sav",use.value.labels=T)
ji<-merge(per1,per2,all.y = T)

vale2<- anti_join(ji, per3 , by=c("id.per","ciudad"))

Pregunta 2.

Realice una tabla de frecuencias que describa el nivel de instrucción de las personas. En la tabla no se deberá observar las frecuencias iguales a cero

X<-vale2[c(21)]
LOQ<-fdt_cat(X[X!=0],sort = T)
LOQ

Pregunta 3.

Realice una función llamada “pastel” que, ingresando un conjunto de datos, el output de la función sea un diagrama de pastel con etiquetas (Categoría y frecuencia). La función deberá tener un argumento que le permita decidir al usuario si dibujar el diagrama con las frecuencias absolutas o relativas

afrecuencias<-function(X,tipo){
  if (tipo== "absoluta"| tipo!="relativa") {
    nam <- paste0(X$Category, "(", X$f ,")" )
    pie(X$f, radius = 1, labels = nam, col = 2:6)
    
  }else{
    if(tipo=="relativa" | tipo!="absoluta") {
      nam <- paste0(X$Category, "(", round(X$`rf(%)`, 2), "%)")
      pie(X$`rf(%)`, radius = 1, labels = nam, col = 2:6)
      
    } else{
      warning("ingrese solo la palbara absoluta o relativa")
    }  
  }
} 

Pregunta 4.

Pruebe la función anterior realizando un gráfico de pastel, tanto para frecuencias absolutas como de frecuencias relativas de la variable “area”

sf<-fdt_cat(vale2$area,sort = T)



afrecuencias(sf,"absoluta")

afrecuencias(sf,"relativa")

Pregunta 5.

Realice una tabla de frecuencias para estudiar la edad de los individuos

afhum <- fdt(as.numeric(vale2$s1p3), start =5, end = 17, h=3)
afhum
##  Class limits    f   rf rf(%)   cf  cf(%)
##         [5,8)  583 0.14 14.39  583  14.39
##        [8,11) 1033 0.25 25.49 1616  39.88
##       [11,14) 1154 0.28 28.48 2770  68.36
##       [14,17) 1282 0.32 31.64 4052 100.00

Pregunta 6.

Realice un gráfico pertinente para las frecuencias relativas de la Tabla de Frecuencias de la pregunta anterior

plot(afhum, type = "rfh", v = T, main = "Histograma - edad",
     xlab = "", ylab = "")

Pregunta 7.

Realice una tabla, donde se pueda ver las frecuencias de los indviduos que tienen de 4 a 10 años (niños), de 10 a 12 años pre-adolescentes y de 12 a 16 años (adolescentes)

edad.v2 <- cut(as.numeric(vale2$s1p3), breaks = c(4,10,12,16))
intervalos<-levels(edad.v2)
fab<-as.vector(table(edad.v2))
fr<-round(fab/length(as.numeric(vale2$s1p3))*100,3)
FAB<-cumsum(fab)
FR<-round(cumsum(fr)*100,3)
ulti<-data.frame(intervalos,fab,fr,FAB,FR)
ulti