En la página https://www.ecuadorencif ras.gob.ec/encuesta-nacional-multiproposito-de-hogares/, el Instituto Nacional de Estadísticas y Censos ha publicado las bases de datos y resultados de la “Encuesta Nacional Multipropósito de Hogares”. Descarguese las bases de datos en SPSS del periodo vigente (también se adjuntan) y enfóquese en las siguientes:
202012_multibdd_personas.sav (personas) es una base de datos que contiene la información para todas las personas que formaron parte de la encuesta
202012_multibdd_educación_actfisica_tics.sav (educación) es una base de datos donde solo se tomaron en cuentas las personas que reciben algún tipo de educación. Todos los individuos de esta base de datos son parte de la base de datos anterior referente a “personas”, pero no necesariamente todos los individuos de la base de datos referente a “personas” son parte de esta base de datos referente a “educacion”
202012_multibdd_calidad.sav (calidad) es una base de datos donde solo se tomaron en cuentas las personas que son usuarios de algún tipo de servicio público. Todos los individuos de esta base de datos son parte de la base de datos anterior referente a “personas”, pero no necesariamente todos los individuos de la base de datos referente a “personas” son parte de esta base de datos referente a “calidad”
Importe las tres bases de datos de interés y a partir de ellas cree una nueva base de datos que contenga exclusivamente los individuos que fueron tomados en cuenta para formar parte de la base de datos referentes a “educacion” pero que al mismo tiempo no fueron tomados en cuenta para formar parte de la base de datos referentes a “calidad”. Exclusivamente a partir de esta nueva base de datos, responda todas las siguientes preguntas de este cuestionario.
AYUDA: La base de datos de interés para esta pregunta tiene 4052 individuos
library(Hmisc)
## Warning: package 'Hmisc' was built under R version 4.2.2
## Loading required package: lattice
## Loading required package: survival
## Loading required package: Formula
## Loading required package: ggplot2
##
## Attaching package: 'Hmisc'
## The following objects are masked from 'package:base':
##
## format.pval, units
library(tidyverse)
## Warning: package 'tidyverse' was built under R version 4.2.2
## ── Attaching packages
## ───────────────────────────────────────
## tidyverse 1.3.2 ──
## ✔ tibble 3.1.8 ✔ dplyr 1.0.10
## ✔ tidyr 1.3.0 ✔ stringr 1.5.0
## ✔ readr 2.1.3 ✔ forcats 0.5.2
## ✔ purrr 1.0.1
## Warning: package 'tibble' was built under R version 4.2.2
## Warning: package 'tidyr' was built under R version 4.2.3
## Warning: package 'readr' was built under R version 4.2.2
## Warning: package 'purrr' was built under R version 4.2.3
## Warning: package 'dplyr' was built under R version 4.2.2
## Warning: package 'stringr' was built under R version 4.2.3
## Warning: package 'forcats' was built under R version 4.2.2
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ✖ dplyr::src() masks Hmisc::src()
## ✖ dplyr::summarize() masks Hmisc::summarize()
library(dplyr)
library(fdth)
## Warning: package 'fdth' was built under R version 4.2.2
##
## Attaching package: 'fdth'
##
## The following objects are masked from 'package:stats':
##
## sd, var
per1<-spss.get("202012_multibdd_personas.sav",use.value.labels=T)
per2<-spss.get("202012_multibdd_educación_actfisica_tics.sav",use.value.labels=T)
per3<-spss.get("202012_multibdd_calidad.sav",use.value.labels=T)
ji<-merge(per1,per2,all.y = T)
vale2<- anti_join(ji, per3 , by=c("id.per","ciudad"))
Realice una tabla de frecuencias que describa el nivel de instrucción de las personas. En la tabla no se deberá observar las frecuencias iguales a cero
X<-vale2[c(21)]
LOQ<-fdt_cat(X[X!=0],sort = T)
LOQ
Realice una función llamada “pastel” que, ingresando un conjunto de datos, el output de la función sea un diagrama de pastel con etiquetas (Categoría y frecuencia). La función deberá tener un argumento que le permita decidir al usuario si dibujar el diagrama con las frecuencias absolutas o relativas
afrecuencias<-function(X,tipo){
if (tipo== "absoluta"| tipo!="relativa") {
nam <- paste0(X$Category, "(", X$f ,")" )
pie(X$f, radius = 1, labels = nam, col = 2:6)
}else{
if(tipo=="relativa" | tipo!="absoluta") {
nam <- paste0(X$Category, "(", round(X$`rf(%)`, 2), "%)")
pie(X$`rf(%)`, radius = 1, labels = nam, col = 2:6)
} else{
warning("ingrese solo la palbara absoluta o relativa")
}
}
}
Pruebe la función anterior realizando un gráfico de pastel, tanto para frecuencias absolutas como de frecuencias relativas de la variable “area”
sf<-fdt_cat(vale2$area,sort = T)
afrecuencias(sf,"absoluta")
afrecuencias(sf,"relativa")
Realice una tabla de frecuencias para estudiar la edad de los individuos
afhum <- fdt(as.numeric(vale2$s1p3), start =5, end = 17, h=3)
afhum
## Class limits f rf rf(%) cf cf(%)
## [5,8) 583 0.14 14.39 583 14.39
## [8,11) 1033 0.25 25.49 1616 39.88
## [11,14) 1154 0.28 28.48 2770 68.36
## [14,17) 1282 0.32 31.64 4052 100.00
Realice un gráfico pertinente para las frecuencias relativas de la Tabla de Frecuencias de la pregunta anterior
plot(afhum, type = "rfh", v = T, main = "Histograma - edad",
xlab = "", ylab = "")
Realice una tabla, donde se pueda ver las frecuencias de los indviduos que tienen de 4 a 10 años (niños), de 10 a 12 años pre-adolescentes y de 12 a 16 años (adolescentes)
edad.v2 <- cut(as.numeric(vale2$s1p3), breaks = c(4,10,12,16))
intervalos<-levels(edad.v2)
fab<-as.vector(table(edad.v2))
fr<-round(fab/length(as.numeric(vale2$s1p3))*100,3)
FAB<-cumsum(fab)
FR<-round(cumsum(fr)*100,3)
ulti<-data.frame(intervalos,fab,fr,FAB,FR)
ulti