Adjunto encontrará los archivos: • enemdu_vivienda.csv el cual contiene la base de datos que recoge la Encuesta Nacional de Empleo, desempleo y subempleo, realizado por el INEC en el 2022. Si desea información adicional, puede descargar esta base de datos directamente de la web https://www.ecuadorencifras.gob.ec/estadisticaslaborales-septiembre-2022-2/ • diccionario.xlsx: Es el diccionario de variables, el cual contiene el nombre de las variables de la base de datos antes descrita, acompañadas de una descripción (etiquetas) con el significado de cada una de ellas. Luego de importar la base de datos y los nombres con las etiquetas responda las siguientes preguntas:
library(readxl)
## Warning: package 'readxl' was built under R version 4.2.2
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.2.2
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
vivi<- read.csv("enemdu_vivienda.csv")
diccionario <- read_excel("diccionario.xlsx")
VIVIENDA<-vivi[,-1]
View(VIVIENDA)
Etiquete cada variable de la base de datos con la descripción del campo que se encuentra diccionario
colnames(VIVIENDA)<-diccionario$`Descripción del campo`
names(VIVIENDA)
## [1] "Area"
## [2] "Ciudad"
## [3] "Conglomerado"
## [4] "Panelm"
## [5] "Vivienda"
## [6] "Hogar"
## [7] "Vía de acceso principal a la vivienda"
## [8] "Tipo de vivienda"
## [9] "Material del techo o cubierta"
## [10] "Estado del techo"
## [11] "Material del piso"
## [12] "Estado del piso"
## [13] "Material de las paredes"
## [14] "Estado de las paredes"
## [15] "Número de cuartos"
## [16] "Número de dormitorios"
## [17] "Número de cuartos para negocio"
## [18] "Dispone este hogar de un cuarto o espacio exclusivo para cocinar"
## [19] "Material con que cocinan"
## [20] "Tipo de servicio higiénico"
## [21] "Puesto que mencionó que NO TIENE Servicio Higiénico, los miembros del hogar"
## [22] "Qué tipo de instalación sanitaria cercana y/o prestada utiliza principalmente el hogar"
## [23] "De dónde obtiene el agua"
## [24] "Tiene medidor de agua"
## [25] "El agua que obtiene es de la junta de agua"
## [26] "El agua que recibe la vivienda es"
## [27] "El servicio de ducha es"
## [28] "Tipo de alumbrado"
## [29] "Cómo eliminan la basura"
## [30] "Forma de tenencia de la vivienda"
## [31] "Cuál es el valor que paga/ pagaria mensualmente por el arriendo"
## [32] "En el valor que paga por el arriendo se incluye el pago por el servicio de agua"
## [33] "En el valor que paga por el arriendo se incluye el pago por el servicio de luz"
## [34] "Tiene relación de parentesco con el propietario de la vivienda"
## [35] "¿Tiene este hogar-Vehículos"
## [36] "Cuántos tiene-Vehículos"
## [37] "¿Tiene este hogar-Motos"
## [38] "Cuántos tiene-Motos"
## [39] "Abastecimiento (combustible o electricidad) utiliza con mayor frecuencia- Súper"
## [40] "Cuánto gastó por combustible o electricidad-Super"
## [41] "Abastecimiento (combustible o electricidad) utiliza con mayor frecuencia- Extra"
## [42] "Cuánto gastó por combustible o electricidad- Extra"
## [43] "Abastecimiento (combustible o electricidad) utiliza con mayor frecuencia- Diésel"
## [44] "Cuánto gastó por combustible o electricidad-Diesel"
## [45] "Abastecimiento (combustible o electricidad) utiliza con mayor frecuencia- Ecopaís"
## [46] "Cuánto gastó por combustible o electricidad-Ecopaís"
## [47] "Abastecimiento (combustible o electricidad) utiliza con mayor frecuencia- Electricidad"
## [48] "Cuánto gastó por combustible o electricidad-Electricidad"
## [49] "Abastecimiento (combustible o electricidad) utiliza con mayor frecuencia- Gas"
## [50] "Cuánto gastó por combustible o electricidad-Gas"
## [51] "Estratos"
## [52] "Factor de expansión"
## [53] "Unidad Primaria de Muestreo"
## [54] "Identificador de vivienda"
## [55] "Identificador de hogar"
## [56] "Periodo"
En la variable vi141, el valor 999999, no es un valor de la variable, en realidad significa un NA. Encuentre este(os) valor(es) y declárelo(s) como NA.
VIVIENDA$`Cuál es el valor que paga/ pagaria mensualmente por el arriendo`[VIVIENDA$`Cuál es el valor que paga/ pagaria mensualmente por el arriendo`=="999999"]<-NA
Se ha cambiado el valor 999999 por NA
sum(is.na(VIVIENDA$`Cuál es el valor que paga/ pagaria mensualmente por el arriendo`))
## [1] 3
En total ha existido 3 valores con 999999 y se los ha cambiado correctamente.
Cuál es el valor máximo que una persona paga mensualmente por arriendo (variable vi141).
valormaximo<-(max(VIVIENDA$`Cuál es el valor que paga/ pagaria mensualmente por el arriendo`,na.rm = TRUE))
valormaximo
## [1] 1500
Cuántos vehículos (vi1521) tienen cada uno de los individuos que pagan el valor máximo de arriendo mensual,detectado en la pregunta 3.
nuevadata<-(VIVIENDA$`Cuántos tiene-Vehículos`)
maximo<-which.max(VIVIENDA$`Cuál es el valor que paga/ pagaria mensualmente por el arriendo`)
nuevadata[maximo]
## [1] 1
Con el uso de la librería dplyr, filtre solo las variables cuantitativas de la base de datos ¿Cuántas variables tiene esta nueva base de datos?
Cuantitativas<-select(VIVIENDA,is.numeric)
## Warning: Use of bare predicate functions was deprecated in tidyselect 1.1.0.
## ℹ Please use wrap predicates in `where()` instead.
## # Was:
## data %>% select(is.numeric)
##
## # Now:
## data %>% select(where(is.numeric))
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.
length(Cuantitativas)
## [1] 19
Se tiene 19 variables cuantitativas
Cuáles son las variables cuantitativas que no tienen ningún NA
apply(X = is.na(Cuantitativas), MARGIN = 2, FUN = sum)
## Ciudad
## 0
## Conglomerado
## 0
## Número de cuartos
## 0
## Número de dormitorios
## 0
## Número de cuartos para negocio
## 0
## Cuál es el valor que paga/ pagaria mensualmente por el arriendo
## 3
## Cuántos tiene-Vehículos
## 6507
## Cuántos tiene-Motos
## 7981
## Cuánto gastó por combustible o electricidad-Super
## 8778
## Cuánto gastó por combustible o electricidad- Extra
## 7459
## Cuánto gastó por combustible o electricidad-Diesel
## 8748
## Cuánto gastó por combustible o electricidad-Ecopaís
## 7592
## Cuánto gastó por combustible o electricidad-Electricidad
## 8946
## Cuánto gastó por combustible o electricidad-Gas
## 8964
## Estratos
## 0
## Factor de expansión
## 0
## Unidad Primaria de Muestreo
## 0
## Identificador de vivienda
## 0
## Identificador de hogar
## 0
Las variables cuantitativas que no tienen ningun NA son 10 estan declaradas con 0 NA’s y son Ciudad , Identificador de hogar, Unidad Primaria de Muestreo,Factor de expansión ,Estratos ,Número de cuartos para negocio ,Número de dormitorios ,Número de cuartos ,Conglomerado e Identificador de vivienda .
Calcule el número de cuartos (vi06) máximo que tienen los distintos tipos de vivienda (vi02)
attach(VIVIENDA)
VIVIENDA%>%
group_by (`Tipo de vivienda`)%>%
summarise(max = max (`Número de cuartos`, na.rm = TRUE ))
Calcule el valor promedio (función mean) que se paga mensualmente por arriendo (vi141) de acuerdo al tipo de vivienda (vi02)
VIVIENDA%>%
group_by (`Tipo de vivienda`)%>%
summarise(mean = mean (`Cuál es el valor que paga/ pagaria mensualmente por el arriendo`, na.rm = TRUE ))