Dirígete a la página oficial de la ENIGH 2022: https://www.inegi.org.mx/programas/enigh/nc/2022/#microdatos
Busca el archivo titulado "Características sociodemográficas de los integrantes del hogar (población)" y descárgalo. Si está en formato ZIP, descomprímelo y ubica el archivo .csv.
Guarda este archivo en una carpeta para tu proyecto, por ejemplo, datos/.
## 2. Preparación del entorno de trabajo
``` r
# Instala estas librerías si aún no lo has hecho:
# install.packages("readr")
# install.packages("dplyr")
library(readr)
library(dplyr)
library(tidyr)
library(stringr)
# Carga tu archivo csv
poblacion <- read.csv("poblacion.csv")
# Verifica que la base se cargó correctamente
head(poblacion)
## folioviv foliohog numren parentesco sexo edad madre_hog madre_id padre_hog
## 1 100005002 1 1 101 2 91 2 2
## 2 100005002 1 2 301 2 48 1 01 2
## 3 100005002 1 3 609 2 13 1 02 2
## 4 100005003 1 1 101 1 68 2 2
## 5 100005003 1 2 201 2 64 2 2
## 6 100005004 1 1 101 1 56 2 2
## padre_id disc_camin disc_ver disc_brazo disc_apren disc_oir disc_vest
## 1 3 4 4 4 4 4
## 2 4 4 4 4 4 4
## 3 4 4 4 4 4 4
## 4 4 4 4 4 4 4
## 5 4 4 4 4 4 4
## 6 4 4 4 4 4 4
## disc_habla disc_acti cau_camin cau_ver cau_brazo cau_apren cau_oir cau_vest
## 1 4 4 2
## 2 4 4
## 3 4 4
## 4 4 4
## 5 4 4
## 6 4 4
## cau_habla cau_acti hablaind lenguaind hablaesp comprenind etnia alfabetism
## 1 2 NA NA 2 2 1
## 2 2 NA NA 2 2 1
## 3 2 NA NA 2 2 1
## 4 2 NA NA 2 2 1
## 5 2 NA NA 2 2 1
## 6 2 NA NA 2 2 1
## asis_esc nivel grado tipoesc tiene_b otorg_b forma_b tiene_c otorg_c forma_c
## 1 2 NA NA NA NA NA NA NA NA NA
## 2 2 NA NA NA NA NA NA NA NA NA
## 3 1 7 2 2 1 3 5 NA NA NA
## 4 2 NA NA NA NA NA NA NA NA NA
## 5 2 NA NA NA NA NA NA NA NA NA
## 6 2 NA NA NA NA NA NA NA NA NA
## nivelaprob gradoaprob antec_esc residencia edo_conyug pareja_hog conyuge_id
## 1 2 4 NA 1 5 NA
## 2 4 3 NA 1 6 NA
## 3 3 1 NA 1 6 NA
## 4 4 3 NA 9 2 1 02
## 5 7 5 3 9 2 1 01
## 6 7 5 3 1 2 1 02
## segsoc ss_aa ss_mm redsoc_1 redsoc_2 redsoc_3 redsoc_4 redsoc_5 redsoc_6
## 1 2 NA NA 1 3 1 3 2 NA
## 2 2 NA NA 2 2 1 3 2 NA
## 3 2 NA NA 2 3 2 3 2 NA
## 4 1 26 0 2 3 2 3 2 NA
## 5 2 NA NA 3 3 3 3 3 NA
## 6 2 NA NA 3 3 2 3 3 NA
## hor_1 min_1 usotiempo1 hor_2 min_2 usotiempo2 hor_3 min_3 usotiempo3 hor_4
## 1 NA NA 9 NA NA 9 NA NA 9 NA
## 2 48 0 NA NA NA 9 NA NA 9 2
## 3 NA NA 9 35 0 NA NA NA 9 NA
## 4 40 0 NA NA NA 9 NA NA 9 NA
## 5 12 0 NA 6 0 NA NA NA 9 NA
## 6 68 0 NA NA NA 9 NA NA 9 NA
## min_4 usotiempo4 hor_5 min_5 usotiempo5 hor_6 min_6 usotiempo6 hor_7 min_7
## 1 NA 9 NA NA 9 3 0 NA NA NA
## 2 0 NA NA NA 9 14 0 NA NA NA
## 3 NA 9 NA NA 9 NA NA 9 NA NA
## 4 NA 9 NA NA 9 NA NA 9 NA NA
## 5 NA 9 NA NA 9 15 0 NA NA NA
## 6 NA 9 5 0 NA NA NA 9 NA NA
## usotiempo7 hor_8 min_8 usotiempo8 pop_insabi atemed inst_1 inst_2 inst_3
## 1 9 10 0 NA 2 1 NA 2 NA
## 2 9 10 0 NA 2 1 NA 2 NA
## 3 9 18 0 NA 2 1 NA 2 NA
## 4 9 12 0 NA 2 1 1 NA NA
## 5 9 20 0 NA 2 1 1 NA NA
## 6 9 20 0 NA 2 2 NA NA NA
## inst_4 inst_5 inst_6 inscr_1 inscr_2 inscr_3 inscr_4 inscr_5 inscr_6 inscr_7
## 1 NA NA NA NA NA NA NA NA NA 7
## 2 NA NA NA 1 NA NA NA NA NA NA
## 3 NA NA NA NA NA 3 NA NA NA NA
## 4 NA NA NA 1 NA NA NA NA NA NA
## 5 NA NA NA 1 NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA NA NA NA
## inscr_8 prob_anio prob_mes prob_sal aten_sal servmed_1 servmed_2 servmed_3
## 1 NA 2022 11 1 1 NA NA NA
## 2 NA 2019 11 1 1 NA NA NA
## 3 NA 2020 7 1 1 NA NA NA
## 4 NA 2021 11 1 1 NA NA NA
## 5 NA 2022 9 1 1 NA NA NA
## 6 NA 2021 12 1 1 NA NA NA
## servmed_4 servmed_5 servmed_6 servmed_7 servmed_8 servmed_9 servmed_10
## 1 NA 5 NA NA NA NA NA
## 2 NA 5 NA NA NA NA NA
## 3 NA NA NA NA 8 NA NA
## 4 NA NA NA NA 8 NA NA
## 5 NA NA NA NA 8 NA NA
## 6 NA NA NA NA 8 NA NA
## servmed_11 servmed_12 hh_lug mm_lug hh_esp mm_esp pagoaten_1 pagoaten_2
## 1 NA NA 0 10 0 20 NA NA
## 2 NA NA 0 5 4 0 NA NA
## 3 NA NA 0 5 1 0 1 2
## 4 NA NA 0 10 0 5 1 2
## 5 NA NA 0 30 0 20 1 2
## 6 NA NA 0 15 0 5 1 2
## pagoaten_3 pagoaten_4 pagoaten_5 pagoaten_6 pagoaten_7 noatenc_1 noatenc_2
## 1 NA NA NA NA 7 NA NA
## 2 NA NA NA NA 7 NA NA
## 3 NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA
## 5 3 NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA
## noatenc_3 noatenc_4 noatenc_5 noatenc_6 noatenc_7 noatenc_8 noatenc_9
## 1 NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA
## noatenc_10 noatenc_11 noatenc_12 noatenc_13 noatenc_14 noatenc_15 noatenc_16
## 1 NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA
## norecib_1 norecib_2 norecib_3 norecib_4 norecib_5 norecib_6 norecib_7
## 1 NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA
## norecib_8 norecib_9 norecib_10 norecib_11 norecib_12 razon_1 razon_2 razon_3
## 1 NA NA NA NA NA NA NA NA
## 2 NA NA NA NA NA NA NA NA
## 3 NA NA NA NA NA NA NA NA
## 4 NA NA NA NA NA NA NA NA
## 5 NA NA NA NA NA NA NA NA
## 6 NA NA NA NA NA NA NA NA
## razon_4 razon_5 razon_6 razon_7 razon_8 razon_9 razon_10 razon_11 diabetes
## 1 NA NA NA NA NA NA NA NA 1
## 2 NA NA NA NA NA NA NA NA 2
## 3 NA NA NA NA NA NA NA NA 2
## 4 NA NA NA NA NA NA NA NA 2
## 5 NA NA NA NA NA NA NA NA 1
## 6 NA NA NA NA NA NA NA NA 2
## pres_alta peso segvol_1 segvol_2 segvol_3 segvol_4 segvol_5 segvol_6 segvol_7
## 1 1 1 NA NA NA NA NA 6 NA
## 2 1 1 NA NA NA NA NA 6 NA
## 3 2 1 NA NA NA NA NA 6 NA
## 4 1 1 NA 2 NA NA NA NA NA
## 5 1 1 NA NA NA NA NA 6 NA
## 6 1 1 NA 2 NA NA NA NA NA
## hijos_viv hijos_mue hijos_sob trabajo_mp motivo_aus act_pnea1 act_pnea2
## 1 3 0 3 2 NA 5 NA
## 2 1 0 1 1 NA NA NA
## 3 0 NA NA 2 NA 4 NA
## 4 NA NA NA 1 NA NA NA
## 5 2 0 2 1 NA NA NA
## 6 NA NA NA 1 NA NA NA
## num_trabaj c_futuro ct_futuro entidad est_dis upm factor
## 1 NA NA NA 1 3 1 206
## 2 1 NA NA 1 3 1 206
## 3 NA NA NA 1 3 1 206
## 4 1 NA NA 1 3 1 206
## 5 1 NA NA 1 3 1 206
## 6 1 NA NA 1 3 1 206
# Utiliza las funciones head, tail, str, summary y names y anota frente a su resultado para qué se utiliza cada
head(poblacion) #nos muestra los primeros 6 renglones
tail(poblacion) #muestra las ultimas 6 observaciones
str(poblacion) #estructura de cada variable en análisis
summary(poblacion) #estadisticas generales de las variables, numericas y espectro general de las no numericas
mode(poblacion) #modo en que está guardada la info
names(poblacion) #nombres de todas las columnas
## 5. Identificación de valores faltantes
# Utiliza la función anyNA, is.na y anota frente a su resultado para qué se utiliza cada una
``
anyNA(poblacion) #verificar si dentro de la funcion existe el NA
is.na(poblacion)# te dice si es que hay una variable con na y solo es en las primeras cinco filas
sum(is.na(poblacion)) #sumar del dataframe completos cuantos na hay, se suma por columna de na
colSums(is.na(poblacion)) #variables que tienen mayor cantidad de na, se puede explicar por la continuidad de preguntas
## 6. Filtrado y selección de datos
#Crea un nuevo data frame que se llame poblacion_nl a partir del data frame original llamado poblacion
poblacion_nl <- poblacion%>% # %>% operador de dplyr y hace que se vuelva en lo que le pidas que filtre
filter(entidad=="19")%>% #agregarle comilla porque está en texto no numerico
select(sexo,edad,comprenind,etnia,nivel)
#filter filas
#select columnas
#Filtra los datos solamente para personas que vivan en el estado de Nuevo León
#Selecciona por lo menos 5 variables de interés para tu análisis
``` r
#Calcula el promedio de edad por sexo para el estado de Jalisco
poblacionjl <- poblacion %>%
filter(entidad=="14") %>%
select(sexo,edad)
poblacionh <- poblacion %>%
filter(entidad=="14") %>%
filter(sexo=="1") %>%
select(sexo, edad)
mean(poblacionh$edad)
## [1] 32.86837
poblacionm <- poblacion %>%
filter(entidad=="14") %>%
filter(sexo=="2") %>%
select(sexo, edad)
mean(poblacionh$edad)
## [1] 32.86837
## 8. Revisar estructura
# Revisar estructura general
``` r
summary(poblacion)
## folioviv foliohog numren parentesco
## Min. :1.000e+08 Min. :1.000 Min. : 1.000 Min. :101.0
## 1st Qu.:8.064e+08 1st Qu.:1.000 1st Qu.: 1.000 1st Qu.:101.0
## Median :1.602e+09 Median :1.000 Median : 2.000 Median :301.0
## Mean :1.631e+09 Mean :1.014 Mean : 2.679 Mean :268.8
## 3rd Qu.:2.460e+09 3rd Qu.:1.000 3rd Qu.: 4.000 3rd Qu.:301.0
## Max. :3.261e+09 Max. :5.000 Max. :19.000 Max. :712.0
##
## sexo edad madre_hog madre_id
## Min. :1.000 Min. : 0.00 Min. :1.000 Length:309684
## 1st Qu.:1.000 1st Qu.: 15.00 1st Qu.:1.000 Class :character
## Median :2.000 Median : 30.00 Median :2.000 Mode :character
## Mean :1.517 Mean : 33.27 Mean :1.556
## 3rd Qu.:2.000 3rd Qu.: 50.00 3rd Qu.:2.000
## Max. :2.000 Max. :109.00 Max. :2.000
##
## padre_hog padre_id disc_camin disc_ver
## Min. :1.000 Length:309684 Length:309684 Length:309684
## 1st Qu.:1.000 Class :character Class :character Class :character
## Median :2.000 Mode :character Mode :character Mode :character
## Mean :1.681
## 3rd Qu.:2.000
## Max. :2.000
##
## disc_brazo disc_apren disc_oir disc_vest
## Length:309684 Length:309684 Length:309684 Length:309684
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## disc_habla disc_acti cau_camin cau_ver
## Length:309684 Length:309684 Length:309684 Length:309684
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## cau_brazo cau_apren cau_oir cau_vest
## Length:309684 Length:309684 Length:309684 Length:309684
## Class :character Class :character Class :character Class :character
## Mode :character Mode :character Mode :character Mode :character
##
##
##
##
## cau_habla cau_acti hablaind lenguaind
## Length:309684 Length:309684 Min. :1.000 Min. : 111.0
## Class :character Class :character 1st Qu.:2.000 1st Qu.: 491.0
## Mode :character Mode :character Median :2.000 Median : 922.0
## Mean :1.932 Mean : 835.2
## 3rd Qu.:2.000 3rd Qu.:1021.0
## Max. :2.000 Max. :9999.0
## NA's :11472 NA's :289388
## hablaesp comprenind etnia alfabetism
## Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:1.000 1st Qu.:2.000 1st Qu.:1.000 1st Qu.:1.000
## Median :1.000 Median :2.000 Median :2.000 Median :1.000
## Mean :1.063 Mean :1.974 Mean :1.712 Mean :1.103
## 3rd Qu.:1.000 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:1.000
## Max. :2.000 Max. :2.000 Max. :2.000 Max. :2.000
## NA's :289388 NA's :31768 NA's :11472 NA's :11472
## asis_esc nivel grado tipoesc
## Min. :1.000 Min. : 1.000 Min. :1.000 Min. :1.000
## 1st Qu.:1.000 1st Qu.: 6.000 1st Qu.:1.000 1st Qu.:1.000
## Median :2.000 Median : 6.000 Median :2.000 Median :1.000
## Mean :1.715 Mean : 6.942 Mean :2.596 Mean :1.107
## 3rd Qu.:2.000 3rd Qu.: 9.000 3rd Qu.:3.000 3rd Qu.:1.000
## Max. :2.000 Max. :13.000 Max. :6.000 Max. :3.000
## NA's :11472 NA's :224672 NA's :224675 NA's :224672
## tiene_b otorg_b forma_b tiene_c
## Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:2.000 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:2.000
## Median :2.000 Median :1.000 Median :1.000 Median :2.000
## Mean :1.763 Mean :1.424 Mean :1.363 Mean :1.991
## 3rd Qu.:2.000 3rd Qu.:1.000 3rd Qu.:1.000 3rd Qu.:2.000
## Max. :2.000 Max. :5.000 Max. :5.000 Max. :2.000
## NA's :224672 NA's :289571 NA's :289571 NA's :283985
## otorg_c forma_c nivelaprob gradoaprob
## Min. :1.00 Min. :1.000 Min. :0.000 Min. :0.000
## 1st Qu.:1.00 1st Qu.:1.000 1st Qu.:2.000 1st Qu.:2.000
## Median :2.00 Median :2.000 Median :3.000 Median :3.000
## Mean :1.95 Mean :1.991 Mean :3.249 Mean :3.068
## 3rd Qu.:3.00 3rd Qu.:3.000 3rd Qu.:4.000 3rd Qu.:4.000
## Max. :4.00 Max. :3.000 Max. :9.000 Max. :6.000
## NA's :309462 NA's :309462 NA's :11472 NA's :11472
## antec_esc residencia edo_conyug pareja_hog
## Min. :1.000 Min. : 1.00 Min. :1.00 Min. :1.000
## 1st Qu.:3.000 1st Qu.: 8.00 1st Qu.:2.00 1st Qu.:1.000
## Median :3.000 Median :16.00 Median :2.00 Median :1.000
## Mean :2.949 Mean :16.15 Mean :3.45 Mean :1.036
## 3rd Qu.:3.000 3rd Qu.:24.00 3rd Qu.:6.00 3rd Qu.:1.000
## Max. :5.000 Max. :34.00 Max. :6.00 Max. :2.000
## NA's :260630 NA's :20790 NA's :58845 NA's :178067
## conyuge_id segsoc ss_aa ss_mm
## Length:309684 Min. :1.000 Min. :-1.00 Min. :-1.000
## Class :character 1st Qu.:1.000 1st Qu.: 3.00 1st Qu.: 0.000
## Mode :character Median :2.000 Median : 8.00 Median : 0.000
## Mean :1.571 Mean :11.53 Mean : 0.721
## 3rd Qu.:2.000 3rd Qu.:18.00 3rd Qu.: 0.000
## Max. :2.000 Max. :70.00 Max. :11.000
## NA's :58989 NA's :202135 NA's :202135
## redsoc_1 redsoc_2 redsoc_3 redsoc_4
## Min. :1.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:2.000 1st Qu.:2.000 1st Qu.:2.000 1st Qu.:3.000
## Median :2.000 Median :3.000 Median :2.000 Median :3.000
## Mean :2.484 Mean :2.746 Mean :2.107 Mean :2.887
## 3rd Qu.:3.000 3rd Qu.:3.000 3rd Qu.:2.000 3rd Qu.:3.000
## Max. :5.000 Max. :5.000 Max. :5.000 Max. :5.000
## NA's :95430 NA's :95430 NA's :95430 NA's :95430
## redsoc_5 redsoc_6 hor_1 min_1
## Min. :1.000 Min. :1.00 Min. : 0.00 Min. : 0.000
## 1st Qu.:2.000 1st Qu.:2.00 1st Qu.: 28.00 1st Qu.: 0.000
## Median :2.000 Median :3.00 Median : 45.00 Median : 0.000
## Mean :2.034 Mean :2.65 Mean : 41.24 Mean : 0.232
## 3rd Qu.:2.000 3rd Qu.:3.00 3rd Qu.: 52.00 3rd Qu.: 0.000
## Max. :5.000 Max. :5.00 Max. :168.00 Max. :59.000
## NA's :95430 NA's :213179 NA's :182456 NA's :182456
## usotiempo1 hor_2 min_2 usotiempo2
## Min. :8.000 Min. : 0.0 Min. : 0.000 Min. :8.000
## 1st Qu.:9.000 1st Qu.: 12.0 1st Qu.: 0.000 1st Qu.:9.000
## Median :9.000 Median : 30.0 Median : 0.000 Median :9.000
## Mean :8.999 Mean : 29.6 Mean : 0.737 Mean :8.999
## 3rd Qu.:9.000 3rd Qu.: 40.0 3rd Qu.: 0.000 3rd Qu.:9.000
## Max. :9.000 Max. :160.0 Max. :50.000 Max. :9.000
## NA's :222658 NA's :270377 NA's :270377 NA's :134737
## hor_3 min_3 usotiempo3 hor_4
## Min. : 0.000 Min. : 0.000 Min. :8.000 Min. : 0.00
## 1st Qu.: 2.000 1st Qu.: 0.000 1st Qu.:9.000 1st Qu.: 8.00
## Median : 4.000 Median : 0.000 Median :9.000 Median :18.00
## Mean : 7.674 Mean : 1.342 Mean :8.999 Mean :23.41
## 3rd Qu.: 9.000 3rd Qu.: 0.000 3rd Qu.:9.000 3rd Qu.:35.00
## Max. :99.000 Max. :50.000 Max. :9.000 Max. :99.00
## NA's :294481 NA's :294481 NA's :110633 NA's :254233
## min_4 usotiempo4 hor_5 min_5
## Min. : 0.000 Min. :8.000 Min. : 0.000 Min. : 0.000
## 1st Qu.: 0.000 1st Qu.:9.000 1st Qu.: 2.000 1st Qu.: 0.000
## Median : 0.000 Median :9.000 Median : 4.000 Median : 0.000
## Mean : 0.376 Mean :8.999 Mean : 6.799 Mean : 1.156
## 3rd Qu.: 0.000 3rd Qu.:9.000 3rd Qu.:10.000 3rd Qu.: 0.000
## Max. :59.000 Max. :9.000 Max. :99.000 Max. :50.000
## NA's :254233 NA's :150881 NA's :266935 NA's :266935
## usotiempo5 hor_6 min_6 usotiempo6
## Min. :8.000 Min. : 0.00 Min. : 0.000 Min. :8.000
## 1st Qu.:9.000 1st Qu.: 7.00 1st Qu.: 0.000 1st Qu.:9.000
## Median :9.000 Median :14.00 Median : 0.000 Median :9.000
## Mean :8.999 Mean :16.61 Mean : 0.658 Mean :8.996
## 3rd Qu.:9.000 3rd Qu.:21.00 3rd Qu.: 0.000 3rd Qu.:9.000
## Max. :9.000 Max. :99.00 Max. :59.000 Max. :9.000
## NA's :138179 NA's :136892 NA's :136892 NA's :268222
## hor_7 min_7 usotiempo7 hor_8
## Min. : 0.000 Min. : 0.000 Min. :8.000 Min. : 0.00
## 1st Qu.: 2.000 1st Qu.: 0.000 1st Qu.:9.000 1st Qu.: 9.00
## Median : 4.000 Median : 0.000 Median :9.000 Median :15.00
## Mean : 6.435 Mean : 2.139 Mean :8.999 Mean :20.49
## 3rd Qu.: 7.000 3rd Qu.: 0.000 3rd Qu.:9.000 3rd Qu.:28.00
## Max. :99.000 Max. :55.000 Max. :9.000 Max. :99.00
## NA's :281275 NA's :281275 NA's :123839 NA's :102825
## min_8 usotiempo8 pop_insabi atemed
## Min. : 0.000 Min. :8.000 Min. :1.00 Min. :1.000
## 1st Qu.: 0.000 1st Qu.:9.000 1st Qu.:2.00 1st Qu.:1.000
## Median : 0.000 Median :9.000 Median :2.00 Median :2.000
## Mean : 0.359 Mean :8.919 Mean :1.84 Mean :1.541
## 3rd Qu.: 0.000 3rd Qu.:9.000 3rd Qu.:2.00 3rd Qu.:2.000
## Max. :59.000 Max. :9.000 Max. :2.00 Max. :2.000
## NA's :102825 NA's :302289 NA's :150 NA's :150
## inst_1 inst_2 inst_3 inst_4
## Min. :1 Min. :2 Min. :3 Min. :4
## 1st Qu.:1 1st Qu.:2 1st Qu.:3 1st Qu.:4
## Median :1 Median :2 Median :3 Median :4
## Mean :1 Mean :2 Mean :3 Mean :4
## 3rd Qu.:1 3rd Qu.:2 3rd Qu.:3 3rd Qu.:4
## Max. :1 Max. :2 Max. :3 Max. :4
## NA's :191208 NA's :293399 NA's :306019 NA's :307298
## inst_5 inst_6 inscr_1 inscr_2
## Min. :5 Min. :6 Min. :1 Min. :2
## 1st Qu.:5 1st Qu.:6 1st Qu.:1 1st Qu.:2
## Median :5 Median :6 Median :1 Median :2
## Mean :5 Mean :6 Mean :1 Mean :2
## 3rd Qu.:5 3rd Qu.:6 3rd Qu.:1 3rd Qu.:2
## Max. :5 Max. :6 Max. :1 Max. :2
## NA's :308089 NA's :307698 NA's :255767 NA's :298148
## inscr_3 inscr_4 inscr_5 inscr_6
## Min. :3 Min. :4 Min. :5 Min. :6
## 1st Qu.:3 1st Qu.:4 1st Qu.:5 1st Qu.:6
## Median :3 Median :4 Median :5 Median :6
## Mean :3 Mean :4 Mean :5 Mean :6
## 3rd Qu.:3 3rd Qu.:4 3rd Qu.:5 3rd Qu.:6
## Max. :3 Max. :4 Max. :5 Max. :6
## NA's :255039 NA's :307051 NA's :300082 NA's :307745
## inscr_7 inscr_8 prob_anio prob_mes
## Min. :7 Min. :8 Min. :1955 Min. : 1.000
## 1st Qu.:7 1st Qu.:8 1st Qu.:2021 1st Qu.: 5.000
## Median :7 Median :8 Median :2022 Median : 7.000
## Mean :7 Mean :8 Mean :2021 Mean : 6.833
## 3rd Qu.:7 3rd Qu.:8 3rd Qu.:2022 3rd Qu.: 9.000
## Max. :7 Max. :8 Max. :2022 Max. :12.000
## NA's :300302 NA's :309273 NA's :32239 NA's :32240
## prob_sal aten_sal servmed_1 servmed_2
## Min. :1.000 Min. :1.000 Min. :1 Min. :2
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1 1st Qu.:2
## Median :1.000 Median :1.000 Median :1 Median :2
## Mean :1.271 Mean :1.003 Mean :1 Mean :2
## 3rd Qu.:2.000 3rd Qu.:1.000 3rd Qu.:1 3rd Qu.:2
## Max. :2.000 Max. :2.000 Max. :1 Max. :2
## NA's :32239 NA's :107498 NA's :286916 NA's :297994
## servmed_3 servmed_4 servmed_5 servmed_6
## Min. :3 Min. :4 Min. :5 Min. :6
## 1st Qu.:3 1st Qu.:4 1st Qu.:5 1st Qu.:6
## Median :3 Median :4 Median :5 Median :6
## Mean :3 Mean :4 Mean :5 Mean :6
## 3rd Qu.:3 3rd Qu.:4 3rd Qu.:5 3rd Qu.:6
## Max. :3 Max. :4 Max. :5 Max. :6
## NA's :267629 NA's :306842 NA's :303842 NA's :308030
## servmed_7 servmed_8 servmed_9 servmed_10
## Min. :7 Min. :8 Min. :9 Min. :10
## 1st Qu.:7 1st Qu.:8 1st Qu.:9 1st Qu.:10
## Median :7 Median :8 Median :9 Median :10
## Mean :7 Mean :8 Mean :9 Mean :10
## 3rd Qu.:7 3rd Qu.:8 3rd Qu.:9 3rd Qu.:10
## Max. :7 Max. :8 Max. :9 Max. :10
## NA's :308218 NA's :241460 NA's :268189 NA's :308305
## servmed_11 servmed_12 hh_lug mm_lug
## Min. :11 Min. :12 Min. : 0.000 Min. : 0.00
## 1st Qu.:11 1st Qu.:12 1st Qu.: 0.000 1st Qu.:10.00
## Median :11 Median :12 Median : 0.000 Median :15.00
## Mean :11 Mean :12 Mean : 0.302 Mean :17.65
## 3rd Qu.:11 3rd Qu.:12 3rd Qu.: 0.000 3rd Qu.:30.00
## Max. :11 Max. :12 Max. :72.000 Max. :59.00
## NA's :306426 NA's :308691 NA's :108161 NA's :108161
## hh_esp mm_esp pagoaten_1 pagoaten_2
## Min. : 0.000 Min. : 0.0 Min. :1 Min. :2
## 1st Qu.: 0.000 1st Qu.: 1.0 1st Qu.:1 1st Qu.:2
## Median : 0.000 Median :10.0 Median :1 Median :2
## Mean : 0.485 Mean :13.6 Mean :1 Mean :2
## 3rd Qu.: 0.000 3rd Qu.:20.0 3rd Qu.:1 3rd Qu.:2
## Max. :99.000 Max. :59.0 Max. :1 Max. :2
## NA's :108161 NA's :108161 NA's :198336 NA's :193482
## pagoaten_3 pagoaten_4 pagoaten_5 pagoaten_6
## Min. :3 Min. :4 Min. :5 Min. :6
## 1st Qu.:3 1st Qu.:4 1st Qu.:5 1st Qu.:6
## Median :3 Median :4 Median :5 Median :6
## Mean :3 Mean :4 Mean :5 Mean :6
## 3rd Qu.:3 3rd Qu.:4 3rd Qu.:5 3rd Qu.:6
## Max. :3 Max. :4 Max. :5 Max. :6
## NA's :283928 NA's :302310 NA's :306343 NA's :308157
## pagoaten_7 noatenc_1 noatenc_2 noatenc_3
## Min. :7 Min. :1 Min. :2 Min. :3
## 1st Qu.:7 1st Qu.:1 1st Qu.:2 1st Qu.:3
## Median :7 Median :1 Median :2 Median :3
## Mean :7 Mean :1 Mean :2 Mean :3
## 3rd Qu.:7 3rd Qu.:1 3rd Qu.:2 3rd Qu.:3
## Max. :7 Max. :1 Max. :2 Max. :3
## NA's :231886 NA's :309252 NA's :307199 NA's :308937
## noatenc_4 noatenc_5 noatenc_6 noatenc_7
## Min. :4 Min. :5 Min. :6 Min. :7
## 1st Qu.:4 1st Qu.:5 1st Qu.:6 1st Qu.:7
## Median :4 Median :5 Median :6 Median :7
## Mean :4 Mean :5 Mean :6 Mean :7
## 3rd Qu.:4 3rd Qu.:5 3rd Qu.:6 3rd Qu.:7
## Max. :4 Max. :5 Max. :6 Max. :7
## NA's :309526 NA's :309247 NA's :309638 NA's :309676
## noatenc_8 noatenc_9 noatenc_10 noatenc_11
## Min. :8 Min. :9 Min. :10 Min. :11
## 1st Qu.:8 1st Qu.:9 1st Qu.:10 1st Qu.:11
## Median :8 Median :9 Median :10 Median :11
## Mean :8 Mean :9 Mean :10 Mean :11
## 3rd Qu.:8 3rd Qu.:9 3rd Qu.:10 3rd Qu.:11
## Max. :8 Max. :9 Max. :10 Max. :11
## NA's :309161 NA's :309394 NA's :309487 NA's :309413
## noatenc_12 noatenc_13 noatenc_14 noatenc_15
## Min. :12 Min. :13 Min. :14 Min. :15
## 1st Qu.:12 1st Qu.:13 1st Qu.:14 1st Qu.:15
## Median :12 Median :13 Median :14 Median :15
## Mean :12 Mean :13 Mean :14 Mean :15
## 3rd Qu.:12 3rd Qu.:13 3rd Qu.:14 3rd Qu.:15
## Max. :12 Max. :13 Max. :14 Max. :15
## NA's :309613 NA's :308712 NA's :309170 NA's :279492
## noatenc_16 norecib_1 norecib_2 norecib_3
## Min. :16 Min. :1 Min. :2 Min. :3
## 1st Qu.:16 1st Qu.:1 1st Qu.:2 1st Qu.:3
## Median :16 Median :1 Median :2 Median :3
## Mean :16 Mean :1 Mean :2 Mean :3
## 3rd Qu.:16 3rd Qu.:1 3rd Qu.:2 3rd Qu.:3
## Max. :16 Max. :1 Max. :2 Max. :3
## NA's :262664 NA's :309458 NA's :309598 NA's :309483
## norecib_4 norecib_5 norecib_6 norecib_7
## Min. :4 Min. :5 Min. :6 Min. :7
## 1st Qu.:4 1st Qu.:5 1st Qu.:6 1st Qu.:7
## Median :4 Median :5 Median :6 Median :7
## Mean :4 Mean :5 Mean :6 Mean :7
## 3rd Qu.:4 3rd Qu.:5 3rd Qu.:6 3rd Qu.:7
## Max. :4 Max. :5 Max. :6 Max. :7
## NA's :309657 NA's :309657 NA's :309681 NA's :309682
## norecib_8 norecib_9 norecib_10 norecib_11
## Min. :8 Min. :9 Min. :10 Min. :11
## 1st Qu.:8 1st Qu.:9 1st Qu.:10 1st Qu.:11
## Median :8 Median :9 Median :10 Median :11
## Mean :8 Mean :9 Mean :10 Mean :11
## 3rd Qu.:8 3rd Qu.:9 3rd Qu.:10 3rd Qu.:11
## Max. :8 Max. :9 Max. :10 Max. :11
## NA's :309625 NA's :309649 NA's :309681 NA's :309669
## norecib_12 razon_1 razon_2 razon_3
## Min. :12 Min. :1 Min. :2 Min. :3
## 1st Qu.:12 1st Qu.:1 1st Qu.:2 1st Qu.:3
## Median :12 Median :1 Median :2 Median :3
## Mean :12 Mean :1 Mean :2 Mean :3
## 3rd Qu.:12 3rd Qu.:1 3rd Qu.:2 3rd Qu.:3
## Max. :12 Max. :1 Max. :2 Max. :3
## NA's :309671 NA's :309672 NA's :309682 NA's :309608
## razon_4 razon_5 razon_6 razon_7
## Min. :4 Min. :5 Min. :6 Min. :7
## 1st Qu.:4 1st Qu.:5 1st Qu.:6 1st Qu.:7
## Median :4 Median :5 Median :6 Median :7
## Mean :4 Mean :5 Mean :6 Mean :7
## 3rd Qu.:4 3rd Qu.:5 3rd Qu.:6 3rd Qu.:7
## Max. :4 Max. :5 Max. :6 Max. :7
## NA's :309621 NA's :309659 NA's :309637 NA's :309618
## razon_8 razon_9 razon_10 razon_11
## Min. :8 Min. :9 Min. :10 Min. :11
## 1st Qu.:8 1st Qu.:9 1st Qu.:10 1st Qu.:11
## Median :8 Median :9 Median :10 Median :11
## Mean :8 Mean :9 Mean :10 Mean :11
## 3rd Qu.:8 3rd Qu.:9 3rd Qu.:10 3rd Qu.:11
## Max. :8 Max. :9 Max. :10 Max. :11
## NA's :309524 NA's :309647 NA's :309632 NA's :309506
## diabetes pres_alta peso segvol_1
## Min. :1.000 Min. :1.000 Min. :1.00 Min. :1
## 1st Qu.:1.000 1st Qu.:1.000 1st Qu.:1.00 1st Qu.:1
## Median :2.000 Median :1.000 Median :1.00 Median :1
## Mean :1.646 Mean :1.463 Mean :1.37 Mean :1
## 3rd Qu.:2.000 3rd Qu.:2.000 3rd Qu.:2.00 3rd Qu.:1
## Max. :2.000 Max. :2.000 Max. :2.00 Max. :1
## NA's :58989 NA's :58989 NA's :150 NA's :304260
## segvol_2 segvol_3 segvol_4 segvol_5
## Min. :2 Min. :3 Min. :4 Min. :5
## 1st Qu.:2 1st Qu.:3 1st Qu.:4 1st Qu.:5
## Median :2 Median :3 Median :4 Median :5
## Mean :2 Mean :3 Mean :4 Mean :5
## 3rd Qu.:2 3rd Qu.:3 3rd Qu.:4 3rd Qu.:5
## Max. :2 Max. :3 Max. :4 Max. :5
## NA's :307534 NA's :304315 NA's :309427 NA's :308432
## segvol_6 segvol_7 hijos_viv hijos_mue
## Min. :6 Min. :7 Min. : 0.000 Min. : 0.000
## 1st Qu.:6 1st Qu.:7 1st Qu.: 0.000 1st Qu.: 0.000
## Median :6 Median :7 Median : 2.000 Median : 0.000
## Mean :6 Mean :7 Mean : 2.229 Mean : 0.209
## 3rd Qu.:6 3rd Qu.:7 3rd Qu.: 3.000 3rd Qu.: 0.000
## Max. :6 Max. :7 Max. :25.000 Max. :16.000
## NA's :77288 NA's :304342 NA's :178336 NA's :218788
## hijos_sob trabajo_mp motivo_aus act_pnea1
## Min. : 0.000 Min. :1.000 Min. : 1.000 Min. :1.00
## 1st Qu.: 2.000 1st Qu.:1.000 1st Qu.: 6.000 1st Qu.:3.00
## Median : 3.000 Median :1.000 Median : 6.000 Median :3.00
## Mean : 3.012 Mean :1.402 Mean : 6.576 Mean :3.34
## 3rd Qu.: 4.000 3rd Qu.:2.000 3rd Qu.: 6.000 3rd Qu.:4.00
## Max. :19.000 Max. :2.000 Max. :13.000 Max. :6.00
## NA's :218788 NA's :58989 NA's :308925 NA's :209671
## act_pnea2 num_trabaj c_futuro ct_futuro
## Min. :2.000 Min. :1.000 Min. :1.000 Min. :1.000
## 1st Qu.:3.000 1st Qu.:1.000 1st Qu.:2.000 1st Qu.:9.000
## Median :4.000 Median :1.000 Median :2.000 Median :9.000
## Mean :3.692 Mean :1.095 Mean :1.797 Mean :7.549
## 3rd Qu.:4.000 3rd Qu.:1.000 3rd Qu.:2.000 3rd Qu.:9.000
## Max. :5.000 Max. :2.000 Max. :2.000 Max. :9.000
## NA's :306308 NA's :159002 NA's :309216 NA's :309216
## entidad est_dis upm factor
## Min. : 1.00 Min. : 1.0 Min. : 1 Min. : 6.0
## 1st Qu.: 8.00 1st Qu.:124.0 1st Qu.: 2866 1st Qu.: 157.0
## Median :16.00 Median :260.0 Median : 5292 Median : 283.0
## Mean :16.05 Mean :265.5 Mean : 5283 Mean : 416.6
## 3rd Qu.:24.00 3rd Qu.:399.0 3rd Qu.: 7791 3rd Qu.: 531.0
## Max. :32.00 Max. :560.0 Max. :10232 Max. :6470.0
##
## 9. Renombrar variables para facilitar el análisis
``` r
# Renombrar columnas clave con nombres más legibles
#rename
pob_nueva <- poblacion %>%
rename(
años_imss = ss_aa,
disc_audi = cau_oir
)
## 10. Re-codificar variables categóricas con case_when()
``` r
# Re-codificar variable de sexo
#mutate y case_when
poblacionjl<-poblacionjl%>%
mutate(sexo=case_when(
sexo == 1 ~ "Hombre",
sexo == 2 ~ "Mujer"
))
# Crear una variable binaria para tercera edad
#ifelse
poblacionjl<-poblacionjl%>%
mutate(tercera_edad=ifelse(edad>=60, "tercera Edad", "menor de 60 años"))
#crera nuevas variables
# Identificar variables con muchos NA
#colSums y is.na
colSums(is.na(poblacionjl))
## sexo edad tercera_edad
## 0 0 0
# Eliminar filas donde falta la edad
#filter e is.na
pob_nueva<-pob_nueva%>%
filter(!is.na(disc_brazo))
# Confirmar que ya no hay NA en edad
#anyNA
Filtra personas de entre 18 y 25 años (utilizar filter)
Crea una nueva variable llamada joven (1 si tiene 18–25 años, 0 si no).
-Crear una nueva variable que se llame nivel_educativo
-seleccionar solo las variables: edad joven, nivel_ educativo, sexo.
-crear un resumen con la función summarize donde me digas la cantidad de personas de cada sexo por edad.
#Filtra personas de entre 18 y 25 años
pob_jovenes <- poblacion %>%
filter(edad >= 18 & edad <=25)
#Variable joven
pob_jovenes <- pob_jovenes %>%
mutate(joven = ifelse(edad >= 18 & edad <= 25, 1, 0))
#Variable nivel educativo
pob_jovenes <- pob_jovenes %>%
rename(nivel_educativo = nivel)
#Eliminar NA en nivel_educativo
pob_jovenes <- pob_jovenes %>%
filter(is.na(nivel_educativo))
#Seleccionar variables
pob_jovenes <- pob_jovenes %>%
select(edad, joven, nivel_educativo, sexo)
#Resumen
resumen_h <- pob_jovenes %>%
filter(sexo == 1) %>%
summarise(cantidad_hombres = n())
resumen_m <- pob_jovenes %>%
filter(sexo == 2) %>%
summarise(cantidad_mujeres = n())
# Guardar como CSV o Excel
write_csv(pob_jovenes, "pob_jovenes.csv") #Consultado con IA porque no pude guardarlo como excel
#write_csv
#write_xlsx