1. Descarga de la base de datos

Dirígete a la página oficial de la ENIGH 2022: https://www.inegi.org.mx/programas/enigh/nc/2022/#microdatos


Busca el archivo titulado "Características sociodemográficas de los integrantes del hogar (población)" y descárgalo. Si está en formato ZIP, descomprímelo y ubica el archivo .csv.

Guarda este archivo en una carpeta para tu proyecto, por ejemplo, datos/.

## 2. Preparación del entorno de trabajo


``` r
# Instala estas librerías si aún no lo has hecho:
# install.packages("readr")
# install.packages("dplyr")

library(readr)
library(dplyr)
library(tidyr)
library(stringr)

3. Importación del archivo CSV

# Carga tu archivo csv
poblacion <- read.csv("poblacion.csv")

# Verifica que la base se cargó correctamente
head(poblacion)
##    folioviv foliohog numren parentesco sexo edad madre_hog madre_id padre_hog
## 1 100005002        1      1        101    2   91         2                  2
## 2 100005002        1      2        301    2   48         1       01         2
## 3 100005002        1      3        609    2   13         1       02         2
## 4 100005003        1      1        101    1   68         2                  2
## 5 100005003        1      2        201    2   64         2                  2
## 6 100005004        1      1        101    1   56         2                  2
##   padre_id disc_camin disc_ver disc_brazo disc_apren disc_oir disc_vest
## 1                   3        4          4          4        4         4
## 2                   4        4          4          4        4         4
## 3                   4        4          4          4        4         4
## 4                   4        4          4          4        4         4
## 5                   4        4          4          4        4         4
## 6                   4        4          4          4        4         4
##   disc_habla disc_acti cau_camin cau_ver cau_brazo cau_apren cau_oir cau_vest
## 1          4         4         2                                             
## 2          4         4                                                       
## 3          4         4                                                       
## 4          4         4                                                       
## 5          4         4                                                       
## 6          4         4                                                       
##   cau_habla cau_acti hablaind lenguaind hablaesp comprenind etnia alfabetism
## 1                           2        NA       NA          2     2          1
## 2                           2        NA       NA          2     2          1
## 3                           2        NA       NA          2     2          1
## 4                           2        NA       NA          2     2          1
## 5                           2        NA       NA          2     2          1
## 6                           2        NA       NA          2     2          1
##   asis_esc nivel grado tipoesc tiene_b otorg_b forma_b tiene_c otorg_c forma_c
## 1        2    NA    NA      NA      NA      NA      NA      NA      NA      NA
## 2        2    NA    NA      NA      NA      NA      NA      NA      NA      NA
## 3        1     7     2       2       1       3       5      NA      NA      NA
## 4        2    NA    NA      NA      NA      NA      NA      NA      NA      NA
## 5        2    NA    NA      NA      NA      NA      NA      NA      NA      NA
## 6        2    NA    NA      NA      NA      NA      NA      NA      NA      NA
##   nivelaprob gradoaprob antec_esc residencia edo_conyug pareja_hog conyuge_id
## 1          2          4        NA          1          5         NA           
## 2          4          3        NA          1          6         NA           
## 3          3          1        NA          1          6         NA           
## 4          4          3        NA          9          2          1         02
## 5          7          5         3          9          2          1         01
## 6          7          5         3          1          2          1         02
##   segsoc ss_aa ss_mm redsoc_1 redsoc_2 redsoc_3 redsoc_4 redsoc_5 redsoc_6
## 1      2    NA    NA        1        3        1        3        2       NA
## 2      2    NA    NA        2        2        1        3        2       NA
## 3      2    NA    NA        2        3        2        3        2       NA
## 4      1    26     0        2        3        2        3        2       NA
## 5      2    NA    NA        3        3        3        3        3       NA
## 6      2    NA    NA        3        3        2        3        3       NA
##   hor_1 min_1 usotiempo1 hor_2 min_2 usotiempo2 hor_3 min_3 usotiempo3 hor_4
## 1    NA    NA          9    NA    NA          9    NA    NA          9    NA
## 2    48     0         NA    NA    NA          9    NA    NA          9     2
## 3    NA    NA          9    35     0         NA    NA    NA          9    NA
## 4    40     0         NA    NA    NA          9    NA    NA          9    NA
## 5    12     0         NA     6     0         NA    NA    NA          9    NA
## 6    68     0         NA    NA    NA          9    NA    NA          9    NA
##   min_4 usotiempo4 hor_5 min_5 usotiempo5 hor_6 min_6 usotiempo6 hor_7 min_7
## 1    NA          9    NA    NA          9     3     0         NA    NA    NA
## 2     0         NA    NA    NA          9    14     0         NA    NA    NA
## 3    NA          9    NA    NA          9    NA    NA          9    NA    NA
## 4    NA          9    NA    NA          9    NA    NA          9    NA    NA
## 5    NA          9    NA    NA          9    15     0         NA    NA    NA
## 6    NA          9     5     0         NA    NA    NA          9    NA    NA
##   usotiempo7 hor_8 min_8 usotiempo8 pop_insabi atemed inst_1 inst_2 inst_3
## 1          9    10     0         NA          2      1     NA      2     NA
## 2          9    10     0         NA          2      1     NA      2     NA
## 3          9    18     0         NA          2      1     NA      2     NA
## 4          9    12     0         NA          2      1      1     NA     NA
## 5          9    20     0         NA          2      1      1     NA     NA
## 6          9    20     0         NA          2      2     NA     NA     NA
##   inst_4 inst_5 inst_6 inscr_1 inscr_2 inscr_3 inscr_4 inscr_5 inscr_6 inscr_7
## 1     NA     NA     NA      NA      NA      NA      NA      NA      NA       7
## 2     NA     NA     NA       1      NA      NA      NA      NA      NA      NA
## 3     NA     NA     NA      NA      NA       3      NA      NA      NA      NA
## 4     NA     NA     NA       1      NA      NA      NA      NA      NA      NA
## 5     NA     NA     NA       1      NA      NA      NA      NA      NA      NA
## 6     NA     NA     NA      NA      NA      NA      NA      NA      NA      NA
##   inscr_8 prob_anio prob_mes prob_sal aten_sal servmed_1 servmed_2 servmed_3
## 1      NA      2022       11        1        1        NA        NA        NA
## 2      NA      2019       11        1        1        NA        NA        NA
## 3      NA      2020        7        1        1        NA        NA        NA
## 4      NA      2021       11        1        1        NA        NA        NA
## 5      NA      2022        9        1        1        NA        NA        NA
## 6      NA      2021       12        1        1        NA        NA        NA
##   servmed_4 servmed_5 servmed_6 servmed_7 servmed_8 servmed_9 servmed_10
## 1        NA         5        NA        NA        NA        NA         NA
## 2        NA         5        NA        NA        NA        NA         NA
## 3        NA        NA        NA        NA         8        NA         NA
## 4        NA        NA        NA        NA         8        NA         NA
## 5        NA        NA        NA        NA         8        NA         NA
## 6        NA        NA        NA        NA         8        NA         NA
##   servmed_11 servmed_12 hh_lug mm_lug hh_esp mm_esp pagoaten_1 pagoaten_2
## 1         NA         NA      0     10      0     20         NA         NA
## 2         NA         NA      0      5      4      0         NA         NA
## 3         NA         NA      0      5      1      0          1          2
## 4         NA         NA      0     10      0      5          1          2
## 5         NA         NA      0     30      0     20          1          2
## 6         NA         NA      0     15      0      5          1          2
##   pagoaten_3 pagoaten_4 pagoaten_5 pagoaten_6 pagoaten_7 noatenc_1 noatenc_2
## 1         NA         NA         NA         NA          7        NA        NA
## 2         NA         NA         NA         NA          7        NA        NA
## 3         NA         NA         NA         NA         NA        NA        NA
## 4         NA         NA         NA         NA         NA        NA        NA
## 5          3         NA         NA         NA         NA        NA        NA
## 6         NA         NA         NA         NA         NA        NA        NA
##   noatenc_3 noatenc_4 noatenc_5 noatenc_6 noatenc_7 noatenc_8 noatenc_9
## 1        NA        NA        NA        NA        NA        NA        NA
## 2        NA        NA        NA        NA        NA        NA        NA
## 3        NA        NA        NA        NA        NA        NA        NA
## 4        NA        NA        NA        NA        NA        NA        NA
## 5        NA        NA        NA        NA        NA        NA        NA
## 6        NA        NA        NA        NA        NA        NA        NA
##   noatenc_10 noatenc_11 noatenc_12 noatenc_13 noatenc_14 noatenc_15 noatenc_16
## 1         NA         NA         NA         NA         NA         NA         NA
## 2         NA         NA         NA         NA         NA         NA         NA
## 3         NA         NA         NA         NA         NA         NA         NA
## 4         NA         NA         NA         NA         NA         NA         NA
## 5         NA         NA         NA         NA         NA         NA         NA
## 6         NA         NA         NA         NA         NA         NA         NA
##   norecib_1 norecib_2 norecib_3 norecib_4 norecib_5 norecib_6 norecib_7
## 1        NA        NA        NA        NA        NA        NA        NA
## 2        NA        NA        NA        NA        NA        NA        NA
## 3        NA        NA        NA        NA        NA        NA        NA
## 4        NA        NA        NA        NA        NA        NA        NA
## 5        NA        NA        NA        NA        NA        NA        NA
## 6        NA        NA        NA        NA        NA        NA        NA
##   norecib_8 norecib_9 norecib_10 norecib_11 norecib_12 razon_1 razon_2 razon_3
## 1        NA        NA         NA         NA         NA      NA      NA      NA
## 2        NA        NA         NA         NA         NA      NA      NA      NA
## 3        NA        NA         NA         NA         NA      NA      NA      NA
## 4        NA        NA         NA         NA         NA      NA      NA      NA
## 5        NA        NA         NA         NA         NA      NA      NA      NA
## 6        NA        NA         NA         NA         NA      NA      NA      NA
##   razon_4 razon_5 razon_6 razon_7 razon_8 razon_9 razon_10 razon_11 diabetes
## 1      NA      NA      NA      NA      NA      NA       NA       NA        1
## 2      NA      NA      NA      NA      NA      NA       NA       NA        2
## 3      NA      NA      NA      NA      NA      NA       NA       NA        2
## 4      NA      NA      NA      NA      NA      NA       NA       NA        2
## 5      NA      NA      NA      NA      NA      NA       NA       NA        1
## 6      NA      NA      NA      NA      NA      NA       NA       NA        2
##   pres_alta peso segvol_1 segvol_2 segvol_3 segvol_4 segvol_5 segvol_6 segvol_7
## 1         1    1       NA       NA       NA       NA       NA        6       NA
## 2         1    1       NA       NA       NA       NA       NA        6       NA
## 3         2    1       NA       NA       NA       NA       NA        6       NA
## 4         1    1       NA        2       NA       NA       NA       NA       NA
## 5         1    1       NA       NA       NA       NA       NA        6       NA
## 6         1    1       NA        2       NA       NA       NA       NA       NA
##   hijos_viv hijos_mue hijos_sob trabajo_mp motivo_aus act_pnea1 act_pnea2
## 1         3         0         3          2         NA         5        NA
## 2         1         0         1          1         NA        NA        NA
## 3         0        NA        NA          2         NA         4        NA
## 4        NA        NA        NA          1         NA        NA        NA
## 5         2         0         2          1         NA        NA        NA
## 6        NA        NA        NA          1         NA        NA        NA
##   num_trabaj c_futuro ct_futuro entidad est_dis upm factor
## 1         NA       NA        NA       1       3   1    206
## 2          1       NA        NA       1       3   1    206
## 3         NA       NA        NA       1       3   1    206
## 4          1       NA        NA       1       3   1    206
## 5          1       NA        NA       1       3   1    206
## 6          1       NA        NA       1       3   1    206

4. Exploración inicial de los datos

# Utiliza las funciones head, tail, str, summary y names y anota frente a su resultado para qué se utiliza cada

head(poblacion) #nos muestra los primeros 6 renglones 
tail(poblacion) #muestra las ultimas 6 observaciones
str(poblacion) #estructura de cada variable en análisis
summary(poblacion) #estadisticas generales de las variables, numericas y espectro general de las no numericas 
mode(poblacion) #modo en que está guardada la info 
names(poblacion) #nombres de todas las columnas
## 5. Identificación de valores faltantes
# Utiliza la función anyNA, is.na y anota frente a su resultado para qué se utiliza cada una
``


anyNA(poblacion) #verificar si dentro de la funcion existe el NA

is.na(poblacion)# te dice si es que hay una variable con na y solo es en las primeras cinco filas

sum(is.na(poblacion)) #sumar del dataframe completos cuantos na hay, se suma por columna de na 

colSums(is.na(poblacion)) #variables que tienen mayor cantidad de na, se puede explicar por la continuidad de preguntas
## 6. Filtrado y selección de datos
#Crea un nuevo data frame que se llame poblacion_nl a partir del data frame original llamado poblacion

poblacion_nl <- poblacion%>% # %>%  operador de dplyr y hace que se vuelva en lo que le pidas que filtre 
   filter(entidad=="19")%>% #agregarle comilla porque está en texto no numerico 
   select(sexo,edad,comprenind,etnia,nivel)
#filter filas
#select columnas
 
#Filtra los datos solamente para personas que vivan en el estado de Nuevo León
 
 
#Selecciona por lo menos 5 variables de interés para tu análisis

7. Agrupación y resumen de datos


``` r
#Calcula el promedio de edad por sexo para el estado de Jalisco
poblacionjl <- poblacion %>%
  filter(entidad=="14") %>% 
  select(sexo,edad)
poblacionh <- poblacion %>%
  filter(entidad=="14") %>%
  filter(sexo=="1") %>%
  select(sexo, edad)
mean(poblacionh$edad)
## [1] 32.86837
poblacionm <- poblacion %>%
  filter(entidad=="14") %>%
  filter(sexo=="2") %>%
  select(sexo, edad)
mean(poblacionh$edad)
## [1] 32.86837




## 8. Revisar estructura


# Revisar estructura general


``` r
summary(poblacion)
##     folioviv            foliohog         numren         parentesco   
##  Min.   :1.000e+08   Min.   :1.000   Min.   : 1.000   Min.   :101.0  
##  1st Qu.:8.064e+08   1st Qu.:1.000   1st Qu.: 1.000   1st Qu.:101.0  
##  Median :1.602e+09   Median :1.000   Median : 2.000   Median :301.0  
##  Mean   :1.631e+09   Mean   :1.014   Mean   : 2.679   Mean   :268.8  
##  3rd Qu.:2.460e+09   3rd Qu.:1.000   3rd Qu.: 4.000   3rd Qu.:301.0  
##  Max.   :3.261e+09   Max.   :5.000   Max.   :19.000   Max.   :712.0  
##                                                                      
##       sexo            edad          madre_hog       madre_id        
##  Min.   :1.000   Min.   :  0.00   Min.   :1.000   Length:309684     
##  1st Qu.:1.000   1st Qu.: 15.00   1st Qu.:1.000   Class :character  
##  Median :2.000   Median : 30.00   Median :2.000   Mode  :character  
##  Mean   :1.517   Mean   : 33.27   Mean   :1.556                     
##  3rd Qu.:2.000   3rd Qu.: 50.00   3rd Qu.:2.000                     
##  Max.   :2.000   Max.   :109.00   Max.   :2.000                     
##                                                                     
##    padre_hog       padre_id          disc_camin          disc_ver        
##  Min.   :1.000   Length:309684      Length:309684      Length:309684     
##  1st Qu.:1.000   Class :character   Class :character   Class :character  
##  Median :2.000   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :1.681                                                           
##  3rd Qu.:2.000                                                           
##  Max.   :2.000                                                           
##                                                                          
##   disc_brazo         disc_apren          disc_oir          disc_vest        
##  Length:309684      Length:309684      Length:309684      Length:309684     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##   disc_habla         disc_acti          cau_camin           cau_ver         
##  Length:309684      Length:309684      Length:309684      Length:309684     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##   cau_brazo          cau_apren           cau_oir            cau_vest        
##  Length:309684      Length:309684      Length:309684      Length:309684     
##  Class :character   Class :character   Class :character   Class :character  
##  Mode  :character   Mode  :character   Mode  :character   Mode  :character  
##                                                                             
##                                                                             
##                                                                             
##                                                                             
##   cau_habla           cau_acti            hablaind       lenguaind     
##  Length:309684      Length:309684      Min.   :1.000   Min.   : 111.0  
##  Class :character   Class :character   1st Qu.:2.000   1st Qu.: 491.0  
##  Mode  :character   Mode  :character   Median :2.000   Median : 922.0  
##                                        Mean   :1.932   Mean   : 835.2  
##                                        3rd Qu.:2.000   3rd Qu.:1021.0  
##                                        Max.   :2.000   Max.   :9999.0  
##                                        NA's   :11472   NA's   :289388  
##     hablaesp        comprenind        etnia         alfabetism   
##  Min.   :1.000    Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:1.000    1st Qu.:2.000   1st Qu.:1.000   1st Qu.:1.000  
##  Median :1.000    Median :2.000   Median :2.000   Median :1.000  
##  Mean   :1.063    Mean   :1.974   Mean   :1.712   Mean   :1.103  
##  3rd Qu.:1.000    3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:1.000  
##  Max.   :2.000    Max.   :2.000   Max.   :2.000   Max.   :2.000  
##  NA's   :289388   NA's   :31768   NA's   :11472   NA's   :11472  
##     asis_esc         nivel            grado           tipoesc      
##  Min.   :1.000   Min.   : 1.000   Min.   :1.000    Min.   :1.000   
##  1st Qu.:1.000   1st Qu.: 6.000   1st Qu.:1.000    1st Qu.:1.000   
##  Median :2.000   Median : 6.000   Median :2.000    Median :1.000   
##  Mean   :1.715   Mean   : 6.942   Mean   :2.596    Mean   :1.107   
##  3rd Qu.:2.000   3rd Qu.: 9.000   3rd Qu.:3.000    3rd Qu.:1.000   
##  Max.   :2.000   Max.   :13.000   Max.   :6.000    Max.   :3.000   
##  NA's   :11472   NA's   :224672   NA's   :224675   NA's   :224672  
##     tiene_b          otorg_b          forma_b          tiene_c      
##  Min.   :1.000    Min.   :1.000    Min.   :1.000    Min.   :1.000   
##  1st Qu.:2.000    1st Qu.:1.000    1st Qu.:1.000    1st Qu.:2.000   
##  Median :2.000    Median :1.000    Median :1.000    Median :2.000   
##  Mean   :1.763    Mean   :1.424    Mean   :1.363    Mean   :1.991   
##  3rd Qu.:2.000    3rd Qu.:1.000    3rd Qu.:1.000    3rd Qu.:2.000   
##  Max.   :2.000    Max.   :5.000    Max.   :5.000    Max.   :2.000   
##  NA's   :224672   NA's   :289571   NA's   :289571   NA's   :283985  
##     otorg_c          forma_c         nivelaprob      gradoaprob   
##  Min.   :1.00     Min.   :1.000    Min.   :0.000   Min.   :0.000  
##  1st Qu.:1.00     1st Qu.:1.000    1st Qu.:2.000   1st Qu.:2.000  
##  Median :2.00     Median :2.000    Median :3.000   Median :3.000  
##  Mean   :1.95     Mean   :1.991    Mean   :3.249   Mean   :3.068  
##  3rd Qu.:3.00     3rd Qu.:3.000    3rd Qu.:4.000   3rd Qu.:4.000  
##  Max.   :4.00     Max.   :3.000    Max.   :9.000   Max.   :6.000  
##  NA's   :309462   NA's   :309462   NA's   :11472   NA's   :11472  
##    antec_esc        residencia      edo_conyug      pareja_hog    
##  Min.   :1.000    Min.   : 1.00   Min.   :1.00    Min.   :1.000   
##  1st Qu.:3.000    1st Qu.: 8.00   1st Qu.:2.00    1st Qu.:1.000   
##  Median :3.000    Median :16.00   Median :2.00    Median :1.000   
##  Mean   :2.949    Mean   :16.15   Mean   :3.45    Mean   :1.036   
##  3rd Qu.:3.000    3rd Qu.:24.00   3rd Qu.:6.00    3rd Qu.:1.000   
##  Max.   :5.000    Max.   :34.00   Max.   :6.00    Max.   :2.000   
##  NA's   :260630   NA's   :20790   NA's   :58845   NA's   :178067  
##   conyuge_id            segsoc          ss_aa            ss_mm       
##  Length:309684      Min.   :1.000   Min.   :-1.00    Min.   :-1.000  
##  Class :character   1st Qu.:1.000   1st Qu.: 3.00    1st Qu.: 0.000  
##  Mode  :character   Median :2.000   Median : 8.00    Median : 0.000  
##                     Mean   :1.571   Mean   :11.53    Mean   : 0.721  
##                     3rd Qu.:2.000   3rd Qu.:18.00    3rd Qu.: 0.000  
##                     Max.   :2.000   Max.   :70.00    Max.   :11.000  
##                     NA's   :58989   NA's   :202135   NA's   :202135  
##     redsoc_1        redsoc_2        redsoc_3        redsoc_4    
##  Min.   :1.000   Min.   :1.000   Min.   :1.000   Min.   :1.000  
##  1st Qu.:2.000   1st Qu.:2.000   1st Qu.:2.000   1st Qu.:3.000  
##  Median :2.000   Median :3.000   Median :2.000   Median :3.000  
##  Mean   :2.484   Mean   :2.746   Mean   :2.107   Mean   :2.887  
##  3rd Qu.:3.000   3rd Qu.:3.000   3rd Qu.:2.000   3rd Qu.:3.000  
##  Max.   :5.000   Max.   :5.000   Max.   :5.000   Max.   :5.000  
##  NA's   :95430   NA's   :95430   NA's   :95430   NA's   :95430  
##     redsoc_5        redsoc_6          hor_1            min_1       
##  Min.   :1.000   Min.   :1.00     Min.   :  0.00   Min.   : 0.000  
##  1st Qu.:2.000   1st Qu.:2.00     1st Qu.: 28.00   1st Qu.: 0.000  
##  Median :2.000   Median :3.00     Median : 45.00   Median : 0.000  
##  Mean   :2.034   Mean   :2.65     Mean   : 41.24   Mean   : 0.232  
##  3rd Qu.:2.000   3rd Qu.:3.00     3rd Qu.: 52.00   3rd Qu.: 0.000  
##  Max.   :5.000   Max.   :5.00     Max.   :168.00   Max.   :59.000  
##  NA's   :95430   NA's   :213179   NA's   :182456   NA's   :182456  
##    usotiempo1         hor_2            min_2          usotiempo2    
##  Min.   :8.000    Min.   :  0.0    Min.   : 0.000   Min.   :8.000   
##  1st Qu.:9.000    1st Qu.: 12.0    1st Qu.: 0.000   1st Qu.:9.000   
##  Median :9.000    Median : 30.0    Median : 0.000   Median :9.000   
##  Mean   :8.999    Mean   : 29.6    Mean   : 0.737   Mean   :8.999   
##  3rd Qu.:9.000    3rd Qu.: 40.0    3rd Qu.: 0.000   3rd Qu.:9.000   
##  Max.   :9.000    Max.   :160.0    Max.   :50.000   Max.   :9.000   
##  NA's   :222658   NA's   :270377   NA's   :270377   NA's   :134737  
##      hor_3            min_3          usotiempo3         hor_4       
##  Min.   : 0.000   Min.   : 0.000   Min.   :8.000    Min.   : 0.00   
##  1st Qu.: 2.000   1st Qu.: 0.000   1st Qu.:9.000    1st Qu.: 8.00   
##  Median : 4.000   Median : 0.000   Median :9.000    Median :18.00   
##  Mean   : 7.674   Mean   : 1.342   Mean   :8.999    Mean   :23.41   
##  3rd Qu.: 9.000   3rd Qu.: 0.000   3rd Qu.:9.000    3rd Qu.:35.00   
##  Max.   :99.000   Max.   :50.000   Max.   :9.000    Max.   :99.00   
##  NA's   :294481   NA's   :294481   NA's   :110633   NA's   :254233  
##      min_4          usotiempo4         hor_5            min_5       
##  Min.   : 0.000   Min.   :8.000    Min.   : 0.000   Min.   : 0.000  
##  1st Qu.: 0.000   1st Qu.:9.000    1st Qu.: 2.000   1st Qu.: 0.000  
##  Median : 0.000   Median :9.000    Median : 4.000   Median : 0.000  
##  Mean   : 0.376   Mean   :8.999    Mean   : 6.799   Mean   : 1.156  
##  3rd Qu.: 0.000   3rd Qu.:9.000    3rd Qu.:10.000   3rd Qu.: 0.000  
##  Max.   :59.000   Max.   :9.000    Max.   :99.000   Max.   :50.000  
##  NA's   :254233   NA's   :150881   NA's   :266935   NA's   :266935  
##    usotiempo5         hor_6            min_6          usotiempo6    
##  Min.   :8.000    Min.   : 0.00    Min.   : 0.000   Min.   :8.000   
##  1st Qu.:9.000    1st Qu.: 7.00    1st Qu.: 0.000   1st Qu.:9.000   
##  Median :9.000    Median :14.00    Median : 0.000   Median :9.000   
##  Mean   :8.999    Mean   :16.61    Mean   : 0.658   Mean   :8.996   
##  3rd Qu.:9.000    3rd Qu.:21.00    3rd Qu.: 0.000   3rd Qu.:9.000   
##  Max.   :9.000    Max.   :99.00    Max.   :59.000   Max.   :9.000   
##  NA's   :138179   NA's   :136892   NA's   :136892   NA's   :268222  
##      hor_7            min_7          usotiempo7         hor_8       
##  Min.   : 0.000   Min.   : 0.000   Min.   :8.000    Min.   : 0.00   
##  1st Qu.: 2.000   1st Qu.: 0.000   1st Qu.:9.000    1st Qu.: 9.00   
##  Median : 4.000   Median : 0.000   Median :9.000    Median :15.00   
##  Mean   : 6.435   Mean   : 2.139   Mean   :8.999    Mean   :20.49   
##  3rd Qu.: 7.000   3rd Qu.: 0.000   3rd Qu.:9.000    3rd Qu.:28.00   
##  Max.   :99.000   Max.   :55.000   Max.   :9.000    Max.   :99.00   
##  NA's   :281275   NA's   :281275   NA's   :123839   NA's   :102825  
##      min_8          usotiempo8       pop_insabi       atemed     
##  Min.   : 0.000   Min.   :8.000    Min.   :1.00   Min.   :1.000  
##  1st Qu.: 0.000   1st Qu.:9.000    1st Qu.:2.00   1st Qu.:1.000  
##  Median : 0.000   Median :9.000    Median :2.00   Median :2.000  
##  Mean   : 0.359   Mean   :8.919    Mean   :1.84   Mean   :1.541  
##  3rd Qu.: 0.000   3rd Qu.:9.000    3rd Qu.:2.00   3rd Qu.:2.000  
##  Max.   :59.000   Max.   :9.000    Max.   :2.00   Max.   :2.000  
##  NA's   :102825   NA's   :302289   NA's   :150    NA's   :150    
##      inst_1           inst_2           inst_3           inst_4      
##  Min.   :1        Min.   :2        Min.   :3        Min.   :4       
##  1st Qu.:1        1st Qu.:2        1st Qu.:3        1st Qu.:4       
##  Median :1        Median :2        Median :3        Median :4       
##  Mean   :1        Mean   :2        Mean   :3        Mean   :4       
##  3rd Qu.:1        3rd Qu.:2        3rd Qu.:3        3rd Qu.:4       
##  Max.   :1        Max.   :2        Max.   :3        Max.   :4       
##  NA's   :191208   NA's   :293399   NA's   :306019   NA's   :307298  
##      inst_5           inst_6          inscr_1          inscr_2      
##  Min.   :5        Min.   :6        Min.   :1        Min.   :2       
##  1st Qu.:5        1st Qu.:6        1st Qu.:1        1st Qu.:2       
##  Median :5        Median :6        Median :1        Median :2       
##  Mean   :5        Mean   :6        Mean   :1        Mean   :2       
##  3rd Qu.:5        3rd Qu.:6        3rd Qu.:1        3rd Qu.:2       
##  Max.   :5        Max.   :6        Max.   :1        Max.   :2       
##  NA's   :308089   NA's   :307698   NA's   :255767   NA's   :298148  
##     inscr_3          inscr_4          inscr_5          inscr_6      
##  Min.   :3        Min.   :4        Min.   :5        Min.   :6       
##  1st Qu.:3        1st Qu.:4        1st Qu.:5        1st Qu.:6       
##  Median :3        Median :4        Median :5        Median :6       
##  Mean   :3        Mean   :4        Mean   :5        Mean   :6       
##  3rd Qu.:3        3rd Qu.:4        3rd Qu.:5        3rd Qu.:6       
##  Max.   :3        Max.   :4        Max.   :5        Max.   :6       
##  NA's   :255039   NA's   :307051   NA's   :300082   NA's   :307745  
##     inscr_7          inscr_8         prob_anio        prob_mes     
##  Min.   :7        Min.   :8        Min.   :1955    Min.   : 1.000  
##  1st Qu.:7        1st Qu.:8        1st Qu.:2021    1st Qu.: 5.000  
##  Median :7        Median :8        Median :2022    Median : 7.000  
##  Mean   :7        Mean   :8        Mean   :2021    Mean   : 6.833  
##  3rd Qu.:7        3rd Qu.:8        3rd Qu.:2022    3rd Qu.: 9.000  
##  Max.   :7        Max.   :8        Max.   :2022    Max.   :12.000  
##  NA's   :300302   NA's   :309273   NA's   :32239   NA's   :32240   
##     prob_sal        aten_sal        servmed_1        servmed_2     
##  Min.   :1.000   Min.   :1.000    Min.   :1        Min.   :2       
##  1st Qu.:1.000   1st Qu.:1.000    1st Qu.:1        1st Qu.:2       
##  Median :1.000   Median :1.000    Median :1        Median :2       
##  Mean   :1.271   Mean   :1.003    Mean   :1        Mean   :2       
##  3rd Qu.:2.000   3rd Qu.:1.000    3rd Qu.:1        3rd Qu.:2       
##  Max.   :2.000   Max.   :2.000    Max.   :1        Max.   :2       
##  NA's   :32239   NA's   :107498   NA's   :286916   NA's   :297994  
##    servmed_3        servmed_4        servmed_5        servmed_6     
##  Min.   :3        Min.   :4        Min.   :5        Min.   :6       
##  1st Qu.:3        1st Qu.:4        1st Qu.:5        1st Qu.:6       
##  Median :3        Median :4        Median :5        Median :6       
##  Mean   :3        Mean   :4        Mean   :5        Mean   :6       
##  3rd Qu.:3        3rd Qu.:4        3rd Qu.:5        3rd Qu.:6       
##  Max.   :3        Max.   :4        Max.   :5        Max.   :6       
##  NA's   :267629   NA's   :306842   NA's   :303842   NA's   :308030  
##    servmed_7        servmed_8        servmed_9        servmed_10    
##  Min.   :7        Min.   :8        Min.   :9        Min.   :10      
##  1st Qu.:7        1st Qu.:8        1st Qu.:9        1st Qu.:10      
##  Median :7        Median :8        Median :9        Median :10      
##  Mean   :7        Mean   :8        Mean   :9        Mean   :10      
##  3rd Qu.:7        3rd Qu.:8        3rd Qu.:9        3rd Qu.:10      
##  Max.   :7        Max.   :8        Max.   :9        Max.   :10      
##  NA's   :308218   NA's   :241460   NA's   :268189   NA's   :308305  
##    servmed_11       servmed_12         hh_lug           mm_lug      
##  Min.   :11       Min.   :12       Min.   : 0.000   Min.   : 0.00   
##  1st Qu.:11       1st Qu.:12       1st Qu.: 0.000   1st Qu.:10.00   
##  Median :11       Median :12       Median : 0.000   Median :15.00   
##  Mean   :11       Mean   :12       Mean   : 0.302   Mean   :17.65   
##  3rd Qu.:11       3rd Qu.:12       3rd Qu.: 0.000   3rd Qu.:30.00   
##  Max.   :11       Max.   :12       Max.   :72.000   Max.   :59.00   
##  NA's   :306426   NA's   :308691   NA's   :108161   NA's   :108161  
##      hh_esp           mm_esp         pagoaten_1       pagoaten_2    
##  Min.   : 0.000   Min.   : 0.0     Min.   :1        Min.   :2       
##  1st Qu.: 0.000   1st Qu.: 1.0     1st Qu.:1        1st Qu.:2       
##  Median : 0.000   Median :10.0     Median :1        Median :2       
##  Mean   : 0.485   Mean   :13.6     Mean   :1        Mean   :2       
##  3rd Qu.: 0.000   3rd Qu.:20.0     3rd Qu.:1        3rd Qu.:2       
##  Max.   :99.000   Max.   :59.0     Max.   :1        Max.   :2       
##  NA's   :108161   NA's   :108161   NA's   :198336   NA's   :193482  
##    pagoaten_3       pagoaten_4       pagoaten_5       pagoaten_6    
##  Min.   :3        Min.   :4        Min.   :5        Min.   :6       
##  1st Qu.:3        1st Qu.:4        1st Qu.:5        1st Qu.:6       
##  Median :3        Median :4        Median :5        Median :6       
##  Mean   :3        Mean   :4        Mean   :5        Mean   :6       
##  3rd Qu.:3        3rd Qu.:4        3rd Qu.:5        3rd Qu.:6       
##  Max.   :3        Max.   :4        Max.   :5        Max.   :6       
##  NA's   :283928   NA's   :302310   NA's   :306343   NA's   :308157  
##    pagoaten_7       noatenc_1        noatenc_2        noatenc_3     
##  Min.   :7        Min.   :1        Min.   :2        Min.   :3       
##  1st Qu.:7        1st Qu.:1        1st Qu.:2        1st Qu.:3       
##  Median :7        Median :1        Median :2        Median :3       
##  Mean   :7        Mean   :1        Mean   :2        Mean   :3       
##  3rd Qu.:7        3rd Qu.:1        3rd Qu.:2        3rd Qu.:3       
##  Max.   :7        Max.   :1        Max.   :2        Max.   :3       
##  NA's   :231886   NA's   :309252   NA's   :307199   NA's   :308937  
##    noatenc_4        noatenc_5        noatenc_6        noatenc_7     
##  Min.   :4        Min.   :5        Min.   :6        Min.   :7       
##  1st Qu.:4        1st Qu.:5        1st Qu.:6        1st Qu.:7       
##  Median :4        Median :5        Median :6        Median :7       
##  Mean   :4        Mean   :5        Mean   :6        Mean   :7       
##  3rd Qu.:4        3rd Qu.:5        3rd Qu.:6        3rd Qu.:7       
##  Max.   :4        Max.   :5        Max.   :6        Max.   :7       
##  NA's   :309526   NA's   :309247   NA's   :309638   NA's   :309676  
##    noatenc_8        noatenc_9        noatenc_10       noatenc_11    
##  Min.   :8        Min.   :9        Min.   :10       Min.   :11      
##  1st Qu.:8        1st Qu.:9        1st Qu.:10       1st Qu.:11      
##  Median :8        Median :9        Median :10       Median :11      
##  Mean   :8        Mean   :9        Mean   :10       Mean   :11      
##  3rd Qu.:8        3rd Qu.:9        3rd Qu.:10       3rd Qu.:11      
##  Max.   :8        Max.   :9        Max.   :10       Max.   :11      
##  NA's   :309161   NA's   :309394   NA's   :309487   NA's   :309413  
##    noatenc_12       noatenc_13       noatenc_14       noatenc_15    
##  Min.   :12       Min.   :13       Min.   :14       Min.   :15      
##  1st Qu.:12       1st Qu.:13       1st Qu.:14       1st Qu.:15      
##  Median :12       Median :13       Median :14       Median :15      
##  Mean   :12       Mean   :13       Mean   :14       Mean   :15      
##  3rd Qu.:12       3rd Qu.:13       3rd Qu.:14       3rd Qu.:15      
##  Max.   :12       Max.   :13       Max.   :14       Max.   :15      
##  NA's   :309613   NA's   :308712   NA's   :309170   NA's   :279492  
##    noatenc_16       norecib_1        norecib_2        norecib_3     
##  Min.   :16       Min.   :1        Min.   :2        Min.   :3       
##  1st Qu.:16       1st Qu.:1        1st Qu.:2        1st Qu.:3       
##  Median :16       Median :1        Median :2        Median :3       
##  Mean   :16       Mean   :1        Mean   :2        Mean   :3       
##  3rd Qu.:16       3rd Qu.:1        3rd Qu.:2        3rd Qu.:3       
##  Max.   :16       Max.   :1        Max.   :2        Max.   :3       
##  NA's   :262664   NA's   :309458   NA's   :309598   NA's   :309483  
##    norecib_4        norecib_5        norecib_6        norecib_7     
##  Min.   :4        Min.   :5        Min.   :6        Min.   :7       
##  1st Qu.:4        1st Qu.:5        1st Qu.:6        1st Qu.:7       
##  Median :4        Median :5        Median :6        Median :7       
##  Mean   :4        Mean   :5        Mean   :6        Mean   :7       
##  3rd Qu.:4        3rd Qu.:5        3rd Qu.:6        3rd Qu.:7       
##  Max.   :4        Max.   :5        Max.   :6        Max.   :7       
##  NA's   :309657   NA's   :309657   NA's   :309681   NA's   :309682  
##    norecib_8        norecib_9        norecib_10       norecib_11    
##  Min.   :8        Min.   :9        Min.   :10       Min.   :11      
##  1st Qu.:8        1st Qu.:9        1st Qu.:10       1st Qu.:11      
##  Median :8        Median :9        Median :10       Median :11      
##  Mean   :8        Mean   :9        Mean   :10       Mean   :11      
##  3rd Qu.:8        3rd Qu.:9        3rd Qu.:10       3rd Qu.:11      
##  Max.   :8        Max.   :9        Max.   :10       Max.   :11      
##  NA's   :309625   NA's   :309649   NA's   :309681   NA's   :309669  
##    norecib_12        razon_1          razon_2          razon_3      
##  Min.   :12       Min.   :1        Min.   :2        Min.   :3       
##  1st Qu.:12       1st Qu.:1        1st Qu.:2        1st Qu.:3       
##  Median :12       Median :1        Median :2        Median :3       
##  Mean   :12       Mean   :1        Mean   :2        Mean   :3       
##  3rd Qu.:12       3rd Qu.:1        3rd Qu.:2        3rd Qu.:3       
##  Max.   :12       Max.   :1        Max.   :2        Max.   :3       
##  NA's   :309671   NA's   :309672   NA's   :309682   NA's   :309608  
##     razon_4          razon_5          razon_6          razon_7      
##  Min.   :4        Min.   :5        Min.   :6        Min.   :7       
##  1st Qu.:4        1st Qu.:5        1st Qu.:6        1st Qu.:7       
##  Median :4        Median :5        Median :6        Median :7       
##  Mean   :4        Mean   :5        Mean   :6        Mean   :7       
##  3rd Qu.:4        3rd Qu.:5        3rd Qu.:6        3rd Qu.:7       
##  Max.   :4        Max.   :5        Max.   :6        Max.   :7       
##  NA's   :309621   NA's   :309659   NA's   :309637   NA's   :309618  
##     razon_8          razon_9          razon_10         razon_11     
##  Min.   :8        Min.   :9        Min.   :10       Min.   :11      
##  1st Qu.:8        1st Qu.:9        1st Qu.:10       1st Qu.:11      
##  Median :8        Median :9        Median :10       Median :11      
##  Mean   :8        Mean   :9        Mean   :10       Mean   :11      
##  3rd Qu.:8        3rd Qu.:9        3rd Qu.:10       3rd Qu.:11      
##  Max.   :8        Max.   :9        Max.   :10       Max.   :11      
##  NA's   :309524   NA's   :309647   NA's   :309632   NA's   :309506  
##     diabetes       pres_alta          peso         segvol_1     
##  Min.   :1.000   Min.   :1.000   Min.   :1.00   Min.   :1       
##  1st Qu.:1.000   1st Qu.:1.000   1st Qu.:1.00   1st Qu.:1       
##  Median :2.000   Median :1.000   Median :1.00   Median :1       
##  Mean   :1.646   Mean   :1.463   Mean   :1.37   Mean   :1       
##  3rd Qu.:2.000   3rd Qu.:2.000   3rd Qu.:2.00   3rd Qu.:1       
##  Max.   :2.000   Max.   :2.000   Max.   :2.00   Max.   :1       
##  NA's   :58989   NA's   :58989   NA's   :150    NA's   :304260  
##     segvol_2         segvol_3         segvol_4         segvol_5     
##  Min.   :2        Min.   :3        Min.   :4        Min.   :5       
##  1st Qu.:2        1st Qu.:3        1st Qu.:4        1st Qu.:5       
##  Median :2        Median :3        Median :4        Median :5       
##  Mean   :2        Mean   :3        Mean   :4        Mean   :5       
##  3rd Qu.:2        3rd Qu.:3        3rd Qu.:4        3rd Qu.:5       
##  Max.   :2        Max.   :3        Max.   :4        Max.   :5       
##  NA's   :307534   NA's   :304315   NA's   :309427   NA's   :308432  
##     segvol_6        segvol_7        hijos_viv        hijos_mue     
##  Min.   :6       Min.   :7        Min.   : 0.000   Min.   : 0.000  
##  1st Qu.:6       1st Qu.:7        1st Qu.: 0.000   1st Qu.: 0.000  
##  Median :6       Median :7        Median : 2.000   Median : 0.000  
##  Mean   :6       Mean   :7        Mean   : 2.229   Mean   : 0.209  
##  3rd Qu.:6       3rd Qu.:7        3rd Qu.: 3.000   3rd Qu.: 0.000  
##  Max.   :6       Max.   :7        Max.   :25.000   Max.   :16.000  
##  NA's   :77288   NA's   :304342   NA's   :178336   NA's   :218788  
##    hijos_sob        trabajo_mp      motivo_aus       act_pnea1     
##  Min.   : 0.000   Min.   :1.000   Min.   : 1.000   Min.   :1.00    
##  1st Qu.: 2.000   1st Qu.:1.000   1st Qu.: 6.000   1st Qu.:3.00    
##  Median : 3.000   Median :1.000   Median : 6.000   Median :3.00    
##  Mean   : 3.012   Mean   :1.402   Mean   : 6.576   Mean   :3.34    
##  3rd Qu.: 4.000   3rd Qu.:2.000   3rd Qu.: 6.000   3rd Qu.:4.00    
##  Max.   :19.000   Max.   :2.000   Max.   :13.000   Max.   :6.00    
##  NA's   :218788   NA's   :58989   NA's   :308925   NA's   :209671  
##    act_pnea2        num_trabaj        c_futuro        ct_futuro     
##  Min.   :2.000    Min.   :1.000    Min.   :1.000    Min.   :1.000   
##  1st Qu.:3.000    1st Qu.:1.000    1st Qu.:2.000    1st Qu.:9.000   
##  Median :4.000    Median :1.000    Median :2.000    Median :9.000   
##  Mean   :3.692    Mean   :1.095    Mean   :1.797    Mean   :7.549   
##  3rd Qu.:4.000    3rd Qu.:1.000    3rd Qu.:2.000    3rd Qu.:9.000   
##  Max.   :5.000    Max.   :2.000    Max.   :2.000    Max.   :9.000   
##  NA's   :306308   NA's   :159002   NA's   :309216   NA's   :309216  
##     entidad         est_dis           upm            factor      
##  Min.   : 1.00   Min.   :  1.0   Min.   :    1   Min.   :   6.0  
##  1st Qu.: 8.00   1st Qu.:124.0   1st Qu.: 2866   1st Qu.: 157.0  
##  Median :16.00   Median :260.0   Median : 5292   Median : 283.0  
##  Mean   :16.05   Mean   :265.5   Mean   : 5283   Mean   : 416.6  
##  3rd Qu.:24.00   3rd Qu.:399.0   3rd Qu.: 7791   3rd Qu.: 531.0  
##  Max.   :32.00   Max.   :560.0   Max.   :10232   Max.   :6470.0  
## 

## 9. Renombrar variables para facilitar el análisis


``` r
# Renombrar columnas clave con nombres más legibles

#rename
pob_nueva <- poblacion %>% 
  rename(
    años_imss = ss_aa,
    disc_audi = cau_oir
  )


## 10. Re-codificar variables categóricas con case_when()


``` r
# Re-codificar variable de sexo

#mutate y case_when

poblacionjl<-poblacionjl%>%
  mutate(sexo=case_when(
    sexo == 1 ~ "Hombre",
    sexo == 2 ~ "Mujer"
  ))

11. Crear nuevas variables

# Crear una variable binaria para tercera edad 

#ifelse

poblacionjl<-poblacionjl%>%
  mutate(tercera_edad=ifelse(edad>=60, "tercera Edad", "menor de 60 años"))
                             #crera nuevas variables 

12. Manejo de valores faltantes

# Identificar variables con muchos NA

#colSums y is.na

colSums(is.na(poblacionjl))
##         sexo         edad tercera_edad 
##            0            0            0
# Eliminar filas donde falta la edad

#filter e is.na

pob_nueva<-pob_nueva%>%
  filter(!is.na(disc_brazo))
# Confirmar que ya no hay NA en edad

#anyNA

13. Ejercicio práctico

-Crear una nueva variable que se llame nivel_educativo

-seleccionar solo las variables: edad joven, nivel_ educativo, sexo.

-crear un resumen con la función summarize donde me digas la cantidad de personas de cada sexo por edad.

#Filtra personas de entre 18 y 25 años 
pob_jovenes <- poblacion %>% 
  filter(edad >= 18 & edad <=25)

#Variable joven 
pob_jovenes <- pob_jovenes %>% 
  mutate(joven = ifelse(edad >= 18 & edad <= 25, 1, 0))

#Variable nivel educativo
pob_jovenes <- pob_jovenes %>% 
  rename(nivel_educativo = nivel)

#Eliminar NA en nivel_educativo
pob_jovenes <- pob_jovenes %>% 
  filter(is.na(nivel_educativo))

#Seleccionar variables
pob_jovenes <- pob_jovenes %>% 
  select(edad, joven, nivel_educativo, sexo)

#Resumen 
resumen_h <- pob_jovenes %>%
  filter(sexo == 1) %>%
  summarise(cantidad_hombres = n())

resumen_m <- pob_jovenes %>%
  filter(sexo == 2) %>%
  summarise(cantidad_mujeres = n())

14. Cierre

# Guardar como CSV o Excel

write_csv(pob_jovenes, "pob_jovenes.csv") #Consultado con IA porque no pude guardarlo como excel

#write_csv
#write_xlsx