1. Descarga de la base de datos

Dirígete a la página oficial de la ENIGH 2022: https://www.inegi.org.mx/programas/enigh/nc/2022/#microdatos

Busca el archivo titulado “Características sociodemográficas de los integrantes del hogar (población)” y descárgalo. Si está en formato ZIP, descomprímelo y ubica el archivo .csv.

Guarda este archivo en una carpeta para tu proyecto, por ejemplo, datos/.

2. Preparación del entorno de trabajo

# Instala estas librerías si aún no lo has hecho:
# install.packages("readr")
# install.packages("dplyr")

library(readr)
library(dplyr)

3. Importación del archivo CSV

# Carga tu archivo csv
poblacion <- read_csv("datos/poblacion.csv")

# Verifica que la base se cargó correctamente
head(poblacion)

4. Exploración inicial de los datos

# Utiliza las funciones head, tail, str, summary y names y anota frente a su resultado para qué se utiliza cada

5. Identificación de valores faltantes

# Utiliza la función anyNA, is.na y anota frente a su resultado para qué se utiliza cada una

6. Filtrado y selección de datos

#Crea un nuevo data frame que se llame poblacion_nl a partir del data frame original llamado poblacion

#Filtra los datos solamente para personas que vivan en el estado de Nuevo León

#Selecciona por lo menos 5 variables de interés para tu análisis

7. Agrupación y resumen de datos

#Calcula el promedio de edad por sexo para el estado de Jalisco

8. Guardar los datos procesados

#Guarda los datos que de edad por sexo para el estado de Jalisco en un archivo CSV

¡Listo!

En esta sesión aprendiste a:

En la siguiente sesión, trabajaremos en limpieza y transformación de datos, donde aprenderás a recodificar variables, crear nuevas columnas y corregir problemas comunes.