Dirígete a la página oficial de la ENIGH 2022: https://www.inegi.org.mx/programas/enigh/nc/2022/#microdatos
Busca el archivo titulado “Características sociodemográficas de los integrantes del hogar (población)” y descárgalo. Si está en formato ZIP, descomprímelo y ubica el archivo .csv.
Guarda este archivo en una carpeta para tu proyecto, por ejemplo, datos/.
# Instala estas librerías si aún no lo has hecho:
# install.packages("readr")
# install.packages("dplyr")
library(readr)
library(dplyr)
# Carga tu archivo csv
poblacion <- read_csv("datos/poblacion.csv")
# Verifica que la base se cargó correctamente
head(poblacion)
# Utiliza las funciones head, tail, str, summary y names y anota frente a su resultado para qué se utiliza cada
# Utiliza la función anyNA, is.na y anota frente a su resultado para qué se utiliza cada una
#Crea un nuevo data frame que se llame poblacion_nl a partir del data frame original llamado poblacion
#Filtra los datos solamente para personas que vivan en el estado de Nuevo León
#Selecciona por lo menos 5 variables de interés para tu análisis
#Calcula el promedio de edad por sexo para el estado de Jalisco
#Guarda los datos que de edad por sexo para el estado de Jalisco en un archivo CSV
En esta sesión aprendiste a:
Importar bases reales en formato CSV.
Explorar datos con head(), str(), summary().
Identificar valores faltantes.
Filtrar y seleccionar columnas de interés.
Resumir información agrupada con dplyr.
En la siguiente sesión, trabajaremos en limpieza y transformación de datos, donde aprenderás a recodificar variables, crear nuevas columnas y corregir problemas comunes.