ANTECEDENTES

Después del 2022, a causa de la pandemia, la encuesta tuvo que cambiar su estrtuctura, es por ello que nos vemos con menos datos de la base de datos. La Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023 que realiza el INEGI. tiene la finalidad de actualizar la información estadística relacionada con el nivel y comportamiento de los componentes de la dinámica demográfica: fecundidad, mortalidad y migración (interna e internacional), así como temas relacionados con el crecimiento de la población, preferencias reproductivas, sexualidad, uso de métodos anticonceptivos, nupcialidad y salud materno infantil, y aspectos referidos a la población, los hogares y las viviendas. Actualizar la información estadística relacionada con el nivel y comportamiento de los componentes de la dinámica demográfica: fecundidad, mortalidad y migración (interna e internacional), aunados a otros temas relacionados a la dinámica de crecimiento de la población, como preferencias reproductivas, sexualidad, uso de métodos anticonceptivos, salud materno infantil y nupcialidad; así como otros temas referidos a la población, los hogares y las viviendas. Información sobre la población que cambio su lugar de residencia habitual desde un municipio o delegación, entidad federativa o país de origen, a otro de destino. Se incluyen indicadores relacionados con el lugar de residencia cinco años antes, con el propósito de medir el volumen y dirección de los movimientos migratorios internos, así como del exterior hacia el interior del territorio nacional. También, se incluye información para valorar los fenómenos de la migración interna acumulada o absoluta a partir del lugar de nacimiento de las personas.

CLASIFICACIÓN Y LIMPIEZA DE BASE DE DATOS

Cargar librerías y la base de datos

library(readr)
library(tidyverse)
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ dplyr     1.1.4     ✔ purrr     1.0.2
## ✔ forcats   1.0.0     ✔ stringr   1.5.1
## ✔ ggplot2   3.5.1     ✔ tibble    3.2.1
## ✔ lubridate 1.9.3     ✔ tidyr     1.3.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
library(dplyr)
library(scales)
## 
## Attaching package: 'scales'
## 
## The following object is masked from 'package:purrr':
## 
##     discard
## 
## The following object is masked from 'package:readr':
## 
##     col_factor
MIGRACION<- read_csv("conjunto_de_datos_tmigrante_enadid_2023/conjunto_de_datos/TMIGRANTE.csv")
## Rows: 3660 Columns: 52
## ── Column specification ────────────────────────────────────────────────────────
## Delimiter: ","
## chr (22): upm, viv_sel, n_ren, llave_mig, llave_per, llave_hog, llave_viv, e...
## dbl (30): hogar, tam_loc, p4_4, p4_5, p4_6, p4_7, p4_7c, p4_9, p4_10_2, p4_1...
## 
## ℹ Use `spec()` to retrieve the full column specification for this data.
## ℹ Specify the column types or set `show_col_types = FALSE` to quiet this message.

ANÁLISIS Y GRÁFICA DE DATOS

Seleccionar las variables que se van a necesitar para continuar con el análisis

MIGRACION <- select(MIGRACION, p4_5c, p4_6, p4_10_2, p4_11c, p4_13, p4_14, 
                    p4_18_2, p4_19, t_loc_ur, p4_8_ag1,estrato) %>% 
  rename("LUGAR_NACIMIENTO"=1,
         "SEXO"=2,
         "AÑO_MIGRACION"=3,
         "PAIS_DESTINO"=4,
         "DOC_EMIGRAR"=5,
         "CAUSA_EMIGRACION"=6,
         "FECHA_RETORNO"=7,
         "CAUSA_RETORNO"=8,
         "LOCALIDAD"=9,
         "EDAD"=10,
         "ESTRATO"=11)

En seguida se eliminarán los NA, para convertirlos en 0 y al momento de quitar la codificación de toda la tabla, los 0 se convertiran en una variable del tipo carácter, según el tipo de pregunta que se necesite. como en el caso de la columna DOC_EMIGRANTE, el 0 representará que no contaba con ningún documento al momento de que la persona emigró del país.

MIGRACION$DOC_EMIGRAR[is.na(MIGRACION$DOC_EMIGRAR)] <- 0

MIGRACION$FECHA_RETORNO[is.na(MIGRACION$FECHA_RETORNO)] <- 0

MIGRACION$CAUSA_RETORNO[is.na(MIGRACION$CAUSA_RETORNO)] <- 0

Recodificar todas las variables de número a letras

#SEXO DEL MIGRANTE
 MIGRACION$SEXO=factor(MIGRACION$SEXO, levels= c(1,2),
                       labels= c("MUJER","HOMBRE"))

#LUGAR DE NACIMIENTO 
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="001"] <- "AGUASCALIENTES"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="002"] <- "BAJA CALIFORNIA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="003"] <- "BAJA CALIFORNIA SUR"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="004"] <- "CAMPECHE"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="005"] <- "COAHUILA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="006"] <- "COLIMA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="007"] <- "CHIAPAS"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="008"] <- "CHIHUAHUA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="009"] <- "CIUDAD DE MEXICO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="010"] <- "DURANGO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="011"] <- "GUANAJUATO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="012"] <- "GUERRERO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="013"] <- "HIDALGO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="014"] <- "JALISCO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="015"] <- "MEXICO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="016"] <- "MICHOACAN"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="017"] <- "MORELOS"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="018"] <- "NAYARIT"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="019"] <- "NUEVO LEON"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="020"] <- "OAXACA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="021"] <- "PUEBLA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="022"] <- "QUERETARO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="023"] <- "QUINTANA ROO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="024"] <- "SAN LUIS POTOSI"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="025"] <- "SINALOA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="026"] <- "SONORA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="027"] <- "TABASCO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="028"] <- "TAMAULIPAS"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="029"] <- "TLAXCALA"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="030"] <- "VERACRUZ"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="031"] <- "YUCATAN"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="032"] <- "ZACATECAS"

MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="204"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="213"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="214"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="216"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="220"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="221"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="225"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="228"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="229"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="234"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="235"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="238"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="250"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="343"] <- "NO ESPECIFICADO"
MIGRACION$LUGAR_NACIMIENTO[MIGRACION$LUGAR_NACIMIENTO =="415"] <- "NO ESPECIFICADO"

#PAIS DESTINO
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="200"] <- "ESTADOS UNIDOS"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="204"] <- "ARGENTINA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="206"] <- "LAS BAHAMAS"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="210"] <- "BOLIVIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="211"] <- "BRASIL"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="213"] <- "CANADA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="214"] <- "COLOMBIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="215"] <- "COSTA RICA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="216"] <- "CUBA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="217"] <- "CHILE"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="221"] <- "ESTADOS UNIDOS"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="225"] <- "GUATEMALA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="229"] <- "HONDURAS"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="235"] <- "PANAMA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="237"] <- "PERU"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="238"] <- "PUERTO RICO"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="239"] <- "REPUBLICA DOMINICANA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="247"] <- "URUGUAY"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="302"] <- "ARABIA SAUDITA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="313"] <- "COREA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="315"] <- "CHINA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="316"] <- "TAIWAN"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="321"] <- "EMIRATOS ARABES"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="325"] <- "INDIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="330"] <- "JAPON"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="343"] <- "PAKISTAN"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="344"] <- "QATAR"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="402"] <- "ALEMANIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="405"] <- "AUSTRALIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="414"] <- "ESLOVENIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="415"] <- "ESPAÑA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="419"] <- "FRANCIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="425"] <- "ITALIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="436"] <- "PAISES BAJOS"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="437"] <- "POLONIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="438"] <- "PORTUGAL"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="439"] <- "REINO UNIDO"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="442"] <- "RUSIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="446"] <- "SUIZA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="447"] <- "UCRANIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="501"] <- "AUSTRALIA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="520"] <- "NUEVA ZELANDA"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="528"] <- "ESTADOS UNIDOS"
MIGRACION$PAIS_DESTINO[MIGRACION$PAIS_DESTINO =="998"] <- "ESPAÑA"

#Documento para emigrar

MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="0"] <- "NINGUN DOCUMENTO"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="1"] <- "PERMISO PARA RESIDIR"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="2"] <- "PERMISO PARA TRABAJAR (GREEN CARD) "
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="3"] <- "VISA DE TURISTA"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="4"] <- "VISA DE ESTUDIANTE"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="5"] <- "ES CIUDADANO"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="6"] <- "OTRO DOCUMENTO"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="7"] <- "NINGUN DOCUMENTO"
MIGRACION$DOC_EMIGRAR[MIGRACION$DOC_EMIGRAR =="9"] <- "NO SABE"

#CAUSA DE EMIGRACION

MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="1"] <- "BUSCAR TRABAJO"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="2"] <- "CAMBIO U OFERTA DE TRABAJO"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="3"] <- "REUNIRSE CON SU FAMILIA"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="4"] <- "SE CASÓ O SE FUE A VIVIR CON SU PAREJA"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="5"] <- "ESTUDIAR"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="6"] <- "POR INSEGUIDAD DELICTIVA"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="7"] <- "POR DESASTRES NATURALES"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="8"] <- "LE DEPORTARON"
MIGRACION$CAUSA_EMIGRACION[MIGRACION$CAUSA_EMIGRACION =="9"] <- "OTRA CAUSA"

#FECHA DE RETORNO

MIGRACION$FECHA_RETORNO[MIGRACION$FECHA_RETORNO =="0"] <- "NO RETORNÓ"
MIGRACION$FECHA_RETORNO[MIGRACION$FECHA_RETORNO =="9999"] <- "NO SABE"

#CAUSA RETORNO

MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="0"] <- "NO RETORNÓ"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="1"] <- "BUSCAR TRABAJO"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="2"] <- "CAMBIO U OFERTA DE TRABAJO"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="3"] <- "REUNIRSE CON LA FAMILIA"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="4"] <- "SE CASÓ"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="5"] <- "ESTUDIAR"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="6"] <- "POR INSEGUIRDAD DELICTIVA"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="7"] <- "POR DESASTRES NATURALES"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="8"] <- "LE DEPORTARON"
MIGRACION$CAUSA_RETORNO[MIGRACION$CAUSA_RETORNO =="9"] <- "OTRA CAUSA"

#LOCALIDAD
 MIGRACION$LOCALIDAD=factor(MIGRACION$LOCALIDAD, levels= c(1,2),
                            labels= c("URBANA","RURAL"))

 #ESTRATO
 
MIGRACION$ESTRATO[MIGRACION$ESTRATO =="1"] <- "BAJO"
MIGRACION$ESTRATO[MIGRACION$ESTRATO =="2"] <- "MEDIO BAJO"
MIGRACION$ESTRATO[MIGRACION$ESTRATO =="3"] <- "MEDIO ALTO"
MIGRACION$ESTRATO[MIGRACION$ESTRATO =="4"] <- "ALTO"

#EDAD

MIGRACION$EDAD[MIGRACION$EDAD =="1"] <- "00 A 04 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="2"] <- "05 A 09 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="3"] <- "10 A 14 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="4"] <- "15 A 19 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="5"] <- "20 A 24 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="6"] <- "25 A 29 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="7"] <- "30 A 34 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="8"] <- "35 A 39 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="9"] <- "40 A 44 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="10"] <- "45 A 49 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="11"] <- "50 A 54 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="12"] <- "55 A 59 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="13"] <- "60 A 64 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="14"] <- "65 A 69 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="15"] <- "70 A 74 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="16"] <- "75 A 79 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="17"] <- "80 A 84 AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="18"] <- "85 Y MÁS AÑOS"
MIGRACION$EDAD[MIGRACION$EDAD =="19"] <- "EDAD NO ESPECIFICADA"

Después de haber limpiado la base de datos, podemos ver que las variables que tenemos son del tipo carácter, por lo cual, son de escala nominal. Para este tipo de variables, en mi parecer, el análisis es más visual, y al graficar es muy fácil identificar y llegar a las conclusiones.

PREGUNTAS DE INVESTIGACION

GRÁFICOS

Lugar de origen

#Gráfico de mapa

TOTAL_MIG.df <- MIGRACION %>% group_by(LUGAR_NACIMIENTO) %>% summarize(value=n()) 
TOTAL_MIG.df <- TOTAL_MIG.df %>% rename("region"=1) 
TOTAL_MIG.df <- TOTAL_MIG.df[-c(19),]
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="AGUASCALIENTES"] <- "01"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="BAJA CALIFORNIA"] <- "02"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="BAJA CALIFORNIA SUR"] <- "03"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="CAMPECHE"] <- "04"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="CHIAPAS"] <- "05"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="CHIHUAHUA"] <- "06"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="CIUDAD DE MEXICO"] <- "07"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="COAHUILA"] <- "08"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="COLIMA"] <- "09"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="DURANGO"] <- "10"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="GUANAJUATO"] <- "11"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="GUERRERO"] <- "12"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="HIDALGO"] <- "13"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="JALISCO"] <- "14"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="MEXICO"] <- "15"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="MICHOACAN"] <- "16"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="MORELOS"] <- "17"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="NAYARIT"] <- "18"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="NUEVO LEON"] <- "19"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="OAXACA"] <- "20"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="PUEBLA"] <- "21"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="QUERETARO"] <- "22"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="QUINTANA ROO"] <- "23"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="SAN LUIS POTOSI"] <- "24"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="SINALOA"] <- "25"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="SONORA"] <- "26"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="TABASCO"] <- "27"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="TAMAULIPAS"] <- "28"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="TLAXCALA"] <- "29"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="VERACRUZ"] <- "30"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="YUCATAN"] <- "31"
TOTAL_MIG.df$region[TOTAL_MIG.df$region =="ZACATECAS"] <- "32"

if(!require("devtools")){ 
  install.packages("devtools")
}
## Loading required package: devtools
## Loading required package: usethis
devtools::install_github("diegovalle/mxmaps")
## Skipping install of 'mxmaps' from a github remote, the SHA1 (e91a4513) has not changed since last install.
##   Use `force = TRUE` to force installation
library(mxmaps)

 mxstate_choropleth(TOTAL_MIG.df,
                              num_colors = 9,
                              title = "FLUJO DE MIGRANTES POR ESTADOS",
                              legend="por persona")+
   theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 01")

Sexo

#SEXO DE LOS MIGRANTES
sexm <- MIGRACION %>% group_by(SEXO) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>%
  mutate(porcent = percent(porcentaje))
  
hsize <- 3

ggplot(sexm, aes(x = hsize, y = value, fill = SEXO)) +
  geom_col(color = "white") +
  geom_text(aes(label = porcent),
             position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  xlim(c(0.2, hsize + 0.5)) +
  theme(panel.background = element_rect(fill = "white"),
        panel.grid = element_blank(),
        axis.title = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank())+
   ggtitle("SEXO DE LOS MIGRANTES")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 02")

Año migración

#AÑO DE MIGRACION 
AÑOM <- MIGRACION %>% group_by(AÑO_MIGRACION) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje))


hsize <- 3

ggplot(AÑOM, aes(x = hsize, y = value, fill = AÑO_MIGRACION)) +
  geom_col(color = "white") +
  geom_text(aes(label = porcent),
             position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  xlim(c(0.2, hsize + 0.5)) +
  
  theme(panel.background = element_rect(fill = "white"),
        panel.grid = element_blank(),
        axis.title = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank())+
  ggtitle("AÑO EN QUE EMIGRARON")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 03")

Año retorno

#AÑO DE MIGRACION 
AÑOR <- MIGRACION %>% group_by(FECHA_RETORNO) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

hsize <- 3

ggplot(AÑOR, aes(x = hsize, y = value, fill = FECHA_RETORNO)) +
  geom_col(color = "white") +
  geom_text(aes(label = porcent),
             position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  xlim(c(0.2, hsize + 0.5)) +
  scale_fill_manual(values = c("#bef7ff", "#ade8ff", "#9bd8ff", "#8ac9ff", "#79baff", "#68abff", "#569bff", "#458cff"))+ 
  theme(panel.background = element_rect(fill = "white"),
        panel.grid = element_blank(),
        axis.title = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank())+
  ggtitle("AÑO EN EL QUE RETORNARON")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 04")

Documentos con los que emigró

#DOCUMENTOS PARA EMIGRAR
DOCE <- MIGRACION %>% group_by(DOC_EMIGRAR) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

hsize <- 3

ggplot(DOCE, aes(x = hsize, y = value, fill = DOC_EMIGRAR)) +
  geom_col(color = "white") +
  geom_text(aes(label = porcent),
             position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  xlim(c(0.2, hsize + 0.5)) +
   scale_fill_manual(values = c("#bef7ff", "#ade8ff", "#9bd8ff", "#8ac9ff", "#79baff", "#68abff", "#569bff", "#458cff"))+ 
  theme(panel.background = element_rect(fill = "white"),
        panel.grid = element_blank(),
        axis.title = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank())+
  ggtitle("DOCUMENTOS CON LOS QUE EMIGRÓ")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 05")

Causa de emigrar

CAUSAM<- MIGRACION %>% group_by(CAUSA_EMIGRACION) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

library(ggplot2)
ggplot(CAUSAM, aes(x = CAUSA_EMIGRACION, y= value, fill= CAUSA_EMIGRACION, main= "CAUSA POR LAS QUE EMIGRÓ")) +
  geom_col() +
  scale_fill_manual(values = c("#bef7ff", "#afeaff", "#a0dcff", "#91cfff", "#82c2ff", "#72b4ff", "#63a7ff", "#5499ff", "#458cff"))+
  ggtitle("CAUSA DE MIGRACIÓN")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(x="Causa de emigración",y="n de personas")+
  theme(axis.title.x = element_text(face="bold",vjust=0.5,size=rel(1.5)))+
  theme(axis.title.y = element_text(face="bold",vjust=0.5,size=rel(1.5)))+
  labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 06")+
  theme(axis.text = element_blank())

Causa por la que retornó

CAUSAR<- MIGRACION %>% group_by(CAUSA_RETORNO) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

library(ggplot2)
ggplot(CAUSAR, aes(x = CAUSA_RETORNO, y= value, fill= CAUSA_RETORNO)) +
  geom_col() +
  scale_fill_manual(values = c("#bef7ff", "#afeaff", "#a0dcff", "#91cfff", "#82c2ff", "#72b4ff", "#63a7ff", "#5499ff", "#458cff"))+
  ggtitle("CAUSA RETORNO")+
   theme(plot.title = element_text(family = "Serif",
                                   size=rel(1.5),
                                   vjust=0.5 , hjust=0.5,
                                   face="italic",
                                   lineheigh=1.5))+
    labs(x="Causa de retorno",y="n de personas",
      caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 07")+
   theme(axis.title.x = element_text(face="bold",vjust=0.5,size=rel(1.5)))+
   theme(axis.title.y = element_text(face="bold",vjust=0.5,size=rel(1.5)))+
  theme(axis.text = element_blank())

Localidad del migrante

#LOCALIDAD
LOC <- MIGRACION %>% group_by(LOCALIDAD) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

hsize <- 3

ggplot(LOC, aes(x = hsize, y = value, fill = LOCALIDAD)) +
  geom_col(color = "white") +
  geom_text(aes(label = porcent),
             position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  xlim(c(0.2, hsize + 0.5)) +
   scale_fill_manual(values = c("#bef7ff",  "#569bff"))+ 
  theme(panel.background = element_rect(fill = "white"),
        panel.grid = element_blank(),
        axis.title = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank())+
  ggtitle("TIPO DE LOCALIDAD")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 08")

Edad del migrante

EDADM<- MIGRACION %>% group_by(EDAD) %>% summarize(value=n()) %>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

library(ggplot2)
ggplot(EDADM, aes(x = EDAD, y= value, fill= EDAD)) +
  geom_col() +
  scale_fill_manual(values = c("#bef7ff", "#b7f1ff", "#b1ebff", "#aae5ff", "#a3dfff", "#9cd9ff", "#96d3ff", "#8fcdff", "#88c7ff", "#82c2ff", "#7bbcff", "#74b6ff", "#6db0ff", "#67aaff", "#60a4ff", "#599eff", "#5298ff", "#4c92ff", "#458cff"))+
   ggtitle("EDAD DE LOS MIGRANTES")+
   theme(plot.title = element_text(family = "Serif",
                                   size=rel(1.5),
                                   vjust=0.5 , hjust=0.5,
                                   face="italic",
                                   lineheigh=1.5))+
    labs(x="EDADES",y="n de personas",
      subtitle = "por grupos quincenales",
      caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 09")+
   theme(axis.title.x = element_text(face="bold",vjust=0.5,size=rel(1.5)))+
   theme(axis.title.y = element_text(face="bold",vjust=0.5,size=rel(1.5)))+
  theme(axis.text = element_blank())

Estrato Socioeconómico

EST <- MIGRACION %>% group_by(ESTRATO) %>% summarize(value=n())%>% mutate(porcentaje= value/ sum(value)) %>% mutate(porcent = percent(porcentaje)) 

hsize <- 3

ggplot(EST, aes(x = hsize, y = value, fill = ESTRATO)) +
  geom_col(color = "white") +
  geom_text(aes(label = porcent),
             position = position_stack(vjust = 0.5)) +
  coord_polar(theta = "y") +
  xlim(c(0.2, hsize + 0.5)) +
   scale_fill_manual(values = c("#bef7ff", "#96d3ff", "#6db0ff", "#458cff"))+ 
  theme(panel.background = element_rect(fill = "white"),
        panel.grid = element_blank(),
        axis.title = element_blank(),
        axis.ticks = element_blank(),
        axis.text = element_blank())+
  ggtitle("ESTRATO SOCIOECONÓMICO DE LOS MIGRANTES")+
  theme(plot.title = element_text(family = "Serif",
                                size=rel(1.5),
                                vjust=0.5 , hjust=0.5,
                                face="italic",
                                lineheigh=1.5))+
   labs(caption = "FUENTE: Encuesta Nacional de la Dinámica Demográfica (ENADID) 2023",
      tag = "Fig. 09")

RESULTADOS Y CONCLUSIONES

La migración es el cambio de residencia de una o varias personas de manera temporal o definitiva, generalmente con la intención de mejorar su situación económica, así como su desarrollo personal y familiar.

Cuando una persona deja el municipio, la entidad o el país donde reside para irse a vivir a otro lugar se convierte en un emigrante, pero al llegar a establecerse a un nuevo municipio, entidad o país, esa misma persona pasa a ser un inmigrante. La migración externa o internacional de nuestro país en el pasado año 2023 fue analizada tomando como muestra 40,260 variables cualitativas nominales, las cuales incluían el Estado de origen de la persona migrante, el sexo, la causa por la cual salió del país. Teniendo como resultado a diferentes países a los cuales emigran los mexicanos. las entidades donde más personas se fueron son San Luis Potosí, Zacatecas y Oaxaca. Las principales personas que emigran son mujeres, con un porcentaje de 79.91% y la razón es ir en busca de oportunidades de trabajo, y superarse. También como ya es conocido, los mexicanos emigran mayormente al país vecino, Estados Unidos, donde también los resultados nos arrojan que la mayoría de personas no cuentan con documentos legales para su estancia en el lugar destino.