Análisis de datos de entrada en el cruce de fronteras

Análisis de los patrones y tendencias de los viajes transfronterizos

Cargar de librerias

## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
## Warning: package 'ggplot2' was built under R version 4.4.1
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats   1.0.0     ✔ readr     2.1.5
## ✔ lubridate 1.9.3     ✔ stringr   1.5.1
## ✔ purrr     1.0.2     ✔ tibble    3.2.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag()    masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Warning: package 'summarytools' was built under R version 4.4.1
## 
## Adjuntando el paquete: 'summarytools'
## 
## The following object is masked from 'package:tibble':
## 
##     view
## Warning: package 'rmarkdown' was built under R version 4.4.1
## Warning: package 'sf' was built under R version 4.4.1
## Linking to GEOS 3.12.1, GDAL 3.8.4, PROJ 9.3.1; sf_use_s2() is TRUE
## 
## Adjuntando el paquete: 'scales'
## 
## The following object is masked from 'package:purrr':
## 
##     discard
## 
## The following object is masked from 'package:readr':
## 
##     col_factor

Cargar los datos

Cargar la base de datos para trabajar en la investigación.

Descripción detallada de las variables

-Port Name -State -Port Code -Border -Date -Measure -Value -Latitude -Longitude -Point

#Limpieza de datos Empece con la limpieza de datos quitando las variables inecesarias, dejando las solo las relevantes.

#Eliminar variables inecesarias Elimine las filas inecesarias, elimine Date porque era formato de fecha y Point porque no la iba a necesitar.

Análisis de datos de entrada en el cruce de fronteras

Conteo de cruces por tipo de transporte (vehículos, pasajeros, etc.) Primero realize nuevo data fram, agrupando la variabble Measure, despues hice un resumen y una columna en el data frame suamando todos los valores.

print(crossings_by_measure)
## # A tibble: 12 × 2
##    Measure                     Total_Crossings
##    <chr>                                 <dbl>
##  1 Bus Passengers                    154878918
##  2 Buses                               9266194
##  3 Pedestrians                      1226915842
##  4 Personal Vehicle Passengers      6198183639
##  5 Personal Vehicles                2979491078
##  6 Rail Containers Empty              28267610
##  7 Rail Containers Loaded             49751798
##  8 Train Passengers                    6981114
##  9 Trains                              1065582
## 10 Truck Containers Empty             82113647
## 11 Truck Containers Loaded           230654912
## 12 Trucks                            318048015

Gráfico de los cruces por tipo de medida

Dentro de la variable Measure (media en que pasan hacia la frontera) Personal Vehicle Passengers es significativamente más alto que las demás, lo que quiere decir que en la frontera la forma más usada para pasar es mediante un vehículos pequeños o vehiculo personal.

Total de cruces por puerto de entrada

print(crossings_by_port)
## # A tibble: 117 × 2
##    Port.Code Total_Crossings
##        <int>           <int>
##  1      2504      1366208297
##  2      2402      1283000871
##  3      2304       764989578
##  4      2305       645224782
##  5      2503       599645155
##  6       901       597301838
##  7      2301       592088420
##  8      2506       548861440
##  9      3801       535608015
## 10      2604       466219962
## # ℹ 107 more rows

Seleccionar los 5 puertos con mayor volumen de cruces

print(top_5_ports)
## # A tibble: 10 × 2
##    Port.Code Total_Crossings
##        <int>           <int>
##  1      2504      1366208297
##  2      2402      1283000871
##  3      2304       764989578
##  4      2305       645224782
##  5      2503       599645155
##  6       901       597301838
##  7      2301       592088420
##  8      2506       548861440
##  9      3801       535608015
## 10      2604       466219962

Gráfico de los 5 puertos de entrada con mayor volumen de cruces

En este grafico muestra que la barra más alta corresponde al puerto de entrada 2504, lo que significa que este puerto tiene el mayor volumen de cruces. A medida que los números de los puertos aumentan, el volumen de cruces disminuye, el puerto 2504 es el más utilizado, mientras que los otros puertos tienen un menor volumen de cruces.

Total de cruces por estado

print(crossings_by_state)
## # A tibble: 14 × 2
##    State        Total_Crossings
##    <chr>                  <dbl>
##  1 Texas             4197916664
##  2 California        2982029107
##  3 Arizona           1039652765
##  4 New York           917804868
##  5 Michigan           833559824
##  6 Washington         560786180
##  7 Maine              248712086
##  8 Vermont            126908117
##  9 Minnesota          106859600
## 10 North Dakota        87334863
## 11 New Mexico          83079234
## 12 Montana             61124015
## 13 Idaho               23920738
## 14 Alaska              15930288

Gráfico de los cruces por estado

Podemos observar que Texas es un líder en comercio internacional y ha sido el estado con mayor volumen de exportaciones en EE.UU, siendo los principales productos exportados petroleo crudo, aceites de petróleo y minerales.

Total de cruces por tipo de medida y estado

## `summarise()` has grouped output by 'State'. You can override using the
## `.groups` argument.
print(crossings_by_measure)
## # A tibble: 12 × 2
##    Measure                     Total_Crossings
##    <chr>                                 <dbl>
##  1 Bus Passengers                    154878918
##  2 Buses                               9266194
##  3 Pedestrians                      1226915842
##  4 Personal Vehicle Passengers      6198183639
##  5 Personal Vehicles                2979491078
##  6 Rail Containers Empty              28267610
##  7 Rail Containers Loaded             49751798
##  8 Train Passengers                    6981114
##  9 Trains                              1065582
## 10 Truck Containers Empty             82113647
## 11 Truck Containers Loaded           230654912
## 12 Trucks                            318048015

Gráfico de la distribución de los cruces por tipo de transporte en los diferentes estados

En el grafico se muestra que Texas tiene el mayor volumen de cruces en casi todas las categorías, destacándose especialmente en peatones y vehículos personales, mientras que California y Arizona también tienen volúmenes significativos de cruces, pero menores en comparación con Texas.Otros estados como Maine, Michigan, y Nueva York tienen volúmenes de cruces más bajos en todas las categorías.

Total de cruces por estado y puerto de entrada

## `summarise()` has grouped output by 'State'. You can override using the
## `.groups` argument.

Seleccionamos los puertos con los mayores números de cruces

## # A tibble: 95 × 3
## # Groups:   State [14]
##    State   Port.Name    Total_Crossings
##    <chr>   <chr>                  <int>
##  1 Alaska  Skagway              9332803
##  2 Alaska  Alcan                4815813
##  3 Alaska  Dalton Cache         1585697
##  4 Alaska  Ketchikan             195975
##  5 Arizona Nogales            466219962
##  6 Arizona San Luis           312607254
##  7 Arizona Douglas            184670260
##  8 Arizona Lukeville           41054495
##  9 Arizona Naco                32413007
## 10 Arizona Sasabe               2687787
## # ℹ 85 more rows

Puertos más relevantes

print(top_ports)
## # A tibble: 40 × 3
## # Groups:   State [14]
##    Port.Name    Total_Crossings State     
##    <chr>                  <int> <chr>     
##  1 Skagway              9332803 Alaska    
##  2 Alcan                4815813 Alaska    
##  3 Dalton Cache         1585697 Alaska    
##  4 Nogales            466219962 Arizona   
##  5 San Luis           312607254 Arizona   
##  6 Douglas            184670260 Arizona   
##  7 San Ysidro        1366208297 California
##  8 Calexico           599645155 California
##  9 Otay Mesa          548861440 California
## 10 Eastport            13829839 Idaho     
## # ℹ 30 more rows

Gráfico con los puertos más relevantes

En el grafico podemos observar que San Ysidro: Tiene el volumen de cruces más alto, lo que indica que es el puerto de entrada más transitado. El Paso y Laredo: También tienen volúmenes de cruces muy altos, situándose entre los puertos más importantes, mientras que los puertos como Otay Mesa, Hidalgo, y Calexico también muestran volúmenes significativos, aunque menores en comparación con los tres principales.

En la distribución de los estados Texas tiene varios puertos de entrada con altos volúmenes de cruces, incluyendo Laredo, Hidalgo, El paso, esto refleja la importancia de Texas en el comercio y transporte transfronterizo, por otro lado en California San Ysidro y Otay Mesa son los puertos más destacados, subrayando la relevancia de California en el tráfico fronterizo y en Arizona donde Nogales es su puerto principal, muestra un volumen considerable de cruces. Estados como Nueva York, Michigan, y Washington tienen puertos con volúmenes moderados.

Conclusión general

Texas emerge como el estado con el mayor volumen de cruces en múltiples categorías y puertos de entrada, siendo asi un estando de mayor importancia en el comercio y transporte transfronterizo. California y Arizona también son estados importantes, con puertos de entrada como San Ysidro y Nogales que manejan volúmenes significativos de tráfico. Los Peatones y vehículos pequeños son los métodos de transporte más comunes, lo que sugiere una alta movilidad de personas y pequeños vehículos a través de las fronteras. Y por último los puertos de entrada específicos como San Ysidro, El Paso y Laredo son vitales para el flujo de comercio y personas entre Estados Unidos y México.