Análisis de datos de entrada en el cruce de fronteras
Análisis de los patrones y tendencias de los viajes transfronterizos
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
## Warning: package 'ggplot2' was built under R version 4.4.1
## ── Attaching core tidyverse packages ──────────────────────── tidyverse 2.0.0 ──
## ✔ forcats 1.0.0 ✔ readr 2.1.5
## ✔ lubridate 1.9.3 ✔ stringr 1.5.1
## ✔ purrr 1.0.2 ✔ tibble 3.2.1
## ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
## ✖ dplyr::filter() masks stats::filter()
## ✖ dplyr::lag() masks stats::lag()
## ℹ Use the conflicted package (<http://conflicted.r-lib.org/>) to force all conflicts to become errors
## Warning: package 'summarytools' was built under R version 4.4.1
##
## Adjuntando el paquete: 'summarytools'
##
## The following object is masked from 'package:tibble':
##
## view
## Warning: package 'rmarkdown' was built under R version 4.4.1
## Warning: package 'sf' was built under R version 4.4.1
## Linking to GEOS 3.12.1, GDAL 3.8.4, PROJ 9.3.1; sf_use_s2() is TRUE
##
## Adjuntando el paquete: 'scales'
##
## The following object is masked from 'package:purrr':
##
## discard
##
## The following object is masked from 'package:readr':
##
## col_factor
Cargar la base de datos para trabajar en la investigación.
-Port Name -State -Port Code -Border -Date -Measure -Value -Latitude -Longitude -Point
#Limpieza de datos Empece con la limpieza de datos quitando las variables inecesarias, dejando las solo las relevantes.
#Eliminar variables inecesarias Elimine las filas inecesarias, elimine Date porque era formato de fecha y Point porque no la iba a necesitar.
Conteo de cruces por tipo de transporte (vehículos, pasajeros, etc.) Primero realize nuevo data fram, agrupando la variabble Measure, despues hice un resumen y una columna en el data frame suamando todos los valores.
print(crossings_by_measure)
## # A tibble: 12 × 2
## Measure Total_Crossings
## <chr> <dbl>
## 1 Bus Passengers 154878918
## 2 Buses 9266194
## 3 Pedestrians 1226915842
## 4 Personal Vehicle Passengers 6198183639
## 5 Personal Vehicles 2979491078
## 6 Rail Containers Empty 28267610
## 7 Rail Containers Loaded 49751798
## 8 Train Passengers 6981114
## 9 Trains 1065582
## 10 Truck Containers Empty 82113647
## 11 Truck Containers Loaded 230654912
## 12 Trucks 318048015
Dentro de la variable Measure (media en que pasan hacia la frontera)
Personal Vehicle Passengers es significativamente más
alto que las demás, lo que quiere decir que en la frontera la forma más
usada para pasar es mediante un vehículos pequeños o vehiculo
personal.
print(crossings_by_port)
## # A tibble: 117 × 2
## Port.Code Total_Crossings
## <int> <int>
## 1 2504 1366208297
## 2 2402 1283000871
## 3 2304 764989578
## 4 2305 645224782
## 5 2503 599645155
## 6 901 597301838
## 7 2301 592088420
## 8 2506 548861440
## 9 3801 535608015
## 10 2604 466219962
## # ℹ 107 more rows
print(top_5_ports)
## # A tibble: 10 × 2
## Port.Code Total_Crossings
## <int> <int>
## 1 2504 1366208297
## 2 2402 1283000871
## 3 2304 764989578
## 4 2305 645224782
## 5 2503 599645155
## 6 901 597301838
## 7 2301 592088420
## 8 2506 548861440
## 9 3801 535608015
## 10 2604 466219962
En este grafico muestra que la barra más alta corresponde al puerto de
entrada 2504, lo que significa que este puerto tiene el mayor volumen de
cruces. A medida que los números de los puertos aumentan, el volumen de
cruces disminuye, el puerto 2504 es el más utilizado, mientras que los
otros puertos tienen un menor volumen de cruces.
print(crossings_by_state)
## # A tibble: 14 × 2
## State Total_Crossings
## <chr> <dbl>
## 1 Texas 4197916664
## 2 California 2982029107
## 3 Arizona 1039652765
## 4 New York 917804868
## 5 Michigan 833559824
## 6 Washington 560786180
## 7 Maine 248712086
## 8 Vermont 126908117
## 9 Minnesota 106859600
## 10 North Dakota 87334863
## 11 New Mexico 83079234
## 12 Montana 61124015
## 13 Idaho 23920738
## 14 Alaska 15930288
Podemos observar que Texas es un líder en comercio internacional y ha
sido el estado con mayor volumen de exportaciones en EE.UU, siendo los
principales productos exportados petroleo crudo, aceites de petróleo y
minerales.
## `summarise()` has grouped output by 'State'. You can override using the
## `.groups` argument.
print(crossings_by_measure)
## # A tibble: 12 × 2
## Measure Total_Crossings
## <chr> <dbl>
## 1 Bus Passengers 154878918
## 2 Buses 9266194
## 3 Pedestrians 1226915842
## 4 Personal Vehicle Passengers 6198183639
## 5 Personal Vehicles 2979491078
## 6 Rail Containers Empty 28267610
## 7 Rail Containers Loaded 49751798
## 8 Train Passengers 6981114
## 9 Trains 1065582
## 10 Truck Containers Empty 82113647
## 11 Truck Containers Loaded 230654912
## 12 Trucks 318048015
En el grafico se muestra que Texas tiene el mayor volumen de cruces en
casi todas las categorías, destacándose especialmente en peatones y
vehículos personales, mientras que California y Arizona también tienen
volúmenes significativos de cruces, pero menores en comparación con
Texas.Otros estados como Maine, Michigan, y Nueva York tienen volúmenes
de cruces más bajos en todas las categorías.
## `summarise()` has grouped output by 'State'. You can override using the
## `.groups` argument.
## # A tibble: 95 × 3
## # Groups: State [14]
## State Port.Name Total_Crossings
## <chr> <chr> <int>
## 1 Alaska Skagway 9332803
## 2 Alaska Alcan 4815813
## 3 Alaska Dalton Cache 1585697
## 4 Alaska Ketchikan 195975
## 5 Arizona Nogales 466219962
## 6 Arizona San Luis 312607254
## 7 Arizona Douglas 184670260
## 8 Arizona Lukeville 41054495
## 9 Arizona Naco 32413007
## 10 Arizona Sasabe 2687787
## # ℹ 85 more rows
print(top_ports)
## # A tibble: 40 × 3
## # Groups: State [14]
## Port.Name Total_Crossings State
## <chr> <int> <chr>
## 1 Skagway 9332803 Alaska
## 2 Alcan 4815813 Alaska
## 3 Dalton Cache 1585697 Alaska
## 4 Nogales 466219962 Arizona
## 5 San Luis 312607254 Arizona
## 6 Douglas 184670260 Arizona
## 7 San Ysidro 1366208297 California
## 8 Calexico 599645155 California
## 9 Otay Mesa 548861440 California
## 10 Eastport 13829839 Idaho
## # ℹ 30 more rows
En el grafico podemos observar que San Ysidro: Tiene el volumen de
cruces más alto, lo que indica que es el puerto de entrada más
transitado. El Paso y Laredo: También tienen volúmenes de cruces muy
altos, situándose entre los puertos más importantes, mientras que los
puertos como Otay Mesa, Hidalgo, y Calexico también muestran volúmenes
significativos, aunque menores en comparación con los tres
principales.
En la distribución de los estados Texas tiene varios puertos de entrada con altos volúmenes de cruces, incluyendo Laredo, Hidalgo, El paso, esto refleja la importancia de Texas en el comercio y transporte transfronterizo, por otro lado en California San Ysidro y Otay Mesa son los puertos más destacados, subrayando la relevancia de California en el tráfico fronterizo y en Arizona donde Nogales es su puerto principal, muestra un volumen considerable de cruces. Estados como Nueva York, Michigan, y Washington tienen puertos con volúmenes moderados.
Conclusión general
Texas emerge como el estado con el mayor volumen de cruces en múltiples categorías y puertos de entrada, siendo asi un estando de mayor importancia en el comercio y transporte transfronterizo. California y Arizona también son estados importantes, con puertos de entrada como San Ysidro y Nogales que manejan volúmenes significativos de tráfico. Los Peatones y vehículos pequeños son los métodos de transporte más comunes, lo que sugiere una alta movilidad de personas y pequeños vehículos a través de las fronteras. Y por último los puertos de entrada específicos como San Ysidro, El Paso y Laredo son vitales para el flujo de comercio y personas entre Estados Unidos y México.