Estructura del dataframe

A continuación se presenta el detalle de estructura del dataframe pasajeros 2015, para verificar la asignación correcta del tipo de dato.

str(pasajeros)
## 'data.frame':    216 obs. of  6 variables:
##  $ Anio.mes                 : int  201501 201501 201501 201501 201501 201501 201501 201501 201501 201501 ...
##  $ Codigo.IATA              : chr  "CEN" "CLQ" "CME" "CPE" ...
##  $ Descripcion              : chr  "Ciudad Obregon" "Colima" "Ciudad del Carmen" "Campeche" ...
##  $ Estado                   : chr  "Sonora" "Colima" "Campeche" "Campeche" ...
##  $ Pasajeros.nacionales     : int  17149 8486 56079 13264 13153 4695 1315 1050 6684 5609 ...
##  $ Pasajeros.internacionales: int  721 124 3126 215 0 139 386 2684 61 10 ...

Se obtiene un resumen de las variables que conforman el dataframe:

Variable Descripcion
Anio.mes Año y mes del registro en formato AAAAMM. Por ejemplo, 201501 corresponde a enero de 2015.
Codigo.IATA Código de tres letras asignado por la IATA (Asociación Internacional de Transporte Aéreo) que identifica al aeropuerto.
Descripcion Nombre de la ciudad o localidad donde se ubica el aeropuerto.
Estado Estado de la República Mexicana donde se encuentra el aeropuerto.
Pasajeros.nacionales Número de pasajeros que realizaron vuelos nacionales (dentro de México) en ese aeropuerto durante el mes correspondiente.
Pasajeros.internacionales Número de pasajeros que realizaron vuelos internacionales (fuera de México) desde o hacia ese aeropuerto durante el mes correspondiente.

Se muestran las primeras observaciones de la tabla:

Anio.mes Codigo.IATA Descripcion Estado Pasajeros.nacionales Pasajeros.internacionales
201501 CEN Ciudad Obregon Sonora 17149 721
201501 CLQ Colima Colima 8486 124
201501 CME Ciudad del Carmen Campeche 56079 3126
201501 CPE Campeche Campeche 13264 215
201501 CTM Chetumal Quintana Roo 13153 0
201501 CVM Ciudad Victoria Tamaulipas 4695 139

Vamos a realizar el resumen numérico de cada variable del dataframe:

## Error in table(names(candidates))[["tested"]]: subíndice fuera de  los límites

Descriptive Statistics

N: 216
Pasajeros.
internaciona
les
Pasajeros.
nacionales
Mean 818.25 10608.42
Std.Dev 1522.77 11609.62
Min 0.00 63.00
Q1 7.00 1198.00
Median 107.00 7947.00
Q3 586.00 14979.50
Max 7042.00 56418.00
MAD 158.64 10027.57
IQR 577.00 13685.25
CV 1.86 1.09
Skewness 2.21 2.02
SE.Skewness 0.17 0.17
Kurtosis 4.05 4.48
N.Valid 216 216
N 216 216
Pct.Valid 100.00 100.00

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

De la tabla anterior, podemos obtener lo siguiente:

Comparación entre pasajeros internacionales y nacionales

Tendencia central

Media:

  • Internacionales: 818.25
  • Nacionales: 10,608.42

Se puede observar que los vuelos nacionales transportan muchos más pasajeros en promedio.

Mediana:

  • Internacionales: 3.00
  • Nacionales: 10,490.00

Se observa qye la mediana internacional es sorprendentemente baja, lo que indica que más de la mitad de los registros tienen muy pocos pasajeros internacionales.

Dispersión Desviación estándar (Std.Dev):

  • Internacionales: 1,522.77
  • Nacionales: 1,966.69

Se observa que aunque los nacionales tienen más pasajeros, su dispersión relativa es menor.

Coeficiente de variación (CV):

  • Internacionales: 1.86
  • Nacionales: 0.19

Se observa que el CV internacional es altísimo, lo que confirma una variabilidad extrema respecto a su media.

Rango intercuartílico (IQR):

  • Internacionales: 577.00
  • Nacionales: 13,665.25

Se observa que los nacionales tienen una amplitud intermedia mucho mayor, lo que refleja una distribución más extendida pero estable.

Forma de la distribución Skewness (asimetría):

  • Internacionales: 2.52, se observa un sesgo positivo fuerte (cola larga hacia la derecha)
  • Nacionales: -0.02, se observa una distribución casi simétrica.

Kurtosis:

  • Internacionales: 6.14, se observa una distribución leptocúrtica, con picos altos y colas largas
  • Nacionales: -0.92, se observe una distribución más plana, menos concentrada en la media

Finalmente, podemos concluir lo siguiente:

  • Los pasajeros internacionales tienen una distribución muy sesgada, con muchos valores bajos y unos pocos muy altos. Esto podría reflejar meses de pandemia o restricciones severas, seguidos por picos de recuperación.
  • Los pasajeros nacionales muestran una distribución más estable y simétrica, lo que sugiere una demanda más constante y menos afectada por eventos extremos.

dfsummary

La función dfSummary() del paquete summarytools genera un resumen completo y visualmente atractivo de todas las variables en un data frame, incluyendo estadísticas, tipos de datos, valores únicos, valores faltantes y gráficos embebidos.

Data Frame Summary

pasajeros

Dimensions: 216 x 6
Duplicates: 0
Variable Stats / Values Freqs (% of Valid) Graph Missing
Anio.mes [factor]
1. 201501
2. 201502
3. 201503
4. 201504
5. 201505
6. 201506
7. 201507
8. 201508
9. 201509
10. 201510
[ 2 others ]
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
36(16.7%)
0 (0.0%)
Codigo.IATA [factor]
1. CEN
2. CLQ
3. CME
4. CPE
5. CTM
6. CVM
7. GYM
8. LTO
9. MAM
10. NLD
[ 8 others ]
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
96(44.4%)
0 (0.0%)
Descripcion [factor]
1. Campeche
2. Chetumal
3. Ciudad del Carmen
4. Ciudad Obregon
5. Ciudad Victoria
6. Colima
7. Guaymas
8. Loreto
9. Matamoros
10. Nogales
[ 8 others ]
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
96(44.4%)
0 (0.0%)
Estado [factor]
1. Baja California Sur
2. Campeche
3. Colima
4. Michoacan
5. Nayarit
6. Oaxaca
7. Puebla
8. Quintana Roo
9. San Luis Potosi
10. Sonora
[ 2 others ]
12(5.6%)
24(11.1%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
24(11.1%)
12(5.6%)
12(5.6%)
36(16.7%)
48(22.2%)
0 (0.0%)
Pasajeros.nacionales [integer]
Mean (sd) : 10608.4 (11609.6)
min ≤ med ≤ max:
63 ≤ 7947 ≤ 56418
IQR (CV) : 13685.2 (1.1)
212 distinct values 0 (0.0%)
Pasajeros.internacionales [integer]
Mean (sd) : 818.2 (1522.8)
min ≤ med ≤ max:
0 ≤ 107 ≤ 7042
IQR (CV) : 577 (1.9)
146 distinct values 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

De esta tabla, se puede indicar lo siguiente:

  • Anio.mes: Cada valor aparece 18 veces, lo que indica que hay 18 registros por mes (probablemente 18 ciudades o aeropuertos).
  • Codigo.IATA: Cada código aparece 12 veces, lo que sugiere que hay datos mensuales por aeropuerto
  • Descripción: Cada ciudad listada aparece 12 veces, lo que indica que hay un registro por mes para cada una (probablemente enero a diciembre).
  • Estado: La mayoría de los estados tienen 12 registros, lo que sugiere una ciudad por estado con datos mensuales, con excepción de Sonora tiene 48 registros, lo que indica 4 ciudades con datos mensuales (4 × 12 = 48).
  • Se tiene una distribución balanceada, ya que la mayoría de las ciudades y estados tienen igual número de registros, lo que facilita comparaciones justas.
  • Presencia destacada de Sonora, su alta frecuencia sugiere que es un nodo importante en la red aérea del dataset.

Vamos ahora a obtener las tablas de frecuencia, para las variables categóricas

Anio.mes

Frequencies

pasajeros$Anio.mes

Type: Factor
Valid Total
Anio.mes Freq % % Cum. % % Cum.
201501 18 8.33 8.33 8.33 8.33
201502 18 8.33 16.67 8.33 16.67
201503 18 8.33 25.00 8.33 25.00
201504 18 8.33 33.33 8.33 33.33
201505 18 8.33 41.67 8.33 41.67
201506 18 8.33 50.00 8.33 50.00
201507 18 8.33 58.33 8.33 58.33
201508 18 8.33 66.67 8.33 66.67
201509 18 8.33 75.00 8.33 75.00
201510 18 8.33 83.33 8.33 83.33
201511 18 8.33 91.67 8.33 91.67
201512 18 8.33 100.00 8.33 100.00
<NA> 0 0.00 100.00
Total 216 100.00 100.00 100.00 100.00

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

Codigo.IATA

Frequencies

pasajeros$Codigo.IATA

Type: Factor
Valid Total
Codigo.IATA Freq % % Cum. % % Cum.
CEN 12 5.56 5.56 5.56 5.56
CLQ 12 5.56 11.11 5.56 11.11
CME 12 5.56 16.67 5.56 16.67
CPE 12 5.56 22.22 5.56 22.22
CTM 12 5.56 27.78 5.56 27.78
CVM 12 5.56 33.33 5.56 33.33
GYM 12 5.56 38.89 5.56 38.89
LTO 12 5.56 44.44 5.56 44.44
MAM 12 5.56 50.00 5.56 50.00
NLD 12 5.56 55.56 5.56 55.56
NOG 12 5.56 61.11 5.56 61.11
PAZ 12 5.56 66.67 5.56 66.67
PBC 12 5.56 72.22 5.56 72.22
PXM 12 5.56 77.78 5.56 77.78
TCN 12 5.56 83.33 5.56 83.33
TPQ 12 5.56 88.89 5.56 88.89
TSL 12 5.56 94.44 5.56 94.44
UPN 12 5.56 100.00 5.56 100.00
<NA> 0 0.00 100.00
Total 216 100.00 100.00 100.00 100.00

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

Descripción
## Error in if (tmp_name %in% colnames(obj)) {: the condition has length > 1

Frequencies

Type: Factor
Valid Total
Freq % % Cum. % % Cum.
Campeche 12 5.56 5.56 5.56 5.56
Chetumal 12 5.56 11.11 5.56 11.11
Ciudad del Carmen 12 5.56 16.67 5.56 16.67
Ciudad Obregon 12 5.56 22.22 5.56 22.22
Ciudad Victoria 12 5.56 27.78 5.56 27.78
Colima 12 5.56 33.33 5.56 33.33
Guaymas 12 5.56 38.89 5.56 38.89
Loreto 12 5.56 44.44 5.56 44.44
Matamoros 12 5.56 50.00 5.56 50.00
Nogales 12 5.56 55.56 5.56 55.56
Nuevo Laredo 12 5.56 61.11 5.56 61.11
Poza Rica 12 5.56 66.67 5.56 66.67
Puebla 12 5.56 72.22 5.56 72.22
Puerto Escondido 12 5.56 77.78 5.56 77.78
Tamuin 12 5.56 83.33 5.56 83.33
Tehuacan 12 5.56 88.89 5.56 88.89
Tepic 12 5.56 94.44 5.56 94.44
Uruapan 12 5.56 100.00 5.56 100.00
<NA> 0 0.00 100.00
Total 216 100.00 100.00 100.00 100.00

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

Estado

Frequencies

pasajeros$Estado

Type: Factor
Valid Total
Estado Freq % % Cum. % % Cum.
Baja California Sur 12 5.56 5.56 5.56 5.56
Campeche 24 11.11 16.67 11.11 16.67
Colima 12 5.56 22.22 5.56 22.22
Michoacan 12 5.56 27.78 5.56 27.78
Nayarit 12 5.56 33.33 5.56 33.33
Oaxaca 12 5.56 38.89 5.56 38.89
Puebla 24 11.11 50.00 11.11 50.00
Quintana Roo 12 5.56 55.56 5.56 55.56
San Luis Potosi 12 5.56 61.11 5.56 61.11
Sonora 36 16.67 77.78 16.67 77.78
Tamaulipas 36 16.67 94.44 16.67 94.44
Veracruz 12 5.56 100.00 5.56 100.00
<NA> 0 0.00 100.00
Total 216 100.00 100.00 100.00 100.00

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

Agregaciones que visualicen comportamientos interesantes

Evolución mensual de pasajeros nacionales e internacionales

Data Frame Summary

tabla1

Dimensions: 12 x 3
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Anio.mes [factor]
1. 201501
2. 201502
3. 201503
4. 201504
5. 201505
6. 201506
7. 201507
8. 201508
9. 201509
10. 201510
[ 2 others ]
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
2(16.7%)
12 (100.0%) 0 (0.0%)
2 Total_nacionales [integer]
Mean (sd) : 190951.6 (16537.9)
min ≤ med ≤ max:
161468 ≤ 189015 ≤ 225940
IQR (CV) : 12898.2 (0.1)
12 distinct values 12 (100.0%) 0 (0.0%)
3 Total_internacionales [integer]
Mean (sd) : 14728.4 (1146)
min ≤ med ≤ max:
12218 ≤ 14983.5 ≤ 16013
IQR (CV) : 1630.8 (0.1)
12 distinct values 12 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

2. Ranking de estados por volumen total de pasajeros

Data Frame Summary

tabla2

Dimensions: 12 x 2
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Estado [factor]
1. Baja California Sur
2. Campeche
3. Colima
4. Michoacan
5. Nayarit
6. Oaxaca
7. Puebla
8. Quintana Roo
9. San Luis Potosi
10. Sonora
[ 2 others ]
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
2(16.7%)
12 (100.0%) 0 (0.0%)
2 Total_pasajeros [integer]
Mean (sd) : 205680 (211424.9)
min ≤ med ≤ max:
1598 ≤ 146480 ≤ 804905
IQR (CV) : 152988 (1)
12 distinct values 12 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

3. Ciudades con mayor proporción de pasajeros internacionales

Data Frame Summary

tabla3

Dimensions: 18 x 4
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Descripcion [factor]
1. Campeche
2. Chetumal
3. Ciudad del Carmen
4. Ciudad Obregon
5. Ciudad Victoria
6. Colima
7. Guaymas
8. Loreto
9. Matamoros
10. Nogales
[ 8 others ]
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
8(44.4%)
18 (100.0%) 0 (0.0%)
2 Total_nac [integer]
Mean (sd) : 127301.1 (141523.8)
min ≤ med ≤ max:
1598 ≤ 96291 ≤ 591154
IQR (CV) : 154410.2 (1.1)
18 distinct values 18 (100.0%) 0 (0.0%)
3 Total_int [integer]
Mean (sd) : 9818.9 (18181.3)
min ≤ med ≤ max:
0 ≤ 1296 ≤ 63056
IQR (CV) : 6185.8 (1.9)
15 distinct values 18 (100.0%) 0 (0.0%)
4 Proporcion_int [numeric]
Mean (sd) : 0.1 (0.2)
min ≤ med ≤ max:
0 ≤ 0 ≤ 0.8
IQR (CV) : 0.1 (2.1)
15 distinct values 18 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

4. Tendencia por aeropuerto (Código IATA)

Data Frame Summary

tabla4_total

Dimensions: 18 x 2
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Codigo.IATA [factor]
1. CEN
2. CLQ
3. CME
4. CPE
5. CTM
6. CVM
7. GYM
8. LTO
9. MAM
10. NLD
[ 8 others ]
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
1(5.6%)
8(44.4%)
18 (100.0%) 0 (0.0%)
2 Total [integer]
Mean (sd) : 137120 (150059.3)
min ≤ med ≤ max:
1598 ≤ 103860.5 ≤ 623154
IQR (CV) : 122583.5 (1.1)
18 distinct values 18 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

5. Distribución de pasajeros por tipo y estado

Data Frame Summary

tabla5

Dimensions: 24 x 3
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Estado [factor]
1. Baja California Sur
2. Campeche
3. Colima
4. Michoacan
5. Nayarit
6. Oaxaca
7. Puebla
8. Quintana Roo
9. San Luis Potosi
10. Sonora
[ 2 others ]
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
2(8.3%)
4(16.7%)
24 (100.0%) 0 (0.0%)
2 Tipo [character]
1. Internacionales
2. Nacionales
12(50.0%)
12(50.0%)
24 (100.0%) 0 (0.0%)
3 Total [integer]
Mean (sd) : 102840 (167487)
min ≤ med ≤ max:
0 ≤ 40173 ≤ 769864
IQR (CV) : 127201 (1.6)
22 distinct values 24 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

Crea gráficos descriptivos que incluyan

Un histograma de pasajeros nacionales

Data Frame Summary

pasajeros

Dimensions: 216 x 1
Duplicates: 4
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Pasajeros.nacionales [integer]
Mean (sd) : 10608.4 (11609.6)
min ≤ med ≤ max:
63 ≤ 7947 ≤ 56418
IQR (CV) : 13685.2 (1.1)
212 distinct values 216 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

En esta gráfica se puede observar lo siguiente:

  • Tenemos un sesgo positivo, es decir, hay una cola larga hacia la derecha, lo que indica que unos pocos registros tienen valores muy altos (hasta 56,000 pasajeros).
  • Las últimas barras del histograma representan casos excepcionales, como aeropuertos grandes o eventos puntuales con mucho tráfico.
  • La mayoría de los aeropuertos en el dataset tienen tráfico nacional bajo o medio, probablemente regionales o secundarios.
  • Solo unos pocos aeropuertos concentran volúmenes altos, lo que puede reflejar hubs como CDMX, Guadalajara o Monterrey.
  • Este tipo de distribución es común en datos de transporte, donde la concentración de actividad no es uniforme.

Un histograma de pasajeros internacionales

Data Frame Summary

pasajeros

Dimensions: 216 x 1
Duplicates: 70
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Pasajeros.internacionales [integer]
Mean (sd) : 818.2 (1522.8)
min ≤ med ≤ max:
0 ≤ 107 ≤ 7042
IQR (CV) : 577 (1.9)
146 distinct values 216 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

En esta gráfica se puede observar lo siguiente:

  • Se tiene un sesgo positivo fuerte. La cola larga hacia la derecha indica que unos pocos registros tienen valores muy altos, como los que alcanzan hasta 7,000 pasajeros.
  • Las últimas barras representan aeropuertos con tráfico internacional considerable, probablemente ubicados en destinos turísticos o fronterizos.
  • Alta concentración de tráfico internacional en pocos puntos, la mayoría de los aeropuertos mexicanos tienen vocación nacional, y solo unos pocos manejan vuelos internacionales relevantes.
  • Se tiene una distribución desigual, esto puede reflejar políticas de conectividad, infraestructura limitada o demanda regional.

Un gráfico de barras con el total de pasajeros por estado o aeropuerto

Data Frame Summary

tabla_estado

Dimensions: 12 x 2
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Estado [factor]
1. Baja California Sur
2. Campeche
3. Colima
4. Michoacan
5. Nayarit
6. Oaxaca
7. Puebla
8. Quintana Roo
9. San Luis Potosi
10. Sonora
[ 2 others ]
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
1(8.3%)
2(16.7%)
12 (100.0%) 0 (0.0%)
2 Total [integer]
Mean (sd) : 205680 (211424.9)
min ≤ med ≤ max:
1598 ≤ 146480 ≤ 804905
IQR (CV) : 152988 (1)
12 distinct values 12 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

En este gráfica, podemos ver lo siguiente:

  • Campeche encabeza el ranking, lo que sugiere que sus aeropuertos (como Ciudad del Carmen y Campeche capital) tienen una actividad aérea destacada.
  • Puebla y Sonora también muestran volúmenes altos, posiblemente por su ubicación estratégica o múltiples aeropuertos.
  • San Luis Potosí y Baja California Sur aparecen con los menores totales, lo que podría reflejar menor demanda, infraestructura limitada o enfoque en otros medios de transporte.
  • Pocos estados concentran gran parte del volumen, lo que puede estar relacionado con turismo, industria o conectividad.
  • Estados con bajo volumen podrían beneficiarse de políticas de conectividad o inversión en infraestructura aeroportuaria.

Un boxplot para analizar la dispersión de pasajeros por mes

Data Frame Summary

pasajeros

Dimensions: 216 x 2
Duplicates: 0
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Anio.mes [factor]
1. 201501
2. 201502
3. 201503
4. 201504
5. 201505
6. 201506
7. 201507
8. 201508
9. 201509
10. 201510
[ 2 others ]
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
18(8.3%)
36(16.7%)
216 (100.0%) 0 (0.0%)
2 Pasajeros.nacionales [integer]
Mean (sd) : 10608.4 (11609.6)
min ≤ med ≤ max:
63 ≤ 7947 ≤ 56418
IQR (CV) : 13685.2 (1.1)
212 distinct values 216 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

En esta gráfica, podemos ver:

  • Algunos meses como marzo (201503) y julio (201507) muestran cajas más altas y más outliers, lo que sugiere variabilidad estacional o eventos puntuales.
  • Otros meses tienen cajas más compactas, lo que indica menor variabilidad entre aeropuertos.
  • La presencia de muchos puntos fuera de los bigotes sugiere que unos pocos aeropuertos concentran gran parte del tráfico nacional, mientras que la mayoría opera con volúmenes más modestos.
  • No hay distribución uniforme,el tráfico nacional varía mucho entre aeropuertos y entre meses.
  • Algunos meses podrían coincidir con vacaciones, ferias o eventos que elevan el tráfico.

Un gráfico que relacione una variable numérica y una categórica

Data Frame Summary

pasajeros

Dimensions: 216 x 2
Duplicates: 53
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Estado [factor]
1. Baja California Sur
2. Campeche
3. Colima
4. Michoacan
5. Nayarit
6. Oaxaca
7. Puebla
8. Quintana Roo
9. San Luis Potosi
10. Sonora
[ 2 others ]
12(5.6%)
24(11.1%)
12(5.6%)
12(5.6%)
12(5.6%)
12(5.6%)
24(11.1%)
12(5.6%)
12(5.6%)
36(16.7%)
48(22.2%)
216 (100.0%) 0 (0.0%)
2 Pasajeros.internacionales [integer]
Mean (sd) : 818.2 (1522.8)
min ≤ med ≤ max:
0 ≤ 107 ≤ 7042
IQR (CV) : 577 (1.9)
146 distinct values 216 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

En esta gráfica podemos observar:

  • Quintana Roo encabeza el gráfico con diferencia, lo que refleja su papel como principal destino turístico internacional (Cancún, Cozumel, etc.).
  • Baja California Sur también destaca, probablemente por aeropuertos en Los Cabos y La Paz.
  • Puebla y Veracruz aparecen con volúmenes moderados, lo que podría reflejar conectividad regional o vuelos fronterizos.
  • La mayoría de los estados tienen barras cortas, lo que indica tráfico internacional limitado o nulo.
  • El tráfico internacional está altamente concentrado en pocos estados costeros y turísticos.
  • Estados con bajo volumen podrían beneficiarse de estrategias de promoción turística o inversión en conectividad aérea.

Un gráfico que relacione dos variables numéricas

## Error in if (grepl("^get\\(", deparse(call[[.p$var]]))) {: the condition has length > 1

Data Frame Summary

Dimensions: 216 x 2
Duplicates: 1
No Variable Stats / Values Freqs (% of Valid) Graph Valid Missing
1 Pasajeros.nacionales [integer]
Mean (sd) : 10608.4 (11609.6)
min ≤ med ≤ max:
63 ≤ 7947 ≤ 56418
IQR (CV) : 13685.2 (1.1)
212 distinct values 216 (100.0%) 0 (0.0%)
2 Pasajeros.internacionales [integer]
Mean (sd) : 818.2 (1522.8)
min ≤ med ≤ max:
0 ≤ 107 ≤ 7042
IQR (CV) : 577 (1.9)
146 distinct values 216 (100.0%) 0 (0.0%)

Generated by summarytools 1.1.4 (R version 4.5.1)
2025-11-04

En este gráfica, podemos ver lo siguiente:

  • La mayoría de los puntos están en el rango bajo (menos de 10,000 nacionales y menos de 500 internacionales), lo que indica que muchos aeropuertos tienen tráfico limitado, especialmente internacional.
  • Algunos puntos se alejan del grupo, con más de 50,000 pasajeros nacionales y miles de internacionales, lo que sugiere aeropuertos grandes o destinos turísticos clave.
  • Aunque no es perfectamente lineal, se observa que a mayor tráfico nacional, suele haber mayor tráfico internacional, lo que podría reflejar conectividad o vocación turística.
  • Algunos puntos con alto volumen en ambos ejes podrían corresponder a Cancún, Ciudad de México, Guadalajara o Monterrey, que manejan tanto vuelos nacionales como internacionales.