##Se da lectura al archivo y se revisa su estructura
x<-"C:/Users/aacad/OneDrive/Documents/ADRIANA/FCPYS/R COMO INSTRUMENTO DE INVESTIGACION/Pasajeros.csv"
y<-read.csv(x)
str(y)
## 'data.frame': 216 obs. of 6 variables:
## $ Anio.mes : int 201501 201501 201501 201501 201501 201501 201501 201501 201501 201501 ...
## $ Codigo.IATA : chr "CEN" "CLQ" "CME" "CPE" ...
## $ Descripcion : chr "Ciudad Obregon" "Colima" "Ciudad del Carmen" "Campeche" ...
## $ Estado : chr "Sonora" "Colima" "Campeche" "Campeche" ...
## $ Pasajeros.nacionales : int 17149 8486 56079 13264 13153 4695 1315 1050 6684 5609 ...
## $ Pasajeros.internacionales: int 721 124 3126 215 0 139 386 2684 61 10 ...
Se tienen 216 observaciones y 6 variables, 3 numéricas (año mes, número de pasajeros nacionales e internacionales y 3 de cadena (código descripción y año).
summary(y)
## Anio.mes Codigo.IATA Descripcion Estado
## Min. :201501 Length:216 Length:216 Length:216
## 1st Qu.:201504 Class :character Class :character Class :character
## Median :201507 Mode :character Mode :character Mode :character
## Mean :201507
## 3rd Qu.:201509
## Max. :201512
## Pasajeros.nacionales Pasajeros.internacionales
## Min. : 63 Min. : 0.0
## 1st Qu.: 1198 1st Qu.: 7.0
## Median : 7947 Median : 107.0
## Mean :10608 Mean : 818.2
## 3rd Qu.:14884 3rd Qu.: 584.0
## Max. :56418 Max. :7042.0
Se describen las variables cuantitativas de número de pasajeros:
Nacionales: El mes que registra el menor múmero de pasajeros es de 63 y el mayor con 56,418, en general viajan 10,608 pasajeros al mes.
Internacionales: Existen meses que no registran pasajeros extranjeros, el mes con mayor número de pasajeros registra 7,042, en general viajan 818 pasajeros al mes.
tablaCodigo.IATA<-table(y$Codigo.IATA)
tablaDes<-table(y$Descripcion)
tablaEdo<-table(y$Estado)
tablaCodigo.IATA
##
## CEN CLQ CME CPE CTM CVM GYM LTO MAM NLD NOG PAZ PBC PXM TCN TPQ TSL UPN
## 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12 12
tablaDes
##
## Campeche Chetumal Ciudad del Carmen Ciudad Obregon
## 12 12 12 12
## Ciudad Victoria Colima Guaymas Loreto
## 12 12 12 12
## Matamoros Nogales Nuevo Laredo Poza Rica
## 12 12 12 12
## Puebla Puerto Escondido Tamuin Tehuacan
## 12 12 12 12
## Tepic Uruapan
## 12 12
tablaEdo
##
## Baja California Sur Campeche Colima
## 12 24 12
## Michoacan Nayarit Oaxaca
## 12 12 12
## Puebla Quintana Roo San Luis Potosi
## 24 12 12
## Sonora Tamaulipas Veracruz
## 36 36 12
Se muestra el número de casos por código, aeropuerto y estado de la república.
#Realiza agregaciones que visualicen comportamientos interesantes.
A continuación se muestra el total de pasajeros nacionales e internacionales agrupados por Estado y Aeropuerto, ordenados de forma descendente por pasajeros internacionales. Los aeropuestos con mayor flujo internacional se localizan en Puebla y Baja California Sur.
library(dplyr)
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
y %>%
group_by(Estado,Descripcion) %>%
summarise(
nacional=sum(Pasajeros.nacionales),
internacional=sum(Pasajeros.internacionales),
count=n()
)%>%
arrange(desc(internacional))
## `summarise()` has grouped output by 'Estado'. You can override using the
## `.groups` argument.
## # A tibble: 18 × 5
## # Groups: Estado [12]
## Estado Descripcion nacional internacional count
## <chr> <chr> <int> <int> <int>
## 1 Puebla Puebla 264755 63056 12
## 2 Baja California Sur Loreto 12602 45305 12
## 3 Campeche Ciudad del Carmen 591154 32000 12
## 4 Michoacan Uruapan 95635 14432 12
## 5 Sonora Ciudad Obregon 238409 7083 12
## 6 Sonora Guaymas 12757 4138 12
## 7 Oaxaca Puerto Escondido 181706 3624 12
## 8 Campeche Campeche 178710 3041 12
## 9 Tamaulipas Ciudad Victoria 73491 1665 12
## 10 Colima Colima 112656 927 12
## 11 Tamaulipas Matamoros 96947 707 12
## 12 Sonora Nogales 2622 355 12
## 13 Tamaulipas Nuevo Laredo 72688 290 12
## 14 Quintana Roo Chetumal 179259 118 12
## 15 Nayarit Tepic 113043 0 12
## 16 Puebla Tehuacan 2812 0 12
## 17 San Luis Potosi Tamuin 1598 0 12
## 18 Veracruz Poza Rica 60575 0 12
par(mfrow=c(1,2))
hist(y$Pasajeros.nacionales,main="Pasajeros nacionales",
xlab = "Pasajeros",ylab = "Frecuencia")
hist(y$Pasajeros.internacionales,main="Pasajeros internacionales",
xlab = "Pasajeros",ylab = "Frecuencia")
En pasajeros nacionales, la mayor parte de de los meses se registran hasta 10 000, mientras que en internacionales, en la mayoría de los meses se observan hasta 1000.
library(ggplot2)
ggplot(y,aes(x=factor(Descripcion),y=Pasajeros.nacionales))+
geom_bar(stat = "identity")+
labs(title = "Pasajeros nacionales por aeropuerto",
x="Aeropuerto",
y="Pasajeros")+
theme(axis.text.x = element_text(angle = 45, hjust = 1))
El aeropuerto que reporta mayor número de pasajeros nacionales es Ciudad del Carmen.
boxplot((y$Pasajeros.nacionales+y$Pasajeros.internacionales),
main="Boxplot de pasajeros al mes",
ylab="Pasajeros al mes")
En la mitad de los meses se registra menos de 10 000 pasajeros.
library(ggplot2)
ggplot(y,aes(x=factor(Descripcion),y=Pasajeros.internacionales))+
geom_bar(stat = "identity")+
labs(title = "Pasajeros internacionales por aeropuerto",
x="Aeropuerto",
y="Pasajeros")
plot(y$Pasajeros.nacionales,y$Pasajeros.internacionales,
xlab = "Pasajeros nacionales",
ylab="Pasajeros internacionales",
main="Relación entre tipo de pasajeros")
Se observa una relación aproximada de 10 a 1 entre pasajeros nacionales respecto a internacionales.