ejercicio3 <- read.csv("C:/Users/psicr/Downloads/S4_ASA_estadisticasPasajeros.csv", header= TRUE, sep= ",")
summary(ejercicio3)
## Anio.mes Codigo.IATA Descripcion Estado
## Min. :201501 Length:216 Length:216 Length:216
## 1st Qu.:201504 Class :character Class :character Class :character
## Median :201507 Mode :character Mode :character Mode :character
## Mean :201507
## 3rd Qu.:201509
## Max. :201512
## Pasajeros.nacionales Pasajeros.internacionales
## Min. : 63 Min. : 0.0
## 1st Qu.: 1198 1st Qu.: 7.0
## Median : 7947 Median : 107.0
## Mean :10608 Mean : 818.2
## 3rd Qu.:14884 3rd Qu.: 584.0
## Max. :56418 Max. :7042.0
library(janitor)
##
## Adjuntando el paquete: 'janitor'
## The following objects are masked from 'package:stats':
##
## chisq.test, fisher.test
ejercicio3 %>% tabyl(Codigo.IATA)
## Codigo.IATA n percent
## CEN 12 0.05555556
## CLQ 12 0.05555556
## CME 12 0.05555556
## CPE 12 0.05555556
## CTM 12 0.05555556
## CVM 12 0.05555556
## GYM 12 0.05555556
## LTO 12 0.05555556
## MAM 12 0.05555556
## NLD 12 0.05555556
## NOG 12 0.05555556
## PAZ 12 0.05555556
## PBC 12 0.05555556
## PXM 12 0.05555556
## TCN 12 0.05555556
## TPQ 12 0.05555556
## TSL 12 0.05555556
## UPN 12 0.05555556
ejercicio3 %>% tabyl(Descripcion)
## Descripcion n percent
## Campeche 12 0.05555556
## Chetumal 12 0.05555556
## Ciudad Obregon 12 0.05555556
## Ciudad Victoria 12 0.05555556
## Ciudad del Carmen 12 0.05555556
## Colima 12 0.05555556
## Guaymas 12 0.05555556
## Loreto 12 0.05555556
## Matamoros 12 0.05555556
## Nogales 12 0.05555556
## Nuevo Laredo 12 0.05555556
## Poza Rica 12 0.05555556
## Puebla 12 0.05555556
## Puerto Escondido 12 0.05555556
## Tamuin 12 0.05555556
## Tehuacan 12 0.05555556
## Tepic 12 0.05555556
## Uruapan 12 0.05555556
ejercicio3 %>% tabyl(Estado)
## Estado n percent
## Baja California Sur 12 0.05555556
## Campeche 24 0.11111111
## Colima 12 0.05555556
## Michoacan 12 0.05555556
## Nayarit 12 0.05555556
## Oaxaca 12 0.05555556
## Puebla 24 0.11111111
## Quintana Roo 12 0.05555556
## San Luis Potosi 12 0.05555556
## Sonora 36 0.16666667
## Tamaulipas 36 0.16666667
## Veracruz 12 0.05555556
library(ggplot2)
ggplot (ejercicio3 , aes (x= Pasajeros.nacionales )) + geom_histogram ( binwidth =5000, fill =" purple ",
color =" black ", alpha =0.7) + labs ( title =" Histograma de Pasajeros nacionales ", x=" Cantidad de pasajeros ", y=" Frecuencia ")
###El histograma de los pasajeros nacionales muestra que la frecuencia
más alta es de 0 a 5,000 pasajeros, y en general, la concentración de
los datos se da en 20,000 o menos. Además, se muestra una asimetría
positiva con casos por encima de los 40,000, pero menores a los
60,000.
ejercicio3$total.pasajeros <- ejercicio3$Pasajeros.nacionales + ejercicio3$Pasajeros.internacionales
ggplot (ejercicio3,aes(x=Codigo.IATA, y= total.pasajeros)) + geom_col(position="dodge") +
labs(title =" Gráfico de pasajeros por aeropuerto ", x="Aeropuertos", y=" Frecuencia ")
### El gráfico de barras de pasajeros por aeropuerto muestra que el CME
tuvo la mayor cantidad de pasajeros con casi 60,000 usuarios, mientras
que NOG, TCN y TSL la menor cantidad.
ggplot(ejercicio3, aes(x= factor(Anio.mes), y=total.pasajeros)) + geom_boxplot(fill="purple", color ="black", alpha =0.7) + labs(title ="Diagrama de caja y bigotes del total de pasajeros por mes", x=" Mes ", y="cantidad de pasajeros")
### Los gráficos muestran una relativa estabilidad de la distribución de
los pasajeros por mes, estando la mediana de aproximadamente 500 a 1000
pasajeros, en cada mes hay una o dos cantidades atípicas de pasajeros,
en enero y diciembre los outlayers llegan casi a los 60,000. Los meses
de julio y agosto son los que presentaron una mayor dispersión, si no se
consideran los atípicos.
ggplot (ejercicio3,aes(x=Estado, y= Pasajeros.internacionales)) + geom_col(position="dodge") +
labs(title =" Gráfico de pasajeros internacionales por estado", x="Estados de la República", y="Cantidad de pasajeros extranjeros")
### La gráfica de barras permite observar que los pasajeros
internacionales viajaron o hicieron más uso de aeropuertos en los
estados de Puebla, California y Campeche, mientras que Nayarit, SLP y
Veracruz no presentaron usuarios registrados en el 2015.
ggplot(ejercicio3, aes(x=Pasajeros.nacionales, y=Pasajeros.internacionales)) + geom_point(color="blue", size=3, alpha =0.7) + labs(title =" Diagrama de dispersión de pasajeros nacionales e internacionales", x="Pasajeros nacionales", y="Pasajeros internacionales")