Paso 1 abrir el documento y obtener sus estadísticos

ejercicio3 <- read.csv("C:/Users/psicr/Downloads/S4_ASA_estadisticasPasajeros.csv", header= TRUE, sep= ",")
summary(ejercicio3)
##     Anio.mes      Codigo.IATA        Descripcion           Estado         
##  Min.   :201501   Length:216         Length:216         Length:216        
##  1st Qu.:201504   Class :character   Class :character   Class :character  
##  Median :201507   Mode  :character   Mode  :character   Mode  :character  
##  Mean   :201507                                                           
##  3rd Qu.:201509                                                           
##  Max.   :201512                                                           
##  Pasajeros.nacionales Pasajeros.internacionales
##  Min.   :   63        Min.   :   0.0           
##  1st Qu.: 1198        1st Qu.:   7.0           
##  Median : 7947        Median : 107.0           
##  Mean   :10608        Mean   : 818.2           
##  3rd Qu.:14884        3rd Qu.: 584.0           
##  Max.   :56418        Max.   :7042.0

Tablas de contingencia con janitor

library(janitor)
## 
## Adjuntando el paquete: 'janitor'
## The following objects are masked from 'package:stats':
## 
##     chisq.test, fisher.test
ejercicio3 %>% tabyl(Codigo.IATA)
##  Codigo.IATA  n    percent
##          CEN 12 0.05555556
##          CLQ 12 0.05555556
##          CME 12 0.05555556
##          CPE 12 0.05555556
##          CTM 12 0.05555556
##          CVM 12 0.05555556
##          GYM 12 0.05555556
##          LTO 12 0.05555556
##          MAM 12 0.05555556
##          NLD 12 0.05555556
##          NOG 12 0.05555556
##          PAZ 12 0.05555556
##          PBC 12 0.05555556
##          PXM 12 0.05555556
##          TCN 12 0.05555556
##          TPQ 12 0.05555556
##          TSL 12 0.05555556
##          UPN 12 0.05555556
ejercicio3 %>% tabyl(Descripcion)
##        Descripcion  n    percent
##           Campeche 12 0.05555556
##           Chetumal 12 0.05555556
##     Ciudad Obregon 12 0.05555556
##    Ciudad Victoria 12 0.05555556
##  Ciudad del Carmen 12 0.05555556
##             Colima 12 0.05555556
##            Guaymas 12 0.05555556
##             Loreto 12 0.05555556
##          Matamoros 12 0.05555556
##            Nogales 12 0.05555556
##       Nuevo Laredo 12 0.05555556
##          Poza Rica 12 0.05555556
##             Puebla 12 0.05555556
##   Puerto Escondido 12 0.05555556
##             Tamuin 12 0.05555556
##           Tehuacan 12 0.05555556
##              Tepic 12 0.05555556
##            Uruapan 12 0.05555556
ejercicio3 %>% tabyl(Estado)
##                Estado  n    percent
##  Baja California  Sur 12 0.05555556
##              Campeche 24 0.11111111
##                Colima 12 0.05555556
##             Michoacan 12 0.05555556
##               Nayarit 12 0.05555556
##                Oaxaca 12 0.05555556
##                Puebla 24 0.11111111
##          Quintana Roo 12 0.05555556
##       San Luis Potosi 12 0.05555556
##                Sonora 36 0.16666667
##            Tamaulipas 36 0.16666667
##              Veracruz 12 0.05555556

Gráficas con ggplot2

histograma de pasajeros nacionales

library(ggplot2)
ggplot (ejercicio3 , aes (x= Pasajeros.nacionales )) + geom_histogram ( binwidth =5000, fill =" purple ",
color =" black ", alpha =0.7) + labs ( title =" Histograma de Pasajeros nacionales ", x=" Cantidad de pasajeros ", y=" Frecuencia ")

###El histograma de los pasajeros nacionales muestra que la frecuencia más alta es de 0 a 5,000 pasajeros, y en general, la concentración de los datos se da en 20,000 o menos. Además, se muestra una asimetría positiva con casos por encima de los 40,000, pero menores a los 60,000.

Gráfico de barras del total de pasajeros por aeropuerto.

Primero se debe crear la columna (o variable) de total de pasajeros

ejercicio3$total.pasajeros <- ejercicio3$Pasajeros.nacionales + ejercicio3$Pasajeros.internacionales
ggplot (ejercicio3,aes(x=Codigo.IATA, y= total.pasajeros)) + geom_col(position="dodge") +
labs(title =" Gráfico de pasajeros por aeropuerto ", x="Aeropuertos", y=" Frecuencia ")

### El gráfico de barras de pasajeros por aeropuerto muestra que el CME tuvo la mayor cantidad de pasajeros con casi 60,000 usuarios, mientras que NOG, TCN y TSL la menor cantidad.

Gráfico de caja y bigotes de pasajeros por mes

ggplot(ejercicio3, aes(x= factor(Anio.mes), y=total.pasajeros)) + geom_boxplot(fill="purple", color ="black", alpha =0.7) + labs(title ="Diagrama de caja y bigotes del total de pasajeros por mes", x=" Mes ", y="cantidad de pasajeros")

### Los gráficos muestran una relativa estabilidad de la distribución de los pasajeros por mes, estando la mediana de aproximadamente 500 a 1000 pasajeros, en cada mes hay una o dos cantidades atípicas de pasajeros, en enero y diciembre los outlayers llegan casi a los 60,000. Los meses de julio y agosto son los que presentaron una mayor dispersión, si no se consideran los atípicos.

Un gráfico que relacione una variable numérica y otra categórica, será un gráfico de barras con el eje y para pasajeros internaciones y el eje x los estados, respectivamente.

ggplot (ejercicio3,aes(x=Estado, y= Pasajeros.internacionales)) + geom_col(position="dodge") +
labs(title =" Gráfico de pasajeros internacionales por estado", x="Estados de la República", y="Cantidad de pasajeros extranjeros")

### La gráfica de barras permite observar que los pasajeros internacionales viajaron o hicieron más uso de aeropuertos en los estados de Puebla, California y Campeche, mientras que Nayarit, SLP y Veracruz no presentaron usuarios registrados en el 2015.

Un gráfico que relacione dos variables numéricas, se utilizará el gráfico de dispersión, las únicas disponibles son las de cantidad de pasajeros nacionales e internacionales.

ggplot(ejercicio3, aes(x=Pasajeros.nacionales, y=Pasajeros.internacionales)) + geom_point(color="blue", size=3, alpha =0.7) + labs(title =" Diagrama de dispersión de pasajeros nacionales e internacionales", x="Pasajeros nacionales", y="Pasajeros internacionales")

El gráfico de dispersión no presenta un patrón con sentido, ni lineal ni no lineal entre la cantidad de pasajeros nacionales e internacionales que se registraron durante el 2015.