Generar un DataSet desde cero es algo que lleva demasiado tiempo, pero con la tecnologia con la que contamos ahora podemos encontrar de forma mas sencilla aquellos que necesitemos. En esta practica utilizaremos un DataSet el cual cuenta con los vuelos más frecuentes en lo que va del año. Para esta practica realizaremos un frefico con los 10 vuelos mas frecuentes. Como primero necesitaremos tener las siguientes librerias:
library(igraph)
## Warning: package 'igraph' was built under R version 4.1.3
##
## Attaching package: 'igraph'
## The following objects are masked from 'package:stats':
##
## decompose, spectrum
## The following object is masked from 'package:base':
##
## union
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:igraph':
##
## as_data_frame, groups, union
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
datos <- read.csv(file = "c:/R/AEROLINEA.csv",header = TRUE, sep = ",")
Agregamos la variable datos a la cual asignaremos lo que leamos del archivo donde seencuentra nuestro DataSet. Asignaremos a valor1 el origen de donde parten los vuelos y los agruparemos. Lo mismo realizaremos para valor2 pero aqui guardaremos los destinos a los cuales llegan los vuelos.
valor1 = datos %>% group_by(ï..ORIGEN) %>% summarise(n=n()) %>% arrange(-n)
valor1
## # A tibble: 55 x 2
## ï..ORIGEN n
## <chr> <int>
## 1 MEXICO 49
## 2 TIJUANA 35
## 3 GUADALAJARA 31
## 4 MONTERREY 29
## 5 CANCUN 22
## 6 HERMOSILLO 14
## 7 CHIHUAHUA 13
## 8 CIUDAD JUAREZ 13
## 9 MAZATLAN 11
## 10 QUERETARO 11
## # ... with 45 more rows
valor2 = datos %>% group_by(DESTINO) %>% summarise(n=n()) %>% arrange(-n)
valor2
## # A tibble: 55 x 2
## DESTINO n
## <chr> <int>
## 1 MEXICO 49
## 2 TIJUANA 35
## 3 GUADALAJARA 31
## 4 MONTERREY 29
## 5 CANCUN 22
## 6 CHIHUAHUA 13
## 7 CIUDAD JUAREZ 13
## 8 HERMOSILLO 13
## 9 MAZATLAN 11
## 10 SAN LUIS POTOSI 11
## # ... with 45 more rows
Vamos a sacar los 10 vuelos que más se repiten para poder realizar las graficas. Asignaremos a las variables llamadas datos1 y datos2
datos1 = datos %>% summarise(valor1, valor2) %>% arrange(-n)
datos2 = datos1[1:10,]
Con las siguientes lineas crearemos un grafico en el cual se mostraran los 10 destinos más visitados y deppendiendo de esto el tamaño del nodo sera de mayor o menor tamaño.
## Warning in layout[, 1] + label.dist * cos(-label.degree) * (vertex.size + :
## longitud de objeto mayor no es múltiplo de la longitud de uno menor
## Warning in layout[, 2] + label.dist * sin(-label.degree) * (vertex.size + :
## longitud de objeto mayor no es múltiplo de la longitud de uno menor
Lo que podemos analizar de esta practica, es conocer los lugares mas visitados en lo que va del año, podemos invertir un poco más en la publicidad a estos estados, los lugares turiticos y mover la economia de nuestro país.