En esta práctica se realizará una gráfica que nos muestre que estados del país de México llegan a ser más transitados de acuerdo a las aerolíneas que realizan los vuelos de esta forma identificaremos los estados con mayor concurrencia de turistas que llegan a dichas ciudades.
library(igraph)
## Warning: package 'igraph' was built under R version 4.1.3
##
## Attaching package: 'igraph'
## The following objects are masked from 'package:stats':
##
## decompose, spectrum
## The following object is masked from 'package:base':
##
## union
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.1.3
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:igraph':
##
## as_data_frame, groups, union
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
datos <- read.csv(file = "c:/R/AEROLINEA.csv",header = TRUE, sep = ",")
Realizar una agrupación entre el total de repeticiones de las ciudades más visitadas de acuerdo al Origen y su Destino.
Continuar con una suma entre todas las ciudades eliminando de esta forma los valores repetidos dejando solamente valores únicos permitiendo una fácil emulación en una gráfica.
Finalizar con la ordenación de los valores obtenidos de forma descendente.
valor1 = datos %>% group_by(ï..ORIGEN) %>% summarise(n=n()) %>% arrange(-n)
valor1
## # A tibble: 55 x 2
## ï..ORIGEN n
## <chr> <int>
## 1 MEXICO 49
## 2 TIJUANA 35
## 3 GUADALAJARA 31
## 4 MONTERREY 29
## 5 CANCUN 22
## 6 HERMOSILLO 14
## 7 CHIHUAHUA 13
## 8 CIUDAD JUAREZ 13
## 9 MAZATLAN 11
## 10 QUERETARO 11
## # ... with 45 more rows
valor2 = datos %>% group_by(DESTINO) %>% summarise(n=n()) %>% arrange(-n)
valor2
## # A tibble: 55 x 2
## DESTINO n
## <chr> <int>
## 1 MEXICO 49
## 2 TIJUANA 35
## 3 GUADALAJARA 31
## 4 MONTERREY 29
## 5 CANCUN 22
## 6 CHIHUAHUA 13
## 7 CIUDAD JUAREZ 13
## 8 HERMOSILLO 13
## 9 MAZATLAN 11
## 10 SAN LUIS POTOSI 11
## # ... with 45 more rows
Realizar la suma de las dos tablas para la creación de una sola, esto facilitara la comparación entre ambas al crear una gráfica.
Para terminar con datos y las tablas realizaremos un filtro para obtener los primeros diez valores de la tabla, al estar los datos ordenados de mayor a menor este filtro obtendrá los valores con mayor cantidad registrados.
datos1 = datos %>% summarise(valor1, valor2) %>% arrange(-n)
datos2 = datos1[1:10,]
datos2
## ï..ORIGEN n DESTINO
## 1 MEXICO 49 MEXICO
## 2 TIJUANA 35 TIJUANA
## 3 GUADALAJARA 31 GUADALAJARA
## 4 MONTERREY 29 MONTERREY
## 5 CANCUN 22 CANCUN
## 6 HERMOSILLO 13 CHIHUAHUA
## 7 CHIHUAHUA 13 CIUDAD JUAREZ
## 8 CIUDAD JUAREZ 13 HERMOSILLO
## 9 MAZATLAN 11 MAZATLAN
## 10 QUERETARO 11 SAN LUIS POTOSI
Para finalizar con la práctica realizaremos una gráfica en forma de circulo haciendo énfasis en los países con mayor visitante ya sean extranjeros o del mismo país de México relacionando los países que tienen una multitud de igual tamaño que otros.
g=graph.data.frame(datos2,directed = 1)
plot.igraph(g,
vertex.size=datos1$n,
edge.arrow.size = 0.6,
edge.arrow.width = 0.9,
vertex.label.cex = 0.8,
edge.color = "purple",
vertex.label.color ="#2400C8",
edge.curved = F,
main="Destinos mas populares",
layout = layout.circle(g),
vertex.color = "#7CFB2D",)
## Warning in layout[, 1] + label.dist * cos(-label.degree) * (vertex.size + :
## longitud de objeto mayor no es múltiplo de la longitud de uno menor
## Warning in layout[, 2] + label.dist * sin(-label.degree) * (vertex.size + :
## longitud de objeto mayor no es múltiplo de la longitud de uno menor