1. Introducción

Este documento presenta cálculos estadísticos de unos Datos de Vuelos de Aerolíneas Asiáticas, dichos cálculos estadísticos se calculan utilizando Funciones implementadas por el Desarrollador.

2. Datos

Carga de Datos desde un archivo csv que contine información de Vuelos de Aerolíneas Asiáticas.

3. Funciones implementadas por el Desarrollador

Función que calcula la Media de un vector

@param v Vector numérico de valores
@return Media

f_media <- function(v) {
s <- sum(v)
l <- length(v)
media <- s/l
return (media)
}

Función que calcula la Media Ponderada de un vector

@param v Vector numérico de valores
@param w Vector numérico de valores correspondientes a los pesos
@return Media Ponderada

f_media_pond <- function(v,w) {
prod <- sum(v*w)
sw <- sum(w)
media_pond <- prod/sw
return (media_pond)
}

Función que calcula la Varianza de un vector

@param v Vector numérico de valores
@return Varianza

f_varianza <- function(v) {
media <- f_media(v)
prod <- sum((v - media)^2)
l <- length(v) - 1
varianza <- prod/l
return (varianza)
}

Función que calcula la Desviación Estándar de un vector

@param v Vector numérico de valores
@return Desviación Estándar

f_desviacion <- function(v){
de <- (f_varianza(v))^(1/2)
return(de)
}

4. Generación de Información de los Vuelos

library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
## 
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
vuelos <- read.csv("C:/Users/CEC/Documents/RStudio/archive/airlines_flights_data.csv")
summary(vuelos$price)
##    Min. 1st Qu.  Median    Mean 3rd Qu.    Max. 
##    1105    4783    7425   20890   42521  123071
f_media <- function(v) {  
  s <- sum(v)  
  l <- length(v)  
  media <- s/l  
  return (media)  
}
f_media_pond <- function(v,w) {  
  prod <- sum(v*w)  
  sw <- sum(w)  
  media_pond <- prod/sw  
  return (media_pond)  
}
f_varianza <- function(v) {  
  media <- f_media(v)  
  prod <- sum((v - media)^2)  
  l <- length(v) - 1  
  varianza <- prod/l  
  return (varianza)  
}
f_desviacion <- function(v){  
  de <- (f_varianza(v))^(1/2)  
  return(de)  
}

limpio_precios <- na.omit(vuelos$price)
media <- f_media(limpio_precios)
print(paste("Media = ", media))
## [1] "Media =  20889.6605231332"
limpio_duracion <- na.omit(vuelos$duration)
varianza <- f_varianza(limpio_duracion)
print(paste("Varianza = ", varianza))
## [1] "Varianza =  51.7248242731116"
desv_estandar <- f_desviacion(limpio_duracion)
print(paste("Desviación Estándar = ", desv_estandar))
## [1] "Desviación Estándar =  7.19199723811902"
vuelos_ciudad <- vuelos %>%
  group_by(source_city) %>%
  summarise(vuelos_x_ciudad = n())

print(vuelos_ciudad)
## # A tibble: 6 × 2
##   source_city vuelos_x_ciudad
##   <chr>                 <int>
## 1 Bangalore             52061
## 2 Chennai               38700
## 3 Delhi                 61343
## 4 Hyderabad             40806
## 5 Kolkata               46347
## 6 Mumbai                60896
vuelos_aereolinea <- vuelos %>%
  group_by(airline) %>%
  summarise(vuelos_aereolinea = n())

print(vuelos_aereolinea)
## # A tibble: 6 × 2
##   airline   vuelos_aereolinea
##   <chr>                 <int>
## 1 AirAsia               16098
## 2 Air_India             80892
## 3 GO_FIRST              23173
## 4 Indigo                43120
## 5 SpiceJet               9011
## 6 Vistara              127859

Gráfico

Gráfico del Tiempo de Duración de los Vuelos

Note that the echo = FALSE parameter was added to the code chunk to prevent printing of the R code that generated the plot.