Este documento presenta cálculos estadísticos de unos Datos de Vuelos de Aerolíneas Asiáticas, dichos cálculos estadísticos se calculan utilizando Funciones implementadas por el Desarrollador.
Carga de Datos desde un archivo csv que contine información de Vuelos de Aerolíneas Asiáticas.
@param v Vector numérico de
valores
@return Media
f_media <- function(v) {
s <- sum(v)
l <- length(v)
media <- s/l
return (media)
}
@param v Vector numérico de
valores
@param w Vector numérico de valores
correspondientes a los pesos
@return Media Ponderada
f_media_pond <- function(v,w) {
prod <- sum(v*w)
sw <- sum(w)
media_pond <- prod/sw
return (media_pond)
}
@param v Vector numérico de
valores
@return Varianza
f_varianza <- function(v) {
media <- f_media(v)
prod <- sum((v - media)^2)
l <- length(v) - 1
varianza <- prod/l
return (varianza)
}
@param v Vector numérico de
valores
@return Desviación Estándar
f_desviacion <- function(v){
de <- (f_varianza(v))^(1/2)
return(de)
}
library(dplyr)
## Warning: package 'dplyr' was built under R version 4.4.3
##
## Adjuntando el paquete: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
vuelos <- read.csv("C:/Users/CEC/Documents/RStudio/archive/airlines_flights_data.csv")
summary(vuelos$price)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## 1105 4783 7425 20890 42521 123071
f_media <- function(v) {
s <- sum(v)
l <- length(v)
media <- s/l
return (media)
}
f_media_pond <- function(v,w) {
prod <- sum(v*w)
sw <- sum(w)
media_pond <- prod/sw
return (media_pond)
}
f_varianza <- function(v) {
media <- f_media(v)
prod <- sum((v - media)^2)
l <- length(v) - 1
varianza <- prod/l
return (varianza)
}
f_desviacion <- function(v){
de <- (f_varianza(v))^(1/2)
return(de)
}
limpio_precios <- na.omit(vuelos$price)
media <- f_media(limpio_precios)
print(paste("Media = ", media))
## [1] "Media = 20889.6605231332"
limpio_duracion <- na.omit(vuelos$duration)
varianza <- f_varianza(limpio_duracion)
print(paste("Varianza = ", varianza))
## [1] "Varianza = 51.7248242731116"
desv_estandar <- f_desviacion(limpio_duracion)
print(paste("Desviación Estándar = ", desv_estandar))
## [1] "Desviación Estándar = 7.19199723811902"
vuelos_ciudad <- vuelos %>%
group_by(source_city) %>%
summarise(vuelos_x_ciudad = n())
print(vuelos_ciudad)
## # A tibble: 6 × 2
## source_city vuelos_x_ciudad
## <chr> <int>
## 1 Bangalore 52061
## 2 Chennai 38700
## 3 Delhi 61343
## 4 Hyderabad 40806
## 5 Kolkata 46347
## 6 Mumbai 60896
vuelos_aereolinea <- vuelos %>%
group_by(airline) %>%
summarise(vuelos_aereolinea = n())
print(vuelos_aereolinea)
## # A tibble: 6 × 2
## airline vuelos_aereolinea
## <chr> <int>
## 1 AirAsia 16098
## 2 Air_India 80892
## 3 GO_FIRST 23173
## 4 Indigo 43120
## 5 SpiceJet 9011
## 6 Vistara 127859
Gráfico del Tiempo de Duración de los Vuelos
Note that the echo = FALSE parameter was added to the
code chunk to prevent printing of the R code that generated the
plot.