A continuación se presentan los datos de costos de mantenimiento en función de la antiguedad de los aviones, con el objetivo de valorar la relación entre estas variables y crear un modelo que permita estimar los costos futuros de mantenimiento de los aviones.
library(readxl)
datos = read_excel("C:/Users/pacho/OneDrive/Escritorio/costos_gastos.xlsx")
datos
| antiguedad | costo |
|---|---|
| 1 | 460 |
| 1 | 720 |
| 2 | 2000 |
| 2 | 1500 |
| 3 | 1800 |
| 5 | 15000 |
| 5 | 12000 |
| 10 | 25000 |
| 10 | 40000 |
head(datos,4)
| antiguedad | costo |
|---|---|
| 1 | 460 |
| 1 | 720 |
| 2 | 2000 |
| 2 | 1500 |
Iniciamos la exploración de la variable costos de mantenimiento por medio de indicadores y gráficos:
promedio=mean(datos$costo)
desviación=sd(datos$costo)
data.frame(promedio,desviación)
| promedio | desviación |
|---|---|
| 10942.22 | 13814.08 |
require(ggplot2)
ggplot(datos,aes(x=costo))+geom_boxplot(fill="red")+theme_bw()
Podemos observar que existe un promedio de costos de mantenimiento de aprox. 11 mil dorales con un desviación de aprox. 14 mil dolares la cual es muy amplia y en parte como se observa en la caja tenemos costos que llegan hasta los 40 mil dolares. Se espera que esta variación sea explicada por la antiguedad del avión, indicando que los mas antiguos tienen mayor costo de reparación en promedio.
## Graficamos la relación costos vs. antiguedad
ggplot(datos,aes(x=antiguedad,y=costo))+geom_point()+theme_bw()+
geom_smooth(method = "lm")
cor(datos$antiguedad,datos$costo)
## [1] 0.9516592
Se observa una relación lineal positiva fuerte entre la antiguedad y los costos, indicando efectivamente que a mayor antiguedad del avión los costos de mantenimiento se incrementan. Esta relación es bastante fuerte ya que el coeficiente de correlación de pearson es 0,95.
A continuación ajustamos un modelo para la variable costo en función de la antiguedad: \(costos = \beta_0 + \beta_1 * antiguedad\).
##Ajuste del Modelo
mod=lm(costo~antiguedad,data = datos)
mod
##
## Call:
## lm(formula = costo ~ antiguedad, data = datos)
##
## Coefficients:
## (Intercept) antiguedad
## -5171 3718
Se observa que el modelo estimado nos arroja un valor de \(\beta_0=-5171\) el cual no tiene interpretación por que se requiere hablar de antiguedad cero la cual no se observó. Mientras que el \(\beta_1= 3718\) nos indica que por cada año adicional de antiguedad del avión los costos de mantenimiento se incrementan en promedio en 3718 miles de dolares.
summary(mod)
##
## Call:
## lm(formula = costo ~ antiguedad, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7012.8 -1421.1 -266.1 1912.2 7987.2
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5170.6 2479.9 -2.085 0.0755 .
## antiguedad 3718.3 453.6 8.197 7.8e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4536 on 7 degrees of freedom
## Multiple R-squared: 0.9057, Adjusted R-squared: 0.8922
## F-statistic: 67.2 on 1 and 7 DF, p-value: 7.799e-05
Se observa que el coeficiente de antiguedad es significativo indicando que la antiguedad es una variable importante para explicar los costos de mantenimiento. Adicionalmente el R2 nos indica que el modelo explica el 90% de la variabilidad de los costos.
##Para el siguiente año se require predecir cual sería el costo de mantenimiento promedio de un grupo de 10 aviones cuya antiguedad el próximo año sería de 6. Realice un par de escenarios optimistas y pesismistas para la predicción con un intervalo de confianza del 90%.
pred=predict(mod,list(antiguedad=6),interval ="confidence",level = 0.90)
pred*10
## fit lwr upr
## 1 171394.4 139366.9 203422
Los resultados nos muestran que el valor medio estimado de los costos de mantenimiento el próximo año se encuentran en 171394 miles de dolares y el escenario pesimista nos daría 203422 y el optimista 139366 miles de dolares.