Regresion lineal costos de mantenimiento vs antiguedad

A continuacion se presenta el costo de mantenimiento de la flota de aviones en funcion de su antiguedad, con el objetivo de valorar la relacion entre estas dos variable y crear un modelo que permita estimar los costos futuros

library(readxl)
Datos = Taller_costos_Mantenimiento <- read_excel("Taller costos Mantenimiento.xlsx")
Datos
Antigüedad Costo
1 460
1 720
2 2000
2 1500
3 1800
5 15000
5 12000
10 25000
10 40000

Exploracion de datos

Iniciamos la exploracion de la variable de costos de manteniminto por medio de indicadores y graficos

promedio=mean((Datos$Costo))
Desviacion=sd(Datos$Costo)
data.frame(promedio,Desviacion)
promedio Desviacion
10942.22 13814.08
require(ggplot2)
ggplot(Datos,aes(x=Costo))+geom_boxplot(fill="red")+theme_bw()

Podemos observar que existe un promedio de costos de mantenimiento de aproximandamente 11.000 con una desviacion de 14.000 dolares la cual es muy amplia, adicionalmente como se observa en la caja tenemos costos que llegan hasta los 40.000 dolares, se espera que esta variacion sea explicada por la antiguedad del avion, indicando que entre mas antigio se aumentan los costos de reparación

Grafica relacion costo vs antiguedad

ggplot(Datos,aes(x=Antigüedad,y=Costo))+geom_point()+theme_bw()+geom_smooth(method = "lm")

cor(Datos$Antigüedad,Datos$Costo)
## [1] 0.9516592

Se oberva una relacion lineal positiva fuerte entre la antiguedad y los costos de mantenimiento, indicando que efectivamente a mayor antiguedad mayor gasto de mantenimiento. La variable es bastante fuerte ya que el coeficiente de correlacion fue de 0.95

Ajuste del modelo de regresión lineal

Mod=lm(Costo~Antigüedad,data=Datos)
Mod
## 
## Call:
## lm(formula = Costo ~ Antigüedad, data = Datos)
## 
## Coefficients:
## (Intercept)   Antigüedad  
##       -5171         3718

Se observa que el modelo nos arroja un valor de \(Beta_0=-5171\) el cual no tiene interpretacion por que requiere hablar de antiguedad 0 la cual no se observo Miestras que el \(Beta_1=-3718\) nos indica que por cada año adicional los costos de mantenimiento se aumentan en 3718 miles de dolares

summary(Mod)
## 
## Call:
## lm(formula = Costo ~ Antigüedad, data = Datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7012.8 -1421.1  -266.1  1912.2  7987.2 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -5170.6     2479.9  -2.085   0.0755 .  
## Antigüedad    3718.3      453.6   8.197  7.8e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4536 on 7 degrees of freedom
## Multiple R-squared:  0.9057, Adjusted R-squared:  0.8922 
## F-statistic:  67.2 on 1 and 7 DF,  p-value: 7.799e-05

Se observa que el coeficiente de antiguedad es significativo indicando que la antiguedad es una variable importante para explicar los costos de mantenimiento. Adicionalmente el R2 nos que el modelo explica el 90% de los costos de manteniiento

Prediccion con el Modelo

Para el siguiente año se quiere predecir el costo de mmto para una antigueda de 6 años en un grupo promedio de 10 aviones . se realiza un excenario optimista y pesimista con un intervalo de confianza del 90%

Pred=predict(Mod,list(Antigüedad=6),interval= "confidence",level = 0.9)
Pred*10
##        fit      lwr    upr
## 1 171394.4 139366.9 203422

Se observa que el costos para el mantenimiento de los 10 aviones seria de 171394 Miles de dolares, con un excenario obtimista de 139366 y un excenario pesimista de 203422