Regresión Linela para Coatos de Mantenimiento vs Antiguedad

A continuación se presentan los datos de costos de mantenimiento en función de la antiguedad de los aviones, con el objetivo de valorar la relación entre estas variables y crear un modelo que permita estimar los costos futuros de el mantenimiento de los aviones.

library(readxl)
datos=read_excel("C:/Users/Asus/Desktop/analitica financiera/analitica II/costo.xlsx")
datos
antiguedad costo
1 460
1 720
2 2000
2 1500
3 1800
5 15000
5 12000
10 25000
10 40000

##Exploración de los datos

Iniciamos la exploración de la variable costos de mantenimiento por medio de indicadores y graficos:

promedio=mean(datos$costo)
desviacion=sd(datos$costo)
data.frame(promedio,desviacion)
promedio desviacion
10942.22 13814.08
require(ggplot2)
## Loading required package: ggplot2
ggplot(datos,aes(x=costo))+geom_boxplot(fill="red")+theme_bw()

Podemos interpretar que existe un promedio de costos de mantenimiento de aproximadamente 11 mil dolares con una desviación de aprox. 14 mil dolares, la cual es muy amplia y en parte como se observa en la caja de costos que llegan hasta los 40 mil dolares. Se espera que esta variación sea expliacada por la antiguedad del avión indicando que los mas antiguos tienen mayor costo de reparación en promedio.

##Graficamos la relación Costo vs antiguedad 

ggplot(datos,aes(x=antiguedad,y=costo))+geom_point()+theme_bw()+geom_smooth(method = "lm")
## `geom_smooth()` using formula 'y ~ x'

cor(datos$antiguedad,datos$costo)
## [1] 0.9516592

Se observa una relación lineal positiva fuerte entre la antiguedad y los costos, indicando efectivamente que a mayor antiguedad del avion los costos de mantenimiento se incrementan. Esta relación es bastante fuerte ya que el coeficiente de correlación de pearson es de o,95.

Ajustes de Modelo de Regresión Lineal

A continuación ajustamos un modelo para la variable costo en función de la antiguedad: \(costos = \beta_0 + \beta_1 * antiguedad\).

##Ajuste de Modelo 
mod=lm(costo ~ antiguedad,data=datos)
mod
## 
## Call:
## lm(formula = costo ~ antiguedad, data = datos)
## 
## Coefficients:
## (Intercept)   antiguedad  
##       -5171         3718

Call: lm(costo ~ antiguedad,data = datos)

coefficients(): (intersect()) antiguedad -5171 3718

Se observa que el modelo estimado nos arroja un valor de \(\beta_0= -5171\) el cual no tiene interpretación por que requiere hablar de antiguedad cero la cual no se observo. Mientras que el \(\beta_1=3718\) nos indica que por cada año adicional de antiguedad del avión los costos de mantenimiento se incrementan en promedio en 3718 miles de dolares.

summary(mod)
## 
## Call:
## lm(formula = costo ~ antiguedad, data = datos)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -7012.8 -1421.1  -266.1  1912.2  7987.2 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -5170.6     2479.9  -2.085   0.0755 .  
## antiguedad    3718.3      453.6   8.197  7.8e-05 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 4536 on 7 degrees of freedom
## Multiple R-squared:  0.9057, Adjusted R-squared:  0.8922 
## F-statistic:  67.2 on 1 and 7 DF,  p-value: 7.799e-05

Se observa que el coeficiente de antiguedad es significativo indicando que la antiguedad es una variable para explicar los costos de mantenimiento. Adicionalmente el R2 nos indica que el modelo explica el 90% de la variabilidad de los costos.

Predecir Costos de Mantenimiento con el Modelo

## Para el siguiente año se requiere predecir cual seria el costo de mantenimiento promedio de un grupo de 10 aviones cuya antiguedad , el proximo año seria de 6. Realice un par de escenarios optimistas y pesimistas para la predicción con un intervalo de confianza al 90%. 

pred=predict(mod,list(antiguedad=6),interval = "confidence",level = 0.9)
pred*10
##        fit      lwr    upr
## 1 171394.4 139366.9 203422

Los resultados nos muestran que el valor medio estimado de los costos de mantenimiento el proximo año se encuentran en 171394 miles de dolares y en el escenario pesimista nos daria 203422 y el optimista 139366 miles de dolares.