A continuación se presentan los datos de costos de mantenimiento en función de la antiguedad de los aviones, con el objetivo de valorar la relación entre estas variables y crear un modelo que permita estimar los costos futuros de el mantenimiento de los aviones.
library(readxl)
datos=read_excel("C:/Users/Asus/Desktop/analitica financiera/analitica II/costo.xlsx")
datos
antiguedad | costo |
---|---|
1 | 460 |
1 | 720 |
2 | 2000 |
2 | 1500 |
3 | 1800 |
5 | 15000 |
5 | 12000 |
10 | 25000 |
10 | 40000 |
##Exploración de los datos
Iniciamos la exploración de la variable costos de mantenimiento por medio de indicadores y graficos:
promedio=mean(datos$costo)
desviacion=sd(datos$costo)
data.frame(promedio,desviacion)
promedio | desviacion |
---|---|
10942.22 | 13814.08 |
require(ggplot2)
## Loading required package: ggplot2
ggplot(datos,aes(x=costo))+geom_boxplot(fill="red")+theme_bw()
Podemos interpretar que existe un promedio de costos de mantenimiento de aproximadamente 11 mil dolares con una desviación de aprox. 14 mil dolares, la cual es muy amplia y en parte como se observa en la caja de costos que llegan hasta los 40 mil dolares. Se espera que esta variación sea expliacada por la antiguedad del avión indicando que los mas antiguos tienen mayor costo de reparación en promedio.
##Graficamos la relación Costo vs antiguedad
ggplot(datos,aes(x=antiguedad,y=costo))+geom_point()+theme_bw()+geom_smooth(method = "lm")
## `geom_smooth()` using formula 'y ~ x'
cor(datos$antiguedad,datos$costo)
## [1] 0.9516592
Se observa una relación lineal positiva fuerte entre la antiguedad y los costos, indicando efectivamente que a mayor antiguedad del avion los costos de mantenimiento se incrementan. Esta relación es bastante fuerte ya que el coeficiente de correlación de pearson es de o,95.
A continuación ajustamos un modelo para la variable costo en función de la antiguedad: \(costos = \beta_0 + \beta_1 * antiguedad\).
##Ajuste de Modelo
mod=lm(costo ~ antiguedad,data=datos)
mod
##
## Call:
## lm(formula = costo ~ antiguedad, data = datos)
##
## Coefficients:
## (Intercept) antiguedad
## -5171 3718
Call: lm(costo ~ antiguedad,data = datos)
coefficients(): (intersect()) antiguedad -5171 3718
Se observa que el modelo estimado nos arroja un valor de \(\beta_0= -5171\) el cual no tiene interpretación por que requiere hablar de antiguedad cero la cual no se observo. Mientras que el \(\beta_1=3718\) nos indica que por cada año adicional de antiguedad del avión los costos de mantenimiento se incrementan en promedio en 3718 miles de dolares.
summary(mod)
##
## Call:
## lm(formula = costo ~ antiguedad, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -7012.8 -1421.1 -266.1 1912.2 7987.2
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -5170.6 2479.9 -2.085 0.0755 .
## antiguedad 3718.3 453.6 8.197 7.8e-05 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 4536 on 7 degrees of freedom
## Multiple R-squared: 0.9057, Adjusted R-squared: 0.8922
## F-statistic: 67.2 on 1 and 7 DF, p-value: 7.799e-05
Se observa que el coeficiente de antiguedad es significativo indicando que la antiguedad es una variable para explicar los costos de mantenimiento. Adicionalmente el R2 nos indica que el modelo explica el 90% de la variabilidad de los costos.
## Para el siguiente año se requiere predecir cual seria el costo de mantenimiento promedio de un grupo de 10 aviones cuya antiguedad , el proximo año seria de 6. Realice un par de escenarios optimistas y pesimistas para la predicción con un intervalo de confianza al 90%.
pred=predict(mod,list(antiguedad=6),interval = "confidence",level = 0.9)
pred*10
## fit lwr upr
## 1 171394.4 139366.9 203422
Los resultados nos muestran que el valor medio estimado de los costos de mantenimiento el proximo año se encuentran en 171394 miles de dolares y en el escenario pesimista nos daria 203422 y el optimista 139366 miles de dolares.