Modelo para Datos arboles

El siguiente informe contiene los resultados del modelo de regresion para los datos de arboles de la compania XYZ

library(readxl)
data_biomasa <- read_excel("D:/PUJ/2do Semestre/4. Analitica financiera/data biomasa.xlsx")

library(ggplot2)
ggplot(data_biomasa,aes(y=bio_total,x=diametro))+geom_point()+theme_bw()+geom_smooth(method = "lm")

cor(data_biomasa$bio_total,data_biomasa$diametro)
## [1] 0.908123

Se observa en la figura una relacion lineal positiva entre la biomasa (peso) del arbol y el diametro. Lo cual indica que esta variable podria ser util para ajustar un modelo de regresion. El coeficiente de correlacion de pearson nos indica una relacion fuerte con un valor de 0.9 muy cercano a uno.

mod=lm(bio_total~diametro,data = data_biomasa)
summary(mod)
## 
## Call:
## lm(formula = bio_total ~ diametro, data = data_biomasa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.3775 -2.6594  0.0237  1.8758 11.9876 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -9.0203     1.4129  -6.384 7.86e-09 ***
## diametro      5.1026     0.2508  20.346  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.435 on 88 degrees of freedom
## Multiple R-squared:  0.8247, Adjusted R-squared:  0.8227 
## F-statistic:   414 on 1 and 88 DF,  p-value: < 2.2e-16

Se observa que el coeficiente Beta 1 del diametro es significativo y el valor estimado es de 5.1, lo cual nos indica que por cada metro adicional de diametro del arbol el peso se incrementa en 5.1 toneladas

La ecuacion del modelo estimado es: Bio_total=-9.0203+(5.1026*Diametro)

El modelo presenta un ajuste de acuerdo al indicador (R=square) de 82.27%. Es decir, el modelo logra explicar el 82.27% de la variabilidad de la biomasa.

par(mfrow=c(2,2))
plot(mod)

La figura de los residuales vs los ajustados (modelo) muestra un comportamiento no lineal, es decir que la relacion entre biomasa y diametro no necesariamente es de tipo lineal y se pueden explorar otro tipo para mejorar el ajuste.

ggplot(data_biomasa,aes(y=bio_total,x=diametro))+geom_point()+theme_bw()+geom_smooth()+ggtitle("Relacion original")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

ggplot(data_biomasa,aes(y=log(bio_total),x=diametro))+geom_point()+theme_bw()+geom_smooth()+ggtitle("relacion transformando en logaritmo")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Se observa en las figuras como la elación es mucho más lineal con la transformación en logaritmo de la biomasa.

mod_log=lm(log(bio_total)~diametro,data=data_biomasa)
summary(mod_log)
## 
## Call:
## lm(formula = log(bio_total) ~ diametro, data = data_biomasa)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.27395 -0.10180 -0.00328  0.10073  0.33742 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.32798    0.05977   22.22   <2e-16 ***
## diametro     0.27818    0.01061   26.22   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1453 on 88 degrees of freedom
## Multiple R-squared:  0.8865, Adjusted R-squared:  0.8852 
## F-statistic: 687.6 on 1 and 88 DF,  p-value: < 2.2e-16

Se observa que el ajuse del modelo es mayor con la transformación logaritmica indicando que este nuevo modelo explica el 88.52% de la variabilidad de la biomasa.

par(mfrow=c(2,2))
plot(mod_log)

Se observa que el supuesto de linealidad se cumple al igual que el de normalidad, lo que nos indica que la transformación fue efectiva.

La ecuacion de este modelo es: Ln(biomasa)=1.32798+(0.27818*Diametro)

Uso del modelo para predecir la produccion y utilidad esperada

Supongamos que se tiene un lote con un total de 1000 arboles,se mide una muestra aleatoria de 100 de ellos y el diametro promedio fue de 7 metros, con una desviacion estandar de 1 metro, Si la utilidad esperada de 1 tonelada de madera es en promedio de 10 millones de pesos cuál sería una estimación de esa utilidad para este lote una vez se cosecha. Use los resultados del modelo logaritmico.

log_biomasa=1.32798+(0.27818*7)
biomasa_estimada=exp(log_biomasa)
biomasa_estimada
## [1] 26.44957
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 264.4957
utilidad_estimada*1000
## [1] 264495.7
#Escenarios pesimista y optimista
log_biomasa=1.32798+(0.27818*6)
biomasa_estimada=exp(log_biomasa)
biomasa_estimada
## [1] 20.02657
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 200.2657
utilidad_estimada*1000
## [1] 200265.7

Se estima una utilidad promedio del lote de 264495 millones de pesos Se estima una utilidad pesimista del lote de 200265 millones de pesos (dimetro =6) Se estima una utilidad optimista del lote de 349325 millones de pesos (diametro=8)

Se estima una utilidad promedio del lote de 264495 +- ()