El siguiente informe contiene los resultados del modelo de regresion para los datos de arboles de la compania XYZ
library(readxl)
data_biomasa <- read_excel("D:/PUJ/2do Semestre/4. Analitica financiera/data biomasa.xlsx")
library(ggplot2)
ggplot(data_biomasa,aes(y=bio_total,x=diametro))+geom_point()+theme_bw()+geom_smooth(method = "lm")
cor(data_biomasa$bio_total,data_biomasa$diametro)
## [1] 0.908123
Se observa en la figura una relacion lineal positiva entre la biomasa (peso) del arbol y el diametro. Lo cual indica que esta variable podria ser util para ajustar un modelo de regresion. El coeficiente de correlacion de pearson nos indica una relacion fuerte con un valor de 0.9 muy cercano a uno.
mod=lm(bio_total~diametro,data = data_biomasa)
summary(mod)
##
## Call:
## lm(formula = bio_total ~ diametro, data = data_biomasa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.3775 -2.6594 0.0237 1.8758 11.9876
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -9.0203 1.4129 -6.384 7.86e-09 ***
## diametro 5.1026 0.2508 20.346 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 3.435 on 88 degrees of freedom
## Multiple R-squared: 0.8247, Adjusted R-squared: 0.8227
## F-statistic: 414 on 1 and 88 DF, p-value: < 2.2e-16
Se observa que el coeficiente Beta 1 del diametro es significativo y el valor estimado es de 5.1, lo cual nos indica que por cada metro adicional de diametro del arbol el peso se incrementa en 5.1 toneladas
La ecuacion del modelo estimado es: Bio_total=-9.0203+(5.1026*Diametro)
El modelo presenta un ajuste de acuerdo al indicador (R=square) de 82.27%. Es decir, el modelo logra explicar el 82.27% de la variabilidad de la biomasa.
par(mfrow=c(2,2))
plot(mod)
La figura de los residuales vs los ajustados (modelo) muestra un comportamiento no lineal, es decir que la relacion entre biomasa y diametro no necesariamente es de tipo lineal y se pueden explorar otro tipo para mejorar el ajuste.
ggplot(data_biomasa,aes(y=bio_total,x=diametro))+geom_point()+theme_bw()+geom_smooth()+ggtitle("Relacion original")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
ggplot(data_biomasa,aes(y=log(bio_total),x=diametro))+geom_point()+theme_bw()+geom_smooth()+ggtitle("relacion transformando en logaritmo")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'
Se observa en las figuras como la elación es mucho más lineal con la transformación en logaritmo de la biomasa.
mod_log=lm(log(bio_total)~diametro,data=data_biomasa)
summary(mod_log)
##
## Call:
## lm(formula = log(bio_total) ~ diametro, data = data_biomasa)
##
## Residuals:
## Min 1Q Median 3Q Max
## -0.27395 -0.10180 -0.00328 0.10073 0.33742
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 1.32798 0.05977 22.22 <2e-16 ***
## diametro 0.27818 0.01061 26.22 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 0.1453 on 88 degrees of freedom
## Multiple R-squared: 0.8865, Adjusted R-squared: 0.8852
## F-statistic: 687.6 on 1 and 88 DF, p-value: < 2.2e-16
Se observa que el ajuse del modelo es mayor con la transformación logaritmica indicando que este nuevo modelo explica el 88.52% de la variabilidad de la biomasa.
par(mfrow=c(2,2))
plot(mod_log)
Se observa que el supuesto de linealidad se cumple al igual que el de normalidad, lo que nos indica que la transformación fue efectiva.
La ecuacion de este modelo es: Ln(biomasa)=1.32798+(0.27818*Diametro)
Supongamos que se tiene un lote con un total de 1000 arboles,se mide una muestra aleatoria de 100 de ellos y el diametro promedio fue de 7 metros, con una desviacion estandar de 1 metro, Si la utilidad esperada de 1 tonelada de madera es en promedio de 10 millones de pesos cuál sería una estimación de esa utilidad para este lote una vez se cosecha. Use los resultados del modelo logaritmico.
log_biomasa=1.32798+(0.27818*7)
biomasa_estimada=exp(log_biomasa)
biomasa_estimada
## [1] 26.44957
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 264.4957
utilidad_estimada*1000
## [1] 264495.7
#Escenarios pesimista y optimista
log_biomasa=1.32798+(0.27818*6)
biomasa_estimada=exp(log_biomasa)
biomasa_estimada
## [1] 20.02657
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 200.2657
utilidad_estimada*1000
## [1] 200265.7
Se estima una utilidad promedio del lote de 264495 millones de pesos Se estima una utilidad pesimista del lote de 200265 millones de pesos (dimetro =6) Se estima una utilidad optimista del lote de 349325 millones de pesos (diametro=8)
Se estima una utilidad promedio del lote de 264495 +- ()