Modelo para Datos Arboles

El siguiente informe contiene los resultados del modelo de regresión para los datos de arboles de la compañia XYZ.

library(readxl)
data_biomasa <- read_excel("C:/Users/Isabella/Downloads/data biomasa.xlsx")


library(ggplot2)
ggplot(data_biomasa,aes(y=bio_total,x=diametro))+geom_point()+theme_bw()+geom_smooth(method="lm")

cor(data_biomasa$bio_total,data_biomasa$diametro)
## [1] 0.908123

se observa en la figura una relación lineal positiva entre la biomasa (peso) del arbol y el diametro. Lo cial indica que esta variable podría ser util para ajustar un modelo de regresión. El coeficiente de correlación de person nos indica una relación fuerte con valor de 0.9 muy cercano a 1.

mod=lm(bio_total~diametro,data = data_biomasa)
summary(mod)
## 
## Call:
## lm(formula = bio_total ~ diametro, data = data_biomasa)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -6.3775 -2.6594  0.0237  1.8758 11.9876 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  -9.0203     1.4129  -6.384 7.86e-09 ***
## diametro      5.1026     0.2508  20.346  < 2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 3.435 on 88 degrees of freedom
## Multiple R-squared:  0.8247, Adjusted R-squared:  0.8227 
## F-statistic:   414 on 1 and 88 DF,  p-value: < 2.2e-16

Se observa que el coeficiente Beta 1 del diametro es significativo y el valor estimado es de 5.1, lo cual nos indica que por cada metro adicional de diametro del arbol el peso se incrementa en 5,1 toneladas

La ecuación del modelo estimado es : Bio_total=-9.0203+(5.1026*Diametro)

El modelo presenta un ajuste de acuerdo al indicador (R-square) de 82.27%. Es decir que el modelo logra explicar el 82.27% de la biomasa.

par(mfrow=c(2,2))
plot(mod)

La figura de los residuales vs los ajustados (modelo) muestra un comportamiento no lineal, es decir que la relación entre biomasa y diametro no necesariamente es del tipo linealy se pueden explorar otro tipo para mejorar el ajuste.

ggplot(data_biomasa,aes(y=bio_total,x=diametro))+geom_point()+theme_bw()+geom_smooth()+ggtitle("relacion original")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

ggplot(data_biomasa,aes(y=log(bio_total),x=diametro))+geom_point()+theme_bw()+geom_smooth()+ggtitle("relacion transformando en logaritmo")
## `geom_smooth()` using method = 'loess' and formula 'y ~ x'

Se observa en las figuras como la relación es mucho mas lineal con la transformación en logaritmo de la biomasa

mod_log=lm(log(bio_total)~diametro,data = data_biomasa)
summary(mod_log)
## 
## Call:
## lm(formula = log(bio_total) ~ diametro, data = data_biomasa)
## 
## Residuals:
##      Min       1Q   Median       3Q      Max 
## -0.27395 -0.10180 -0.00328  0.10073  0.33742 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)    
## (Intercept)  1.32798    0.05977   22.22   <2e-16 ***
## diametro     0.27818    0.01061   26.22   <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 0.1453 on 88 degrees of freedom
## Multiple R-squared:  0.8865, Adjusted R-squared:  0.8852 
## F-statistic: 687.6 on 1 and 88 DF,  p-value: < 2.2e-16

Se observa que el ajuste del modelo es mayor con la transformación logaritmica, el coeficiente (R-squeare ajustado) del 88.52% indica que el modelo logra explicar en dicho porcentaje la Biomasa.

par(mfrow=c(2,2))
plot(mod_log)

Se observa que el supuesto de linealidad se cumple, al igual que el de normalidad, lo que nos indica que la transformación fue efectiva.

La ecuación de este modelo es: Ln(biomasa=1.32798+(0.27818*Diametro))

##Uso el modelo para predecir producción y utilidad esperada

Supongamos que se tiene un lote con un total de 1000 arboles, se mide una muestra aleaotria de 100 de ellos y el diametro promedio fue de 7 metros, con una desviación estandar de 1 metro. Si la utilidad esperada de 1 Tonelada de madera es en promedio de 10 millones de pesos para este lote una vez se cosecha. use los resultados del modelo logaritmico.

log_biomasa=1.32798+(0.27818*7)
biomasa_estimada=exp(1.32798+(0.27818*7))
biomasa_estimada
## [1] 26.44957
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 264.4957
utilidad_estimada*1000
## [1] 264495.7
##Escenario Pesimista 

log_biomasa=1.32798+(0.27818*6)
biomasa_estimada=exp(1.32798+(0.27818*6))
biomasa_estimada
## [1] 20.02657
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 200.2657
utilidad_estimada*1000
## [1] 200265.7
##y Optimista

log_biomasa=1.32798+(0.27818*8)
biomasa_estimada=exp(1.32798+(0.27818*8))
biomasa_estimada
## [1] 34.93258
utilidad_estimada=biomasa_estimada*10
utilidad_estimada
## [1] 349.3258
utilidad_estimada*1000
## [1] 349325.8

Se estima una utilidad promedio del lote de 264495 millones de pesos Se estima una utilidad pesimista del lote de 200265 millones de pesos Se estima una utilidad optimista del lote de 34935 millones de pesos