llamada de librerias

## Warning: package 'ggplot2' was built under R version 4.0.3
## Registered S3 methods overwritten by 'tibble':
##   method     from  
##   format.tbl pillar
##   print.tbl  pillar

Lectura de datos y division de municipios

setwd("C:/Users/franc/Documents/EAFIT/Modelos de Azucar/ecuaciones")
datos = read.table("Produccion de biomasa total.csv", header = TRUE, sep = ",")
Monteria = datos[1:33,]
Saldana = datos[34:63,]

Grafica de dispersion de datos observados y simulados Monteria

Se busca un error de simulación que el coeficiente de desviación al 20%

GraficaM = ggplot(Monteria,aes(Biomasa.Total_Obs, Biomasa.Total_Sim), size=5, alpha=0.3) 
GraficaM + geom_point()+geom_smooth(method = "lm", level = 0.80)
## `geom_smooth()` using formula 'y ~ x'

A traves grafica de dispercion en el municipio de monteria observamos que el modelo no es robusto, porque mas de la mitad esta por fuera de los intervalos

Grafica de dispersion de datos observados y simulados saldaña

Se busca un error de simulación que el coeficiente de desviación al 20%

GraficaS = ggplot(Saldana,aes(Biomasa.Total_Obs, Biomasa.Total_Sim), size=5, alpha=0.3) 
GraficaS + geom_point()+geom_smooth(method = "lm", level = 0.80)
## `geom_smooth()` using formula 'y ~ x'

A traves grafica de dispercion en el municipio de Saldaña observamos que el modelo no es robusto, porque mas de la mitad esta por fuera de los intervalos

Grafica de residuales Monteria

max(Monteria$Biomasa.Total_Obs)
## [1] 21579
max(Monteria$Biomasa.Total_Sim)
## [1] 13414
residuales=Monteria$Biomasa.Total_Sim-Monteria$Biomasa.Total_Obs
mean(residuales)
## [1] -1091.357
Grafica2 = ggplot(Monteria,aes(Biomasa.Total_Obs, Biomasa.Total_Sim-Biomasa.Total_Obs))+geom_point()+xlim(0,21579)+ylim(-8000,3000)+geom_abline(intercept = 0,slope = 0)
Grafica2 + geom_text(data = NULL, x = 3000, y = -6000, label = "Mean = -1091,36")
## Warning: Removed 1 rows containing missing values (geom_point).

El modelo se encuetra subestimado

Grafica de residuales saldana

residuales=Saldana$Biomasa.Total_Sim-Saldana$Biomasa.Total_Obs
mean(residuales)
## [1] 540.6773
Grafica3 = ggplot(Saldana,aes(Biomasa.Total_Obs, Biomasa.Total_Sim-Biomasa.Total_Obs))+geom_point()+geom_abline(intercept = 0,slope = 0)+ geom_text(data = NULL, x = 10000, y = -4000, label = "Mean = 540.67")
Grafica3

El modelo se encuetra sobrestimado

sesgo

sesgoM = sum(Monteria$Biomasa.Total_Sim-Monteria$Biomasa.Total_Obs)/length(Monteria$Biomasa.Total_Obs)
sesgoM
## [1] -1091.357
sesgoS = sum(Saldana$Biomasa.Total_Sim-Saldana$Biomasa.Total_Obs)/length(Saldana$Biomasa.Total_Obs)
sesgoS
## [1] 540.6773

Podemos rectificar que monteria esta subestimado y saldaña esta sobrestimado

Coeficiente de relacion

rMonteria = cor(Monteria$Biomasa.Total_Sim,Monteria$Biomasa.Total_Obs)
rMonteria
## [1] 0.9426806
rSaldana = cor(Saldana$Biomasa.Total_Sim,Saldana$Biomasa.Total_Obs)
rSaldana
## [1] 0.9604204

Los valores de Monteria y saldaña estan muy cercanos a 1, en conclucion existe mayor asociacion entre los datos observados y simulados en los dos municipios