Evaluación de la Robustez del Modelo

Cargamos las librerias

library(rsconnect)

Cargar la base de datos

A continuación, importamos la base de datos climática Montería y Saldana.

setwd("C:/Users/JULIAN BENAVIDES/Desktop/Taller/Archivos_Generales")
datos = read.table("datos_biomasa.csv", header = TRUE, sep = ",")
names(datos) [2:4] = c("Ciclo", "Bio_Real", "Bio_Sim")

Luego se separa los datos de Montería y Saldana.

data_M = datos[1:33,] #Separamos los datos Monteria.
data_S = datos[34:63,] #Separamos los datos de Saldana.

Evaluación del modelo

Se propone evaluar el modelo mediante dos métodos, gráfico y estadístico.

Para el método gráfico se utilizó gráficos de dispersión con una recta 1:1 e intervalos del 20% de confianza y graficas de residuales.

En el método estadístico se utilizaron los siguientes valores cuantitativos:

1. Error cuadrático medio de la desviación

2. Sesgo

Donde Xi: Dato Observado; Yi: Dato simulado ; n: Número de pares de datos observados y simulados.

3. Coeficiente de correlación

Donde Xi: Dato Observado; Yi: Dato simulado ; X y Y el promedio de los datos observados y simulados, respectivamente; n: Número de pares de datos observados y simulados.

Evaluación gráfica

Montería

Figura 1.

x = 1:20000
m = x - (x* 0.20)
n = x + (x* 0.20)
plot(data_M$Bio_Real, data_M$Bio_Sim, 
     main="Diagrama de Dispersión en Monteria",
     xlab="Biomasa Real",
     ylim = c(0, 20000),
     ylab="Biomasa Simulada"
     )
lines(x)
lines(m, col='Red')
lines(n, col='Red')

Saldana

Figura 2.

xs = 1:20000
ms = x - (x* 0.20)
ns = x + (x* 0.20)
plot(data_S$Bio_Real, data_S$Bio_Sim, 
     main="Diagrama de Dispersión en Saldana",
     xlab="Biomasa Real",
     ylim = c(0, 20000),
     ylab="Biomasa Simulada"
     )

lines(xs)
lines(ms, col='Red')
lines(ns, col='Red')

Gráficas de residuos

Montería

Figura 3.

data_M$residual = data_M$Bio_Sim - data_M$Bio_Real
mean(data_M$residual)

## [1] -1091.357

plot(data_M$residual,
     ylim = c(-8200,4000),
     ylab = "Residuos (g m^-2)",
     xlab = "Rendimiento medido(g m^-2)")
text(x = 27, y = -7000, # Coordenadas
     label = "mean = -1091.357")
abline (a = 0, b=0, lwd=2, col = "red")

Saldana

Figura 4.

data_S$residual = data_S$Bio_Sim - data_S$Bio_Real
mean(data_S$residual)

## [1] 540.6773

plot(data_S$residual,
     ylim = c(-8200,4000),
     ylab = "Residuos (g m^-2)",
     xlab = "Rendimiento medido(g m^-2)")
text(x = 25, y = -7000, # Coordenadas
     label = "mean = 540.6773")
abline (a = 0, b=0, lwd=2, col = "red")

Análisis gráfico

Al comparar las gráficas 1 y 2 es posible afirmar que el modelo demuestra mejores resultados en la zona de Saldana ya que la mayoría de los datos se encuentran dentro de los intervalos de confianza o no se encuentran muy alejados de este. Sin embrago, los dos modelos se pueden considerar con una robustez aceptable.

En las figuras 3 y 4 se puede observar que el modelo para montería se está subestimando y en Saldana se está sobreestimando, sin embrago en Saldaña el modelo demuestra ser más acertado a los valores reales, a pesar que el modelo se esté sobreestimando los datos son muy cercanos a cero en comparación con Montería.

Evaluación Estadística

Montería

Error cuadrático medio de la desviación

RMSD_M = (sum((data_M$Bio_Real-data_M$Bio_Sim)^2)/length(data_M$Bio_Real)-1)^0.5
RMSD_M

## [1] 2692.744

Sesgo

Bias_M = sum(data_M$Bio_Sim-data_M$Bio_Real)/length(data_M$Bio_Real)
Bias_M

## [1] -1091.357

Coeficiente de correlación

cor(data_M$Bio_Sim, data_M$Bio_Real)

## [1] 0.9426806

Saldana

Error cuadrático medio de la desviación

RMSD_S = (sum((data_S$Bio_Real-data_S$Bio_Sim)^2)/length(data_S$Bio_Real)-1)^0.5
RMSD_S

## [1] 1579.668

Sesgo

Bias_S = sum(data_S$Bio_Sim-data_S$Bio_Real)/length(data_S$Bio_Real)
Bias_S

## [1] 540.6773

Coeficiente de correlación

cor(data_S$Bio_Sim, data_S$Bio_Real)

## [1] 0.9604204

Análisis estadístico

De acuerdo con el sesgo obtenido en el modelo para las dos localidades, se puede decir que en Saldaña los valores estimados en promedio están por encima del valor real con 540.6773 g/m2 y en Montería están por debajo con 1091.357g/m2.

Con respecto al coeficiente de correlación se puede decir que en las dos localidades se muestra una buena relación entre los datos (0.94 Montería; 0.96 Saldaña) y está representando bien el sitema ya que la mayoría de los datos se encuentra cerca de la recta 1:1.

Conclusión

Tiendo en cuenta el analisis de los datos se puede concluir que el ciclo del cultivo que tuvo mayores errores de simulación fue los realizados en Montería.

Evaluación de la Robustez del Modelo

Julian Guevara; Esteban Orta

2022-03-02

Cargamos las librerias

Cargar la base de datos

Evaluación del modelo

1. Error cuadrático medio de la desviación

2. Sesgo

3. Coeficiente de correlación

Evaluación gráfica

Montería

Saldana

Gráficas de residuos

Montería

Saldana

Análisis gráfico

Evaluación Estadística

Montería

Error cuadrático medio de la desviación

Sesgo

Coeficiente de correlación

Saldana

Error cuadrático medio de la desviación

Sesgo

Coeficiente de correlación

Análisis estadístico

Conclusión