library(rsconnect)
A continuación, importamos la base de datos climática Montería y Saldana.
setwd("C:/Users/JULIAN BENAVIDES/Desktop/Taller/Archivos_Generales")
datos = read.table("datos_biomasa.csv", header = TRUE, sep = ",")
names(datos) [2:4] = c("Ciclo", "Bio_Real", "Bio_Sim")
Luego se separa los datos de Montería y Saldana.
data_M = datos[1:33,] #Separamos los datos Monteria.
data_S = datos[34:63,] #Separamos los datos de Saldana.
Se propone evaluar el modelo mediante dos métodos, gráfico y estadístico.
Para el método gráfico se utilizó gráficos de dispersión con una recta 1:1 e intervalos del 20% de confianza y graficas de residuales.
En el método estadístico se utilizaron los siguientes valores cuantitativos:
Donde Xi: Dato Observado; Yi: Dato simulado ; n: Número de pares de datos observados y simulados.
Donde Xi: Dato Observado; Yi: Dato simulado ; X y Y el promedio de los datos observados y simulados, respectivamente; n: Número de pares de datos observados y simulados.
Figura 1.
x = 1:20000
m = x - (x* 0.20)
n = x + (x* 0.20)
plot(data_M$Bio_Real, data_M$Bio_Sim,
main="Diagrama de Dispersión en Monteria",
xlab="Biomasa Real",
ylim = c(0, 20000),
ylab="Biomasa Simulada"
)
lines(x)
lines(m, col='Red')
lines(n, col='Red')
Figura 2.
xs = 1:20000
ms = x - (x* 0.20)
ns = x + (x* 0.20)
plot(data_S$Bio_Real, data_S$Bio_Sim,
main="Diagrama de Dispersión en Saldana",
xlab="Biomasa Real",
ylim = c(0, 20000),
ylab="Biomasa Simulada"
)
lines(xs)
lines(ms, col='Red')
lines(ns, col='Red')
Figura 3.
data_M$residual = data_M$Bio_Sim - data_M$Bio_Real
mean(data_M$residual)
## [1] -1091.357
plot(data_M$residual,
ylim = c(-8200,4000),
ylab = "Residuos (g m^-2)",
xlab = "Rendimiento medido(g m^-2)")
text(x = 27, y = -7000, # Coordenadas
label = "mean = -1091.357")
abline (a = 0, b=0, lwd=2, col = "red")
Figura 4.
data_S$residual = data_S$Bio_Sim - data_S$Bio_Real
mean(data_S$residual)
## [1] 540.6773
plot(data_S$residual,
ylim = c(-8200,4000),
ylab = "Residuos (g m^-2)",
xlab = "Rendimiento medido(g m^-2)")
text(x = 25, y = -7000, # Coordenadas
label = "mean = 540.6773")
abline (a = 0, b=0, lwd=2, col = "red")
Al comparar las gráficas 1 y 2 es posible afirmar que el modelo demuestra mejores resultados en la zona de Saldana ya que la mayoría de los datos se encuentran dentro de los intervalos de confianza o no se encuentran muy alejados de este. Sin embrago, los dos modelos se pueden considerar con una robustez aceptable.
En las figuras 3 y 4 se puede observar que el modelo para montería se está subestimando y en Saldana se está sobreestimando, sin embrago en Saldaña el modelo demuestra ser más acertado a los valores reales, a pesar que el modelo se esté sobreestimando los datos son muy cercanos a cero en comparación con Montería.
RMSD_M = (sum((data_M$Bio_Real-data_M$Bio_Sim)^2)/length(data_M$Bio_Real)-1)^0.5
RMSD_M
## [1] 2692.744
Bias_M = sum(data_M$Bio_Sim-data_M$Bio_Real)/length(data_M$Bio_Real)
Bias_M
## [1] -1091.357
cor(data_M$Bio_Sim, data_M$Bio_Real)
## [1] 0.9426806
RMSD_S = (sum((data_S$Bio_Real-data_S$Bio_Sim)^2)/length(data_S$Bio_Real)-1)^0.5
RMSD_S
## [1] 1579.668
Bias_S = sum(data_S$Bio_Sim-data_S$Bio_Real)/length(data_S$Bio_Real)
Bias_S
## [1] 540.6773
cor(data_S$Bio_Sim, data_S$Bio_Real)
## [1] 0.9604204
De acuerdo con el sesgo obtenido en el modelo para las dos localidades, se puede decir que en Saldaña los valores estimados en promedio están por encima del valor real con 540.6773 g/m2 y en Montería están por debajo con 1091.357g/m2.
Con respecto al coeficiente de correlación se puede decir que en las dos localidades se muestra una buena relación entre los datos (0.94 Montería; 0.96 Saldaña) y está representando bien el sitema ya que la mayoría de los datos se encuentra cerca de la recta 1:1.
Tiendo en cuenta el analisis de los datos se puede concluir que el ciclo del cultivo que tuvo mayores errores de simulación fue los realizados en Montería.