Evaluaremos los siguientes set de datps, donde el dataframe ‘actual’ es la información real, mientras que los demas son valore predictorios bajo diferente metodología:
arbol <-c(23.81, 22.13, 22.64, 21.69, 23.58, 22.14, 18.73, 21.59,
20.36, 20.53, 20.11, 20.34, 19.19, 22.92, 18.65, 20.6,
19.83, 20.09, 19.43, 22.06, 21.15, 19.26, 18.08, 20.24,
18.75, 20.69, 21.62, 23.69, 23.93, 23.19)
redn <-c(23.24, 20.08, 18.01, 23.28, 19.23, 21.22, 21.47, 20.6,
21.11, 21.27, 21.03, 17.34, 22.8, 21.85, 17.85, 23.15,
19.57, 19.56, 20.79, 18.04, 20.95, 21.83, 18.17, 22.66,
18.29, 18.89, 19.49, 19.19, 26.47, 25.25)
regresion <-c(16.13, 17.84, 18.28, 15.61, 17.62, 16.12, 17.29, 16.13,
16.64, 15.03, 18.16, 16.82, 17.44, 16.76, 17.26, 15.55,
17.49, 18.42, 17.54, 17.13, 15.5, 16.8, 18.47, 18.42,
18.43, 15.56, 16.03, 15.39, 15.12, 17.77)
actual <-c(17.09, 15.77, 18.45, 16.55, 22.23, 22.11, 18.26, 18.04,
19.66, 19.76, 18.74, 19.02, 18.54, 16.7, 17.57, 19.89,
19.06, 18.7, 19.39, 19.68, 19.2, 16.85, 19.91, 19.82, 18.08,
19.38, 20.3, 21.6, 23.39, 19.33)
data2 <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)
La información organizada en formato de tabla es la siguiente:
## ÁrbolC Red_N Regresion SActual
## 1 23.81 23.24 16.13 17.09
## 2 22.13 20.08 17.84 15.77
## 3 22.64 18.01 18.28 18.45
## 4 21.69 23.28 15.61 16.55
## 5 23.58 19.23 17.62 22.23
## 6 22.14 21.22 16.12 22.11
## 7 18.73 21.47 17.29 18.26
## 8 21.59 20.60 16.13 18.04
## 9 20.36 21.11 16.64 19.66
## 10 20.53 21.27 15.03 19.76
## 11 20.11 21.03 18.16 18.74
## 12 20.34 17.34 16.82 19.02
## 13 19.19 22.80 17.44 18.54
## 14 22.92 21.85 16.76 16.70
## 15 18.65 17.85 17.26 17.57
## 16 20.60 23.15 15.55 19.89
## 17 19.83 19.57 17.49 19.06
## 18 20.09 19.56 18.42 18.70
## 19 19.43 20.79 17.54 19.39
## 20 22.06 18.04 17.13 19.68
## 21 21.15 20.95 15.50 19.20
## 22 19.26 21.83 16.80 16.85
## 23 18.08 18.17 18.47 19.91
## 24 20.24 22.66 18.42 19.82
## 25 18.75 18.29 18.43 18.08
## 26 20.69 18.89 15.56 19.38
## 27 21.62 19.49 16.03 20.30
## 28 23.69 19.19 15.39 21.60
## 29 23.93 26.47 15.12 23.39
## 30 23.19 25.25 17.77 19.33
La Prueba t pareada para los datos presentados (DADO QUE LOS EVENTOS COREESPONDEN A UN MISMO EVENTO):
t_arbol <- t.test(actual, arbol, paired = TRUE, conf.level = 0.95)
t_redn <- t.test(actual, redn, paired = TRUE, conf.level = 0.95)
t_regresion <- t.test(actual, regresion, paired = TRUE, conf.level = 0.95)
t_test = list(
arbol = t_arbol,
redn = t_redn,
regresion = t_regresion
)
## $arbol
##
## Paired t-test
##
## data: actual and arbol
## t = -5.1464, df = 29, p-value = 1.689e-05
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
## -2.699329 -1.164004
## sample estimates:
## mean difference
## -1.931667
##
##
## $redn
##
## Paired t-test
##
## data: actual and redn
## t = -3.3642, df = 29, p-value = 0.002174
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
## -2.6589937 -0.6483396
## sample estimates:
## mean difference
## -1.653667
##
##
## $regresion
##
## Paired t-test
##
## data: actual and regresion
## t = 5.3138, df = 29, p-value = 1.061e-05
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
## 1.359801 3.061533
## sample estimates:
## mean difference
## 2.210667
El valor de t que se encuentra más cercano a 0 nos indica una buena relación:
# El valor de t para redn (-3.3642) que se encuentra más cercano a 0 por lo que indica una mejor relación con la data actual
# El valor de p para redn (0.002174) a pesar que se encuentra en un rango <0.05 se encuentra más cercano al valor de 0.05 comparados con los otros set de datos.
# A su ves la media entre redn y actual presenta una diferencia más cercana a 0 en comparación entre los dos grupos de valores, siendo los valores:
# Actual - arbol: -1.931667
# Actual - redn: -1.653667
# Actual - regresion: 2.210667
# Analizando los parámetros estadisticos observados se puede verificar que la data de redn se ajusta más a la data actual por lo que indica una mayor corelación comparada con los otros métodos de predición utilizadas.