Cargamos la data

Evaluaremos los siguientes set de datps, donde el dataframe ‘actual’ es la información real, mientras que los demas son valore predictorios bajo diferente metodología:

arbol <-c(23.81,    22.13,  22.64,  21.69,  23.58,  22.14,  18.73,  21.59,
          20.36,    20.53,  20.11,  20.34,  19.19,  22.92,  18.65,  20.6,
          19.83,    20.09,  19.43,  22.06,  21.15,  19.26,  18.08,  20.24,
          18.75,    20.69,  21.62,  23.69,  23.93,  23.19)

redn <-c(23.24, 20.08,  18.01,  23.28,  19.23,  21.22,  21.47,  20.6,
         21.11, 21.27,  21.03,  17.34,  22.8,   21.85,  17.85,  23.15,
         19.57, 19.56,  20.79,  18.04,  20.95,  21.83,  18.17,  22.66,
         18.29, 18.89,  19.49,  19.19,  26.47,  25.25)

regresion <-c(16.13,    17.84,  18.28,  15.61,  17.62,  16.12,  17.29,  16.13,
              16.64,    15.03,  18.16,  16.82,  17.44,  16.76,  17.26,  15.55,
              17.49,    18.42,  17.54,  17.13,  15.5,    16.8,  18.47,  18.42, 
              18.43,    15.56,  16.03,  15.39,  15.12, 17.77)

actual <-c(17.09,   15.77,  18.45,  16.55,  22.23,  22.11,  18.26,  18.04,  
           19.66,   19.76,  18.74,  19.02,  18.54,  16.7,   17.57,  19.89,
           19.06,   18.7,   19.39,  19.68,  19.2,   16.85,  19.91,  19.82,  18.08,
           19.38,   20.3,   21.6,   23.39,  19.33)

data2  <- data.frame(ÁrbolC =arbol, Red_N = redn, Regresion = regresion, SActual = actual)

Información organizada

La información organizada en formato de tabla es la siguiente:

##    ÁrbolC Red_N Regresion SActual
## 1   23.81 23.24     16.13   17.09
## 2   22.13 20.08     17.84   15.77
## 3   22.64 18.01     18.28   18.45
## 4   21.69 23.28     15.61   16.55
## 5   23.58 19.23     17.62   22.23
## 6   22.14 21.22     16.12   22.11
## 7   18.73 21.47     17.29   18.26
## 8   21.59 20.60     16.13   18.04
## 9   20.36 21.11     16.64   19.66
## 10  20.53 21.27     15.03   19.76
## 11  20.11 21.03     18.16   18.74
## 12  20.34 17.34     16.82   19.02
## 13  19.19 22.80     17.44   18.54
## 14  22.92 21.85     16.76   16.70
## 15  18.65 17.85     17.26   17.57
## 16  20.60 23.15     15.55   19.89
## 17  19.83 19.57     17.49   19.06
## 18  20.09 19.56     18.42   18.70
## 19  19.43 20.79     17.54   19.39
## 20  22.06 18.04     17.13   19.68
## 21  21.15 20.95     15.50   19.20
## 22  19.26 21.83     16.80   16.85
## 23  18.08 18.17     18.47   19.91
## 24  20.24 22.66     18.42   19.82
## 25  18.75 18.29     18.43   18.08
## 26  20.69 18.89     15.56   19.38
## 27  21.62 19.49     16.03   20.30
## 28  23.69 19.19     15.39   21.60
## 29  23.93 26.47     15.12   23.39
## 30  23.19 25.25     17.77   19.33

Prueba t

La Prueba t pareada para los datos presentados (DADO QUE LOS EVENTOS COREESPONDEN A UN MISMO EVENTO):

t_arbol <- t.test(actual, arbol, paired = TRUE, conf.level = 0.95)
t_redn <- t.test(actual, redn, paired = TRUE, conf.level = 0.95)
t_regresion <- t.test(actual, regresion, paired = TRUE, conf.level = 0.95)

t_test = list(
    arbol = t_arbol,
    redn = t_redn,
    regresion = t_regresion
  )
## $arbol
## 
##  Paired t-test
## 
## data:  actual and arbol
## t = -5.1464, df = 29, p-value = 1.689e-05
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -2.699329 -1.164004
## sample estimates:
## mean difference 
##       -1.931667 
## 
## 
## $redn
## 
##  Paired t-test
## 
## data:  actual and redn
## t = -3.3642, df = 29, p-value = 0.002174
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  -2.6589937 -0.6483396
## sample estimates:
## mean difference 
##       -1.653667 
## 
## 
## $regresion
## 
##  Paired t-test
## 
## data:  actual and regresion
## t = 5.3138, df = 29, p-value = 1.061e-05
## alternative hypothesis: true mean difference is not equal to 0
## 95 percent confidence interval:
##  1.359801 3.061533
## sample estimates:
## mean difference 
##        2.210667

Analisis de la información

El valor de t que se encuentra más cercano a 0 nos indica una buena relación:

# El valor de t para redn (-3.3642) que se encuentra más cercano a 0 por lo que indica una mejor relación con la data actual
# El valor de p para redn (0.002174) a pesar que se encuentra en un rango <0.05 se encuentra más cercano al valor de 0.05 comparados con los otros set de datos. 
# A su ves la media entre redn y actual presenta una diferencia más cercana a 0 en comparación entre los dos grupos de valores, siendo los valores:
# Actual - arbol: -1.931667 
# Actual - redn: -1.653667
# Actual - regresion: 2.210667
# Analizando los parámetros estadisticos observados se puede verificar que la data de redn se ajusta más a la data actual por lo que indica una mayor corelación comparada con los otros métodos de predición utilizadas.  

Archibo publicado en Rpubs

https://rpubs.com/LuisO/1312138