La distribución de los datos es de la siguiente forma:

summary(NaturalPark)
##       bid1            bidh             bidl       answers       age       
##  Min.   : 6.00   Min.   : 18.00   Min.   : 3.00   nn:123   Min.   :1.000  
##  1st Qu.:12.00   1st Qu.: 24.00   1st Qu.: 6.00   ny: 18   1st Qu.:2.000  
##  Median :24.00   Median : 48.00   Median :12.00   yn:113   Median :3.000  
##  Mean   :22.58   Mean   : 52.54   Mean   :11.29   yy: 58   Mean   :3.029  
##  3rd Qu.:24.00   3rd Qu.: 48.00   3rd Qu.:12.00            3rd Qu.:4.000  
##  Max.   :48.00   Max.   :120.00   Max.   :24.00            Max.   :6.000  
##      sex          income            R1               R2              LBD1      
##  male  :138   Min.   :1.000   Min.   :0.0000   Min.   :0.0000   Min.   :1.792  
##  female:174   1st Qu.:2.000   1st Qu.:0.0000   1st Qu.:0.0000   1st Qu.:2.485  
##               Median :2.000   Median :1.0000   Median :0.0000   Median :3.178  
##               Mean   :2.516   Mean   :0.5481   Mean   :0.2436   Mean   :2.840  
##               3rd Qu.:3.000   3rd Qu.:1.0000   3rd Qu.:0.0000   3rd Qu.:3.178  
##               Max.   :8.000   Max.   :1.0000   Max.   :1.0000   Max.   :3.871  
##       bid2            LBD2      
##  Min.   :  3.0   Min.   :1.099  
##  1st Qu.: 12.0   1st Qu.:2.485  
##  Median : 24.0   Median :3.178  
##  Mean   : 32.1   Mean   :2.998  
##  3rd Qu.: 30.0   3rd Qu.:3.351  
##  Max.   :120.0   Max.   :4.787

Comentario: Me queda la duda de cual es la escala con la que se midió la edad o el ingreso en NaturalPark. ¿Qué significan edades entre 1 y 6 o ingresos entre 1 y 8?

Nos concentraremos en la estructura de las columnas de respuesta y DAP de NaturalPark que serán contenidas en el data frame NP y tienen la siguiente estructura.

head(NP)
##   R1 R2 bid1 bid2
## 1  1  1    6   18
## 2  1  0   48  120
## 3  1  0   48  120
## 4  0  0   24   12
## 5  0  1   24   12
## 6  0  0   12    6

Datos de Viña

Revisamos que la estructura de los datos sea similar a NaturalPark, en particular al subconjunto de variables NP.

head(Vina)
##   R1 R2  BID1   BID2
## 1  1  1 18000 120000
## 2  1  1 18000  60000
## 3  1  1 18000  60000
## 4  1  1 18000  60000
## 5  1  1 18000  18000
## 6  1  1 18000  36000

Al comparar los data frames NP y Vina vemos que las combinaciones de \((R1,R2)\) en NP son \(\{(1,1),(1,0),(0,0),(0,1)\}\). Por su parte, para Vina solo tenemos \(\{(1,1),(0,0)\}\). Esto se debe a la forma de preguntar la disposición a pagar. Sin embargo, tenemos otro problema. En NP, la variable bid1 tiene variabilidad (valores entre 6 y 48). Por el contrario, BID1 en Vina tiene el mismo valor para todas las observaciones. Adicionalmente, hay casos donde BID2 toma valores cero (y por consecuencia al aplicar logaritmo estas observaciones se indefinen). Por el contrario en NP, nunca hay valores cero ni para bidh ni para bidl. Luego, como bid2 toma uno de esos valores condicional en R1, bid2 tampoco tiene valores cero.

Plan de acción

Agregar variabilidad en respuestas \((R1,R2)\) de forma que BID1 tenga variabilidad y BID 2 no pueda tomar valores cero.