La distribución de los datos es de la siguiente forma:
summary(NaturalPark)
## bid1 bidh bidl answers age
## Min. : 6.00 Min. : 18.00 Min. : 3.00 nn:123 Min. :1.000
## 1st Qu.:12.00 1st Qu.: 24.00 1st Qu.: 6.00 ny: 18 1st Qu.:2.000
## Median :24.00 Median : 48.00 Median :12.00 yn:113 Median :3.000
## Mean :22.58 Mean : 52.54 Mean :11.29 yy: 58 Mean :3.029
## 3rd Qu.:24.00 3rd Qu.: 48.00 3rd Qu.:12.00 3rd Qu.:4.000
## Max. :48.00 Max. :120.00 Max. :24.00 Max. :6.000
## sex income R1 R2 LBD1
## male :138 Min. :1.000 Min. :0.0000 Min. :0.0000 Min. :1.792
## female:174 1st Qu.:2.000 1st Qu.:0.0000 1st Qu.:0.0000 1st Qu.:2.485
## Median :2.000 Median :1.0000 Median :0.0000 Median :3.178
## Mean :2.516 Mean :0.5481 Mean :0.2436 Mean :2.840
## 3rd Qu.:3.000 3rd Qu.:1.0000 3rd Qu.:0.0000 3rd Qu.:3.178
## Max. :8.000 Max. :1.0000 Max. :1.0000 Max. :3.871
## bid2 LBD2
## Min. : 3.0 Min. :1.099
## 1st Qu.: 12.0 1st Qu.:2.485
## Median : 24.0 Median :3.178
## Mean : 32.1 Mean :2.998
## 3rd Qu.: 30.0 3rd Qu.:3.351
## Max. :120.0 Max. :4.787
Comentario: Me queda la duda de cual es la escala con la que se midió la edad o el ingreso en NaturalPark. ¿Qué significan edades entre 1 y 6 o ingresos entre 1 y 8?
Nos concentraremos en la estructura de las columnas de respuesta y DAP de NaturalPark que serán contenidas en el data frame NP y tienen la siguiente estructura.
head(NP)
## R1 R2 bid1 bid2
## 1 1 1 6 18
## 2 1 0 48 120
## 3 1 0 48 120
## 4 0 0 24 12
## 5 0 1 24 12
## 6 0 0 12 6
Revisamos que la estructura de los datos sea similar a NaturalPark, en particular al subconjunto de variables NP.
head(Vina)
## R1 R2 BID1 BID2
## 1 1 1 18000 120000
## 2 1 1 18000 60000
## 3 1 1 18000 60000
## 4 1 1 18000 60000
## 5 1 1 18000 18000
## 6 1 1 18000 36000
Al comparar los data frames NP y Vina vemos que las combinaciones de \((R1,R2)\) en NP son \(\{(1,1),(1,0),(0,0),(0,1)\}\). Por su parte, para Vina solo tenemos \(\{(1,1),(0,0)\}\). Esto se debe a la forma de preguntar la disposición a pagar. Sin embargo, tenemos otro problema. En NP, la variable bid1 tiene variabilidad (valores entre 6 y 48). Por el contrario, BID1 en Vina tiene el mismo valor para todas las observaciones. Adicionalmente, hay casos donde BID2 toma valores cero (y por consecuencia al aplicar logaritmo estas observaciones se indefinen). Por el contrario en NP, nunca hay valores cero ni para bidh ni para bidl. Luego, como bid2 toma uno de esos valores condicional en R1, bid2 tampoco tiene valores cero.
Agregar variabilidad en respuestas \((R1,R2)\) de forma que BID1 tenga variabilidad y BID 2 no pueda tomar valores cero.