Problema 2

Propiedades de los Estimadores

La simulaciĂ³n ayuda a entender y validar las propiedades de los estimadores estadĂ­sticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales caracterĂ­sticas de un grupo de estimadores propuestos para la estimaciĂ³n de un parĂ¡metro asociado a un modelo de probabilidad.

Sean X1 , X2 , X3 y X4 , una muestra aleatoria de tamaño n=4 cuya poblaciĂ³n la conforma una distribuciĂ³n exponencial con parĂ¡metro θ desconocido. Determine las caracterĂ­sticas de cada uno de los siguientes estimadores propuestos:

θ1ˆ=X1+X26+X3+X43

θ2ˆ=(X1+2X2+3X3+4X4)5

θ3ˆ=X1+X2+X3+X44 $

θ4ˆ=min{X1,X2,X3,X4}+max{X1,X2,X3,X4}2

SimulaciĂ³n con n=20

n<- 20
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 20  
## 
##                         T1       T2       T3       T4
## ----------------- -------- -------- -------- --------
##              Mean     0.51     1.00     0.52     0.62
##           Std.Dev     0.27     0.53     0.29     0.37
##               Min     0.16     0.36     0.13     0.15
##                Q1     0.30     0.56     0.31     0.37
##            Median     0.46     0.92     0.51     0.49
##                Q3     0.66     1.21     0.63     0.86
##               Max     1.19     2.43     1.25     1.55
##               MAD     0.28     0.51     0.23     0.34
##               IQR     0.34     0.64     0.30     0.46
##                CV     0.54     0.53     0.55     0.60
##          Skewness     0.86     0.99     0.95     0.83
##       SE.Skewness     0.51     0.51     0.51     0.51
##          Kurtosis    -0.07     0.47     0.31    -0.21
##           N.Valid    20.00    20.00    20.00    20.00
##         Pct.Valid   100.00   100.00   100.00   100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.07558020 0.1413857 0.07029269 0.08569219
## T2 0.14138572 0.2776744 0.12607768 0.15350757
## T3 0.07029269 0.1260777 0.08129649 0.09934967
## T4 0.08569219 0.1535076 0.09934967 0.13894046

SimulaciĂ³n con n=50

n<- 50
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 50  
## 
##                         T1       T2       T3       T4
## ----------------- -------- -------- -------- --------
##              Mean     0.55     1.12     0.56     0.66
##           Std.Dev     0.26     0.57     0.27     0.32
##               Min     0.15     0.30     0.13     0.14
##                Q1     0.33     0.68     0.37     0.40
##            Median     0.53     1.05     0.53     0.63
##                Q3     0.74     1.47     0.73     0.92
##               Max     1.25     2.72     1.18     1.22
##               MAD     0.30     0.58     0.27     0.40
##               IQR     0.39     0.76     0.34     0.51
##                CV     0.47     0.51     0.48     0.48
##          Skewness     0.48     0.68     0.48     0.14
##       SE.Skewness     0.34     0.34     0.34     0.34
##          Kurtosis    -0.41    -0.12    -0.68    -1.19
##           N.Valid    50.00    50.00    50.00    50.00
##         Pct.Valid   100.00   100.00   100.00   100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.06724036 0.1449534 0.06400389 0.06861964
## T2 0.14495343 0.3265695 0.13184541 0.14099232
## T3 0.06400389 0.1318454 0.07150247 0.07585212
## T4 0.06861964 0.1409923 0.07585212 0.09946229

SimulaciĂ³n con n=100

n<- 100
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 100  
## 
##                         T1       T2       T3       T4
## ----------------- -------- -------- -------- --------
##              Mean     0.49     0.98     0.50     0.57
##           Std.Dev     0.27     0.57     0.26     0.31
##               Min     0.11     0.22     0.11     0.11
##                Q1     0.27     0.54     0.29     0.32
##            Median     0.43     0.85     0.47     0.55
##                Q3     0.66     1.30     0.66     0.76
##               Max     1.43     2.70     1.27     1.65
##               MAD     0.26     0.52     0.29     0.32
##               IQR     0.39     0.76     0.37     0.44
##                CV     0.56     0.58     0.52     0.55
##          Skewness     0.95     0.99     0.70     0.82
##       SE.Skewness     0.24     0.24     0.24     0.24
##          Kurtosis     0.64     0.47     0.07     0.44
##           N.Valid   100.00   100.00   100.00   100.00
##         Pct.Valid   100.00   100.00   100.00   100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.07429898 0.1536635 0.06672958 0.07732104
## T2 0.15366348 0.3271480 0.13731322 0.16003578
## T3 0.06672958 0.1373132 0.06672393 0.07641817
## T4 0.07732104 0.1600358 0.07641817 0.09902518

SimulaciĂ³n con n=1000

n<- 1000
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 1000  
## 
##                          T1        T2        T3        T4
## ----------------- --------- --------- --------- ---------
##              Mean      0.51      1.03      0.51      0.59
##           Std.Dev      0.25      0.53      0.24      0.31
##               Min      0.05      0.11      0.06      0.07
##                Q1      0.33      0.65      0.34      0.37
##            Median      0.48      0.94      0.47      0.53
##                Q3      0.65      1.36      0.65      0.77
##               Max      1.70      3.47      1.57      2.17
##               MAD      0.24      0.51      0.23      0.28
##               IQR      0.32      0.71      0.31      0.40
##                CV      0.49      0.51      0.47      0.52
##          Skewness      0.85      0.92      0.85      1.13
##       SE.Skewness      0.08      0.08      0.08      0.08
##          Kurtosis      0.95      1.12      1.02      2.00
##           N.Valid   1000.00   1000.00   1000.00   1000.00
##         Pct.Valid    100.00    100.00    100.00    100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.06380381 0.1308502 0.05704420 0.06729503
## T2 0.13085016 0.2795569 0.11415013 0.13477451
## T3 0.05704420 0.1141501 0.05677262 0.06642033
## T4 0.06729503 0.1347745 0.06642033 0.09305661

Conclusiones

Una vez obtenidos los datos se observa que el estimador 4 es en el cual se obtienen mejores resultados respecto a insesgadez, debido a que su media se acerca al 0.5. Se observa que el indicador que presenta mayor eficiencia es el 3,debido al comportamiento de su varianza, porque al aumentar el numero de datos aleatorios, se observa que la varianza de los indicadores comienza a disminuir, siendo el indicador 3 el que presenta las mejores condiciones de insesgadez y eficiencia.

De la misma manera, se evidencia que los indicadores 1, 3 y 4 presentan consistencia, lo que se debe a que al incrementar el nĂºmero de datos estos muestran una menor varianza y se acercan a la media poblacional. Por lo que se concluye que el indicador dos es el que no cumple con las condiciones de consistena e insesgadez.