Problema 2

Propiedades de los estimadores La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[ θ1ˆ=(X1+X2)/6+(X3+X4)/3 \]

\[ θ2ˆ=(X1+2X2+3X3+4X4)/5 \] \[ θ3ˆ=(X1+X2+X3+X4)/4 \] \[ θ4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2 \] # Simulación con n=50

n<- 50
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 50  
## 
##                         T1       T2       T3       T4
## ----------------- -------- -------- -------- --------
##              Mean     0.51     1.02     0.51     0.62
##           Std.Dev     0.27     0.55     0.25     0.36
##               Min     0.09     0.17     0.09     0.08
##                Q1     0.32     0.64     0.36     0.42
##            Median     0.47     0.92     0.48     0.58
##                Q3     0.66     1.27     0.67     0.75
##               Max     1.53     2.99     1.29     1.92
##               MAD     0.26     0.45     0.20     0.25
##               IQR     0.32     0.61     0.29     0.33
##                CV     0.54     0.54     0.48     0.58
##          Skewness     1.23     1.32     0.85     1.57
##       SE.Skewness     0.34     0.34     0.34     0.34
##          Kurtosis     2.33     2.50     0.81     3.40
##           N.Valid    50.00    50.00    50.00    50.00
##         Pct.Valid   100.00   100.00   100.00   100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.07553613 0.1475269 0.06337567 0.07908983
## T2 0.14752692 0.3029312 0.11899288 0.14473061
## T3 0.06337567 0.1189929 0.06056833 0.07962072
## T4 0.07908983 0.1447306 0.07962072 0.12882836

Simulación con n=50

n<- 50
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 50  
## 
##                         T1       T2       T3       T4
## ----------------- -------- -------- -------- --------
##              Mean     0.47     0.95     0.47     0.54
##           Std.Dev     0.23     0.46     0.23     0.28
##               Min     0.11     0.19     0.09     0.13
##                Q1     0.30     0.62     0.30     0.31
##            Median     0.42     0.85     0.41     0.46
##                Q3     0.60     1.22     0.65     0.73
##               Max     1.17     2.33     1.03     1.21
##               MAD     0.21     0.43     0.23     0.25
##               IQR     0.30     0.59     0.34     0.39
##                CV     0.49     0.48     0.50     0.53
##          Skewness     0.83     0.84     0.68     0.77
##       SE.Skewness     0.34     0.34     0.34     0.34
##          Kurtosis     0.36     0.41    -0.45    -0.51
##           N.Valid    50.00    50.00    50.00    50.00
##         Pct.Valid   100.00   100.00   100.00   100.00
var(T1234)
##            T1         T2         T3         T4
## T1 0.05138002 0.10139805 0.04962848 0.05872506
## T2 0.10139805 0.20988415 0.09606406 0.11388044
## T3 0.04962848 0.09606406 0.05299053 0.05956735
## T4 0.05872506 0.11388044 0.05956735 0.07912130

Simulación con n=100

n<- 100
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)
abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 100  
## 
##                         T1       T2       T3       T4
## ----------------- -------- -------- -------- --------
##              Mean     0.50     1.02     0.51     0.58
##           Std.Dev     0.25     0.53     0.22     0.29
##               Min     0.12     0.21     0.14     0.13
##                Q1     0.32     0.65     0.34     0.37
##            Median     0.46     0.91     0.50     0.51
##                Q3     0.66     1.32     0.64     0.79
##               Max     1.35     2.90     1.16     1.49
##               MAD     0.25     0.43     0.22     0.26
##               IQR     0.33     0.65     0.30     0.41
##                CV     0.49     0.52     0.43     0.50
##          Skewness     0.86     1.02     0.52     0.77
##       SE.Skewness     0.24     0.24     0.24     0.24
##          Kurtosis     0.66     0.90    -0.07     0.34
##           N.Valid   100.00   100.00   100.00   100.00
##         Pct.Valid   100.00   100.00   100.00   100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.06015845 0.1277190 0.05058905 0.06026713
## T2 0.12771897 0.2810491 0.10341132 0.12442601
## T3 0.05058905 0.1034113 0.04844328 0.05908480
## T4 0.06026713 0.1244260 0.05908480 0.08523624

Simulación con n=1000

n<- 1000
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)

base <- data.frame(x1, x2, x3, x4)

fx1 <- function(x){
  (x[1]+x[2])/6+(x[3]+x[4])/3
}

fx2 <- function(x){
  (x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}

fx3 <- function(x){
  (x[1]+x[2]+x[3]+x[4])/4
}

fx4 <- function(x){
  (min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}


T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)

T1234<- data.frame(T1,T2,T3,T4)

boxplot(T1234)

abline(h=0.5, col= "red")

summarytools::descr(T1234)
## Descriptive Statistics  
## T1234  
## N: 1000  
## 
##                          T1        T2        T3        T4
## ----------------- --------- --------- --------- ---------
##              Mean      0.49      0.99      0.50      0.57
##           Std.Dev      0.25      0.53      0.24      0.29
##               Min      0.04      0.08      0.05      0.07
##                Q1      0.31      0.59      0.32      0.35
##            Median      0.45      0.89      0.45      0.51
##                Q3      0.64      1.29      0.64      0.72
##               Max      1.62      3.71      1.35      1.95
##               MAD      0.23      0.50      0.23      0.27
##               IQR      0.33      0.69      0.33      0.36
##                CV      0.51      0.54      0.49      0.52
##          Skewness      0.88      0.99      0.77      1.03
##       SE.Skewness      0.08      0.08      0.08      0.08
##          Kurtosis      0.66      1.11      0.38      1.36
##           N.Valid   1000.00   1000.00   1000.00   1000.00
##         Pct.Valid    100.00    100.00    100.00    100.00
var(T1234)
##            T1        T2         T3         T4
## T1 0.06433498 0.1321660 0.05809184 0.06518499
## T2 0.13216603 0.2815780 0.11695322 0.13197852
## T3 0.05809184 0.1169532 0.05820553 0.06471633
## T4 0.06518499 0.1319785 0.06471633 0.08650529

A partir de los resultados es posible evidenciar que el estimador 4 es el que presenta mejores resultados en cuanto a insesgadez, debido a que su media se acerca al 0.5 y el indicador que presenta mayor eficiencia es el 3, por el comportamiento de su varianza. al aumentar el numero de datos aleatorios, se observa que la varianza de los indicadores comienza a disminuir, siendo el indicador 3 el que presenta las mejores condiciones de insesgadez y eficiencia, debido a que n=1000 datos, la varianza es de 0.062.

De la misma manera, se evidencia que los indicadores 1, 3 y 4 presentan consistencia, lo que se debe a que al incrementar el número de datos estos muestran una menor varianza y se acercan a la media poblacional.De esta forma se concluye que el indicador dos es el que incumple con las condiciones de consistena e insesgadez.