La simulaciĂ³n ayuda a entender y validar las propiedades de los estimadores estadĂsticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales caracterĂsticas de un grupo de estimadores propuestos para la estimaciĂ³n de un parĂ¡metro asociado a un modelo de probabilidad.
Sean X1 , X2 , X3 y X4 , una muestra aleatoria de tamaño n=4 cuya poblaciĂ³n la conforma una distribuciĂ³n exponencial con parĂ¡metro θ desconocido. Determine las caracterĂsticas de cada uno de los siguientes estimadores propuestos:
θ1ˆ=X1+X26+X3+X43
θ2ˆ=(X1+2X2+3X3+4X4)5
θ3ˆ=X1+X2+X3+X44 $
θ4ˆ=min{X1,X2,X3,X4}+max{X1,X2,X3,X4}2
n<- 20
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 20
##
## T1 T2 T3 T4
## ----------------- -------- -------- -------- --------
## Mean 0.51 1.00 0.52 0.62
## Std.Dev 0.27 0.53 0.29 0.37
## Min 0.16 0.36 0.13 0.15
## Q1 0.30 0.56 0.31 0.37
## Median 0.46 0.92 0.51 0.49
## Q3 0.66 1.21 0.63 0.86
## Max 1.19 2.43 1.25 1.55
## MAD 0.28 0.51 0.23 0.34
## IQR 0.34 0.64 0.30 0.46
## CV 0.54 0.53 0.55 0.60
## Skewness 0.86 0.99 0.95 0.83
## SE.Skewness 0.51 0.51 0.51 0.51
## Kurtosis -0.07 0.47 0.31 -0.21
## N.Valid 20.00 20.00 20.00 20.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.07558020 0.1413857 0.07029269 0.08569219
## T2 0.14138572 0.2776744 0.12607768 0.15350757
## T3 0.07029269 0.1260777 0.08129649 0.09934967
## T4 0.08569219 0.1535076 0.09934967 0.13894046
n<- 50
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 50
##
## T1 T2 T3 T4
## ----------------- -------- -------- -------- --------
## Mean 0.55 1.12 0.56 0.66
## Std.Dev 0.26 0.57 0.27 0.32
## Min 0.15 0.30 0.13 0.14
## Q1 0.33 0.68 0.37 0.40
## Median 0.53 1.05 0.53 0.63
## Q3 0.74 1.47 0.73 0.92
## Max 1.25 2.72 1.18 1.22
## MAD 0.30 0.58 0.27 0.40
## IQR 0.39 0.76 0.34 0.51
## CV 0.47 0.51 0.48 0.48
## Skewness 0.48 0.68 0.48 0.14
## SE.Skewness 0.34 0.34 0.34 0.34
## Kurtosis -0.41 -0.12 -0.68 -1.19
## N.Valid 50.00 50.00 50.00 50.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.06724036 0.1449534 0.06400389 0.06861964
## T2 0.14495343 0.3265695 0.13184541 0.14099232
## T3 0.06400389 0.1318454 0.07150247 0.07585212
## T4 0.06861964 0.1409923 0.07585212 0.09946229
n<- 100
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 100
##
## T1 T2 T3 T4
## ----------------- -------- -------- -------- --------
## Mean 0.49 0.98 0.50 0.57
## Std.Dev 0.27 0.57 0.26 0.31
## Min 0.11 0.22 0.11 0.11
## Q1 0.27 0.54 0.29 0.32
## Median 0.43 0.85 0.47 0.55
## Q3 0.66 1.30 0.66 0.76
## Max 1.43 2.70 1.27 1.65
## MAD 0.26 0.52 0.29 0.32
## IQR 0.39 0.76 0.37 0.44
## CV 0.56 0.58 0.52 0.55
## Skewness 0.95 0.99 0.70 0.82
## SE.Skewness 0.24 0.24 0.24 0.24
## Kurtosis 0.64 0.47 0.07 0.44
## N.Valid 100.00 100.00 100.00 100.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.07429898 0.1536635 0.06672958 0.07732104
## T2 0.15366348 0.3271480 0.13731322 0.16003578
## T3 0.06672958 0.1373132 0.06672393 0.07641817
## T4 0.07732104 0.1600358 0.07641817 0.09902518
n<- 1000
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 1000
##
## T1 T2 T3 T4
## ----------------- --------- --------- --------- ---------
## Mean 0.51 1.03 0.51 0.59
## Std.Dev 0.25 0.53 0.24 0.31
## Min 0.05 0.11 0.06 0.07
## Q1 0.33 0.65 0.34 0.37
## Median 0.48 0.94 0.47 0.53
## Q3 0.65 1.36 0.65 0.77
## Max 1.70 3.47 1.57 2.17
## MAD 0.24 0.51 0.23 0.28
## IQR 0.32 0.71 0.31 0.40
## CV 0.49 0.51 0.47 0.52
## Skewness 0.85 0.92 0.85 1.13
## SE.Skewness 0.08 0.08 0.08 0.08
## Kurtosis 0.95 1.12 1.02 2.00
## N.Valid 1000.00 1000.00 1000.00 1000.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.06380381 0.1308502 0.05704420 0.06729503
## T2 0.13085016 0.2795569 0.11415013 0.13477451
## T3 0.05704420 0.1141501 0.05677262 0.06642033
## T4 0.06729503 0.1347745 0.06642033 0.09305661
Una vez obtenidos los datos se observa que el estimador 4 es en el cual se obtienen mejores resultados respecto a insesgadez, debido a que su media se acerca al 0.5. Se observa que el indicador que presenta mayor eficiencia es el 3,debido al comportamiento de su varianza, porque al aumentar el numero de datos aleatorios, se observa que la varianza de los indicadores comienza a disminuir, siendo el indicador 3 el que presenta las mejores condiciones de insesgadez y eficiencia.
De la misma manera, se evidencia que los indicadores 1, 3 y 4 presentan consistencia, lo que se debe a que al incrementar el nĂºmero de datos estos muestran una menor varianza y se acercan a la media poblacional. Por lo que se concluye que el indicador dos es el que no cumple con las condiciones de consistena e insesgadez.