Problema 2
Propiedades de los estimadores La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\[ θ1ˆ=(X1+X2)/6+(X3+X4)/3 \]
\[ θ2ˆ=(X1+2X2+3X3+4X4)/5 \] \[ θ3ˆ=(X1+X2+X3+X4)/4 \] \[ θ4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2 \] # Simulación con n=50
n<- 50
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 50
##
## T1 T2 T3 T4
## ----------------- -------- -------- -------- --------
## Mean 0.51 1.02 0.51 0.62
## Std.Dev 0.27 0.55 0.25 0.36
## Min 0.09 0.17 0.09 0.08
## Q1 0.32 0.64 0.36 0.42
## Median 0.47 0.92 0.48 0.58
## Q3 0.66 1.27 0.67 0.75
## Max 1.53 2.99 1.29 1.92
## MAD 0.26 0.45 0.20 0.25
## IQR 0.32 0.61 0.29 0.33
## CV 0.54 0.54 0.48 0.58
## Skewness 1.23 1.32 0.85 1.57
## SE.Skewness 0.34 0.34 0.34 0.34
## Kurtosis 2.33 2.50 0.81 3.40
## N.Valid 50.00 50.00 50.00 50.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.07553613 0.1475269 0.06337567 0.07908983
## T2 0.14752692 0.3029312 0.11899288 0.14473061
## T3 0.06337567 0.1189929 0.06056833 0.07962072
## T4 0.07908983 0.1447306 0.07962072 0.12882836
n<- 50
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 50
##
## T1 T2 T3 T4
## ----------------- -------- -------- -------- --------
## Mean 0.47 0.95 0.47 0.54
## Std.Dev 0.23 0.46 0.23 0.28
## Min 0.11 0.19 0.09 0.13
## Q1 0.30 0.62 0.30 0.31
## Median 0.42 0.85 0.41 0.46
## Q3 0.60 1.22 0.65 0.73
## Max 1.17 2.33 1.03 1.21
## MAD 0.21 0.43 0.23 0.25
## IQR 0.30 0.59 0.34 0.39
## CV 0.49 0.48 0.50 0.53
## Skewness 0.83 0.84 0.68 0.77
## SE.Skewness 0.34 0.34 0.34 0.34
## Kurtosis 0.36 0.41 -0.45 -0.51
## N.Valid 50.00 50.00 50.00 50.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.05138002 0.10139805 0.04962848 0.05872506
## T2 0.10139805 0.20988415 0.09606406 0.11388044
## T3 0.04962848 0.09606406 0.05299053 0.05956735
## T4 0.05872506 0.11388044 0.05956735 0.07912130
n<- 100
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 100
##
## T1 T2 T3 T4
## ----------------- -------- -------- -------- --------
## Mean 0.50 1.02 0.51 0.58
## Std.Dev 0.25 0.53 0.22 0.29
## Min 0.12 0.21 0.14 0.13
## Q1 0.32 0.65 0.34 0.37
## Median 0.46 0.91 0.50 0.51
## Q3 0.66 1.32 0.64 0.79
## Max 1.35 2.90 1.16 1.49
## MAD 0.25 0.43 0.22 0.26
## IQR 0.33 0.65 0.30 0.41
## CV 0.49 0.52 0.43 0.50
## Skewness 0.86 1.02 0.52 0.77
## SE.Skewness 0.24 0.24 0.24 0.24
## Kurtosis 0.66 0.90 -0.07 0.34
## N.Valid 100.00 100.00 100.00 100.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.06015845 0.1277190 0.05058905 0.06026713
## T2 0.12771897 0.2810491 0.10341132 0.12442601
## T3 0.05058905 0.1034113 0.04844328 0.05908480
## T4 0.06026713 0.1244260 0.05908480 0.08523624
n<- 1000
x1<-rexp(n,2)
x2<-rexp(n,2)
x3<-rexp(n,2)
x4<-rexp(n,2)
base <- data.frame(x1, x2, x3, x4)
fx1 <- function(x){
(x[1]+x[2])/6+(x[3]+x[4])/3
}
fx2 <- function(x){
(x[1]+ 2*x[2]+3*x[3]+4*x[4])/5
}
fx3 <- function(x){
(x[1]+x[2]+x[3]+x[4])/4
}
fx4 <- function(x){
(min(x[1],x[2],x[3],x[4])+ max(x[1],x[2],x[3],x[4]))/2
}
T1 <- apply(base,1,fx1)
T2 <- apply(base,1,fx2)
T3 <- apply(base,1,fx3)
T4 <- apply(base,1,fx4)
T1234<- data.frame(T1,T2,T3,T4)
boxplot(T1234)
abline(h=0.5, col= "red")
summarytools::descr(T1234)
## Descriptive Statistics
## T1234
## N: 1000
##
## T1 T2 T3 T4
## ----------------- --------- --------- --------- ---------
## Mean 0.49 0.99 0.50 0.57
## Std.Dev 0.25 0.53 0.24 0.29
## Min 0.04 0.08 0.05 0.07
## Q1 0.31 0.59 0.32 0.35
## Median 0.45 0.89 0.45 0.51
## Q3 0.64 1.29 0.64 0.72
## Max 1.62 3.71 1.35 1.95
## MAD 0.23 0.50 0.23 0.27
## IQR 0.33 0.69 0.33 0.36
## CV 0.51 0.54 0.49 0.52
## Skewness 0.88 0.99 0.77 1.03
## SE.Skewness 0.08 0.08 0.08 0.08
## Kurtosis 0.66 1.11 0.38 1.36
## N.Valid 1000.00 1000.00 1000.00 1000.00
## Pct.Valid 100.00 100.00 100.00 100.00
var(T1234)
## T1 T2 T3 T4
## T1 0.06433498 0.1321660 0.05809184 0.06518499
## T2 0.13216603 0.2815780 0.11695322 0.13197852
## T3 0.05809184 0.1169532 0.05820553 0.06471633
## T4 0.06518499 0.1319785 0.06471633 0.08650529
A partir de los resultados es posible evidenciar que el estimador 4 es el que presenta mejores resultados en cuanto a insesgadez, debido a que su media se acerca al 0.5 y el indicador que presenta mayor eficiencia es el 3, por el comportamiento de su varianza. al aumentar el numero de datos aleatorios, se observa que la varianza de los indicadores comienza a disminuir, siendo el indicador 3 el que presenta las mejores condiciones de insesgadez y eficiencia, debido a que n=1000 datos, la varianza es de 0.062.
De la misma manera, se evidencia que los indicadores 1, 3 y 4 presentan consistencia, lo que se debe a que al incrementar el número de datos estos muestran una menor varianza y se acercan a la media poblacional.De esta forma se concluye que el indicador dos es el que incumple con las condiciones de consistena e insesgadez.