Ejercicio 2: Propiedades de los Estimadores.

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los estimadores propuestos.

Para N=20

m=1000
la=20

x1=rexp(m,1/la)
x2=rexp(m,1/la)
x3=rexp(m,1/la)
x4=rexp(m,1/la)

data <- data.frame(x1,x2,x3,x4)

T1 <- (x1+x2)/6 + (x3+x4)/3
T2 <- (x1+ 2*x2 +3*x3+ 4*x4)/5
T3 <- (x1+x2+x3+x4)/4

minx <- apply(data,1,min)
maxx <- apply(data,1,max)

T4 <- (minx + maxx)/2

dataf <- data.frame(T1,T2,T3,T4)

boxplot(dataf, main="N=20", xlab="Estimadores", ylab="Valores",col="#00F5FF", border="black", notch=TRUE, outline = FALSE, las= 1)
abline(h=la, col="red") 

Propiedades de los estimadores para N=20.

Se puede evidenciar que T1 y T3 son estimadores insesgados, sin embargo, T3 es mas eficiente al tener menos varianza. T2 por su parte es sesgado y T4 aunque es sesgado, tiene menos sesgo que T2 y menos varianza , lo que lo hace mas eficiente. Es importante analizar el comportamiento de T2 y T4 con un numero superior de muestra para validar si se convierten en consistentes.

Data_Medidas <- data.frame(
  media = apply(dataf, 2,mean),
  varianza = apply(dataf, 2, sd)
)
Data_Medidas
##       media varianza
## T1 19.92082 10.69973
## T2 39.59404 21.69473
## T3 19.99950 10.19500
## T4 23.24081 12.70716

Para N=50

m=1000
la=50

x1=rexp(m,1/la)
x2=rexp(m,1/la)
x3=rexp(m,1/la)
x4=rexp(m,1/la)

data <- data.frame(x1,x2,x3,x4)

T1 <- (x1+x2)/6 + (x3+x4)/3
T2 <- (x1+ 2*x2 +3*x3+ 4*x4)/5
T3 <- (x1+x2+x3+x4)/4

minx <- apply(data,1,min)
maxx <- apply(data,1,max)

T4 <- (minx + maxx)/2

dataf <- data.frame(T1,T2,T3,T4)

boxplot(dataf, main="N=50", xlab="Estimadores", ylab="Valores",col="#00F5FF", border="black", notch=TRUE, outline = FALSE, las= 1)
abline(h=la, col="red") 

Propiedades de los estimadores para N=50.

Se puede evidenciar que T1 y T3 siguen siendo estimadores insesgados y T3 sigue siendo mas eficiente al tener menos varianza. T2 por su parte sigue siendo sesgado igual a T4 que sigue siendo mas eficiente al tener menos varianza.

Data_Medidas <- data.frame(
  media = apply(dataf, 2,mean),
  varianza = apply(dataf, 2, sd)
)
Data_Medidas
##       media varianza
## T1 49.87255 26.18773
## T2 99.31919 53.85520
## T3 50.12094 25.05222
## T4 58.84653 31.95931

Para N=100

m=1000
la=100

x1=rexp(m,1/la)
x2=rexp(m,1/la)
x3=rexp(m,1/la)
x4=rexp(m,1/la)

data <- data.frame(x1,x2,x3,x4)

T1 <- (x1+x2)/6 + (x3+x4)/3
T2 <- (x1+ 2*x2 +3*x3+ 4*x4)/5
T3 <- (x1+x2+x3+x4)/4

minx <- apply(data,1,min)
maxx <- apply(data,1,max)

T4 <- (minx + maxx)/2

dataf <- data.frame(T1,T2,T3,T4)

boxplot(dataf, main="N=100", xlab="Estimadores", ylab="Valores",col="#00F5FF", border="black", notch=TRUE, outline = FALSE, las= 1)
abline(h=la, col="red") 

Propiedades de los estimadores para N=100.

Se puede evidenciar que con este tamaño de muestra por primera vez T3 está mas cerca que T1, aunque T3 sigue teniendo menor varianza. T2 y T4 siguen siendo sesgados con alta varianza.

Data_Medidas <- data.frame(
  media = apply(dataf, 2,mean),
  varianza = apply(dataf, 2, sd)
)
Data_Medidas
##       media  varianza
## T1 101.6738  54.07890
## T2 203.7254 111.82780
## T3 101.6083  51.79518
## T4 117.3350  65.35549

Para N=1000

m=1000
la=1000

x1=rexp(m,1/la)
x2=rexp(m,1/la)
x3=rexp(m,1/la)
x4=rexp(m,1/la)

data <- data.frame(x1,x2,x3,x4)

T1 <- (x1+x2)/6 + (x3+x4)/3
T2 <- (x1+ 2*x2 +3*x3+ 4*x4)/5
T3 <- (x1+x2+x3+x4)/4

minx <- apply(data,1,min)
maxx <- apply(data,1,max)

T4 <- (minx + maxx)/2

dataf <- data.frame(T1,T2,T3,T4)

boxplot(dataf, main="N=1000", xlab="Estimadores", ylab="Valores",col="#00F5FF", border="black", notch=TRUE, outline = FALSE, las= 1)
abline(h=la, col="red") 

Propiedades de los estimadores para N=1000.

Se puede evidenciar que con este tamaño de muestra T3 sigue siendoel estimador mas eficiente, T2 y T4 no se convirtieron en consistentes, dado que, su varianza era alta y estaban alejados de la media.

Data_Medidas <- data.frame(
  media = apply(dataf, 2,mean),
  varianza = apply(dataf, 2, sd)
)
Data_Medidas
##        media  varianza
## T1  992.2929  508.5895
## T2 1972.1444 1052.5381
## T3  998.9316  486.6338
## T4 1176.5133  637.2204