knitr::opts_chunk$set(echo = TRUE,comment = NA)
set.seed(123)

Propiedades de los estimadores



La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

quí está la imagen redimensionada a 500 píxeles de ancho:

Para \(n = 20\)

# Instalar y cargar el paquete magick
#install.packages("magick")

estimador <- function(en) {
n = en
x1 = rexp(n,10 ) #rate es una frecuencia
x2 = rexp(n,10)
x3 = rexp(n,10)
x4 = rexp(n,10)

data = data.frame(
t1 = (x1+x2)/6 + (x3+x4)/3,
t2 = (x1 + 2*x2 + 3*x3 + 4*x4)/5,
t3 = (x1 + x2 + x3 + x4)/4,
#t4 = (min(c(x1, x2, x3, x4)) + max(c(x1, x2, x3, x4)))/2)
t4 = (pmin(x1, x2, x3, x4) + pmax(x1, x2, x3, x4))/2)

boxplot(data, las=1)
abline(h=1/10, col="red")
grid()

  
}
cat("Número de Muestras:20")
Número de Muestras:20
resultado <- estimador(20)

Analisis: Para la muestra de 20 se observa que las medianas de t1 , t3 y t4 están cerca de 0.1 lo cual indica que los estimadores pueden tener un sesgo pequeño. Por el contrario de t2 en donde se ve que la mediana es mayor a 0.1 por lo cual el estimador esta sesgado y tiene mucha mas dispersión.

Al tener los estimadores insesgados estos son mas eficientes, sobre esta muestra pareciera que los indicadores t1, t2 y t3 son consistentes.

cat("Número de Muestras:50")
Número de Muestras:50
resultado <- estimador(50)

Analisis: Para la muestra de 50 se observa que las medianas de t1 , t3 y t4 están cerca de 0.1 lo cual indica que los estimadores siguen siendo insesgadoz, El valor de la media es cercano al valor teorico.

Al tener los estimadores insesgadoz estos son mas eficientes, sobre esta muestra pareciera que los indicadores t1, t2 y t3 son consistentes pero para tener un nivel mas a detalle se evaluara en muestras mas grandes.

cat("Número de Muestras:100")
Número de Muestras:100
resultado <- estimador(100)

Analisis: En cuanto Insesgadez para t1, t3 y t4, la mediana esta cerca de la línea roja. Lo que indica que son esttimadores con un sesgo bajo. t2 esta lejos de la línea roja, lo que indica que el estimador esta sesgado.

Eficiencia: t2 tiene una caja más amplia, lo cuál indica una mayor varianza y menor eficiencia. t1, t3 y t4 tienen varianzas más bajas, lo cuál indica que son más eficientes.

Consistencia. t1, t3 y t4 parecen más consistentes, ya que sus estimaciones están cerca del valor teórico. t2 esta más lejos del valor esperado y presenta mayor dispersión, por lo cuál parece menos consistente.

cat("Número de Muestras:1000")
Número de Muestras:1000
resultado <- estimador(1000)

Analisis: A nivel de Insesgadez t1, t3 y t4 estan bastante cerca de la línea roja, lo que indica que tienen un sesgo mínimo. t2 continua por encima de la línea roja, lo que indica que esta sesgado.

Las cajas de t1, t3 y t4 son pequeñas, lo cuál indica una varianza baja y por tanto alta eficiencia. t2 muestra una caja más grande y un rango intercuatílico más amplio, lo que sugiere una varianza mayor y menos eficiencia. Tambíen se observan un número significativo de valores atípicos que incrementan la dispersión.

Consistencia. El tamaño de la muestra ha permitido que las estimaciones de t1, t3 y t4 se acerquen más al valor teórico con menor dispersión, lo cuál sugiere mayor consistencia.

t2 sigue presentando dispersión, pero presenta alguna mejora en consistencia con el incremento del tamaño de la muestra. Pero sigue siendo el menos consistente de los cuatro.