library(knitr)
La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son: insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean \(X_1\), \(X_2\), \(X_3\) y \(X_4\) una muestra aleatoria de tamaño \(n=4\) cuya población la conforma una distribución exponencial con parámetro \(θ\) desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\[ \hat{θ_1} = (X_1 + X_2)/6 + (X_3 + X_4)/3 \]
\[ \hat{θ_2} = (X_1 + 2 * X_2 + 3 * X_3 + 4 * X_4) / 5 \]
\[ \hat{θ_3} = (X_1 + X_2 + X_3 + X_4) / 4 \]
\[ \hat{θ_4} = ( min(X_1, X_2, X_3, X_4) + max(X_1, X_2, X_3, X_4) ) / 2 \]
Nota:
Genere una muestras de \(n = 20, 50, 100\) y \(1000\) para cada uno de los estimadores planteados.
En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia
Suponga un valor para el parámetro \(θ\)
Funciones recomendadas: function(){},
rexp(), data.frame(), apply(),
boxplot()
N_SIMULACIONES <- 1000 #Define la cantidad de simulaciones a realizar
THETA_REAL <- 2 #Define el valor real de theta
Paso 1: Definción de los estimadores
#Definición del estimador theta 1 ---------------------------------
theta_1 <- function(x){
return( (x[1] + x[2]) / 6 + (x[3] + x[4]) / 3 )
}
#Definición del estimador theta 2 ---------------------------------
theta_2 <- function(x){
return( (x[1] + 2 * x[2] + 3 * x[3] + 4 * x[4] ) / 5 )
}
#Definición del estimador theta 3 ---------------------------------
theta_3 <- function(x){
return( (x[1] + x[2] + x[3] + x[4]) / 4 )
}
#Definición del estimador theta 4 ---------------------------------
theta_4 <- function(x){
return( (min(x) + max(x)) / 2 )
}
Paso 2: Denifinición de la función encargada de realizar el muestro según el tamaño de n y la cantidad de simulaciones
muestreo <- function(n, valor_theta_real, simulaciones){
#Define el dataframe que guardará el resultado de las simulaciones
estimaciones = data.frame(
theta_1 = numeric(0),
theta_2 = numeric(0),
theta_3 = numeric(0),
theta_4 = numeric(0)
)
#Ejecución de las simulaciones
for (i in 1:simulaciones) {
x_muestra = rexp(n, rate = (1/valor_theta_real))
nuevo_registro <- data.frame(
theta_1 = theta_1(x = x_muestra),
theta_2 = theta_2(x = x_muestra),
theta_3 = theta_3(x = x_muestra),
theta_4 = theta_4(x = x_muestra)
)
estimaciones <- rbind(estimaciones, nuevo_registro)
}
return(estimaciones)
}
Paso 3: Para calcular el sesgo de cada estimador se utilizó la siguiente ecuación:\[ Sesgo = θ_{verdadero} - Promedio(\hat {θ}) \]
Donde:
\(\hat{θ}\) son las estimaciones realizadas por cada estimador
sesgo <- function(theta_verd, theta_est){
return( theta_verd - mean(theta_est) )
}
Paso 4: Para calcular la eficiencia de cada estimador se utilizó la siguiente ecuación
\[ Eficiencia = Varianza Del Estimador + (SesgoDelEstimador)^2 \]
eficiencia <- function(sesgo_est, theta_est){
return( var(theta_est) + (sesgo_est) ^ 2 )
}
Paso 5: Para calcular la consistencia de cada estimador se utilizó la siguiente ecuación
\[ Consistencia = (1/n) * \sum_{i=1}^{n} (\hat {θ} - θ_{verdadero})^2 \]
consistencia <- function(theta_verd, theta_est, n){
sumatoria <- 0
for (i in 1:n) {
sumatoria <- sumatoria + (theta_est[i] - theta_verd) ^ 2
}
return(sumatoria / n)
}
Paso 6: Función encargada de cálcular las propiedades de los estimadores
propiedades_estimadores <- function(tamanio_muestra) {
#Cálculo del tamanio de la muestra
muestra <- muestreo(
n = tamanio_muestra,
valor_theta_real = THETA_REAL,
simulaciones = N_SIMULACIONES
)
vector_theta <- c('theta_1', 'theta_2', 'theta_3', 'theta_4')
#Dataframe para almacenar las propiedades de los cuatro estimadores
propiedades <- data.frame(
sesgo = numeric(0),
eficiencia = numeric(0),
consistencia = numeric(0)
)
for (i in 1:4) {
#Cálculo del sesgo
val_sesgo <- sesgo(
theta_verd = THETA_REAL,
theta_est = muestra[[vector_theta[i]]]
)
#Cálculo de la eficiencia
val_eficiencia <- eficiencia(
sesgo_est = val_sesgo,
theta_est = muestra[[vector_theta[i]]]
)
#Cálculo de la consistencia
val_consistencia <- consistencia(
theta_verd = THETA_REAL,
theta_est = muestra[[vector_theta[i]]],
n = tamanio_muestra
)
nuevo_registro <- data.frame(
sesgo = val_sesgo,
eficiencia = val_eficiencia,
consistencia = val_consistencia
)
propiedades <- rbind(propiedades, nuevo_registro)
}
rownames(propiedades) <- vector_theta
return(propiedades)
}
Paso 7: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=20\)
kable(propiedades_estimadores(tamanio_muestra = 20))
| sesgo | eficiencia | consistencia | |
|---|---|---|---|
| theta_1 | -0.0193546 | 1.146958 | 1.2100772 |
| theta_2 | -2.0504656 | 9.275935 | 9.3900683 |
| theta_3 | -0.0344365 | 1.073887 | 0.8513522 |
| theta_4 | -1.6738787 | 4.425588 | 4.9091157 |
Paso 8: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=50\)
kable(propiedades_estimadores(tamanio_muestra = 50))
| sesgo | eficiencia | consistencia | |
|---|---|---|---|
| theta_1 | 0.0295579 | 1.0897998 | 1.264263 |
| theta_2 | -1.9364824 | 8.3515079 | 10.016322 |
| theta_3 | 0.0265222 | 0.9964499 | 1.019615 |
| theta_4 | -2.5105701 | 7.9507832 | 6.537535 |
Paso 9: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=100\)
kable(propiedades_estimadores(tamanio_muestra = 100))
| sesgo | eficiencia | consistencia | |
|---|---|---|---|
| theta_1 | 0.0858914 | 1.0574711 | 1.298671 |
| theta_2 | -1.8284731 | 7.8564415 | 9.678618 |
| theta_3 | 0.0891418 | 0.9825276 | 1.251668 |
| theta_4 | -3.2551946 | 12.1851526 | 12.894553 |
Paso 10: Cálculo del sesgo, eficiencia y consistencia para \(\hat {θ_1}\), \(\hat {θ_2}\), \(\hat {θ_3}\) y \(\hat {θ_4}\) para \(n=1000\)
kable(propiedades_estimadores(tamanio_muestra = 1000))
| sesgo | eficiencia | consistencia | |
|---|---|---|---|
| theta_1 | 0.0261922 | 1.0030144 | 1.0020121 |
| theta_2 | -1.9567492 | 8.1992458 | 8.1948754 |
| theta_3 | 0.0363486 | 0.8723245 | 0.8714535 |
| theta_4 | -5.5006659 | 31.8139241 | 31.8123675 |
Entre los cuatro estimadores se considera que el estimador 3 sobresale como la elección óptima por las siguientes razones:
Durante las simulaciones con diversos tamaños de muestra, este estimador tiende a exhibir el menor sesgo.
De los cuatro, este estimador destaca por su eficiencia sobresaliente.
Además, se nota que su consistencia es relativamente baja y empieza a decrecer a medida que se aumenta el tamaño de las muestras.