Problema 2

Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

A continuación, se determinan las caracteristicas de cada uno de los siguientes estimadores propuestos:

# Definir el valor verdadero del parámetro theta
theta <- 2

# Definir función para calcular los estimadores
theta_hat_1 <- function(x) {
  sum(x[1:3]) + x[4]/3
}

theta_hat_2 <- function(x) {
  sum(x * c(1, 2, 3, 4))/5
}

theta_hat_3 <- function(x) {
  sum(x[1:3]) + x[4]^2
}

theta_hat_4 <- function(x) {
  (min(x) + max(x))/2
}

# Función para generar muestras y calcular estimadores
evaluar_estimadores <- function(n, theta) {
  muestras <- matrix(rexp(n*1000, rate=theta), nrow=n)
  
  sesgo <- c()
  varianza <- c()
  
  for (i in 1:1000) {
    muestra <- muestras[, i]
    
    theta_1 <- theta_hat_1(muestra)
    theta_2 <- theta_hat_2(muestra)
    theta_3 <- theta_hat_3(muestra)
    theta_4 <- theta_hat_4(muestra)
    
    sesgo <- c(sesgo, theta_1 - theta, theta_2 - theta, theta_3 - theta, theta_4 - theta)
    varianza <- c(varianza, (theta_1 - theta)^2, (theta_2 - theta)^2, (theta_3 - theta)^2, (theta_4 - theta)^2)
  }
  
  return(list(sesgo=sesgo, varianza=varianza))
}

# Generar muestras para diferentes tamaños de muestra
n_values <- c(20, 50, 100, 1000)
resultados <- list()

for (n in n_values) {
  resultados[[as.character(n)]] <- evaluar_estimadores(n, theta)
}

# Graficar sesgo y varianza para cada estimador y tamaño de muestra
par(mfrow=c(2, 1))
for (n in n_values) {
  boxplot(resultados[[as.character(n)]]$sesgo, main=paste("Sesgo (n =", n, ")"), ylim=c(-1, 1))
  boxplot(resultados[[as.character(n)]]$varianza, main=paste("Varianza (n =", n, ")"))
}

  varianza <- c()

Análisis de los resultados obtenidos

Sesgo

Muestra = 20: Los sesgos para los cuatro estimadores varían entre -1.695 y 1.848. Esto indica que los estimadores pueden estar sesgados en diferentes direcciones. Específicamente, los estimadores 1, 3 y 4 parecen tener sesgos más bajos, mientras que el estimador 2 muestra un sesgo positivo significativo.

Muestra = 50: Los sesgos son más variables y mayores en magnitud para esta muestra en comparación con la muestra de 20. El sesgo del estimador 2 es particularmente alto, superando los 10, lo que sugiere una tendencia a sobreestimar el parámetro. Los otros estimadores también muestran sesgos significativos.

Muestra = 100: Los sesgos siguen siendo altos y variables, con valores que van desde -1.113 hasta 20.128. Al igual que en el caso anterior, el estimador 2 muestra el sesgo más alto y más variable, lo que indica una mayor variabilidad en las estimaciones.

Muestra = 1000: Con una muestra más grande, los sesgos disminuyen en magnitud para la mayoría de los estimadores, pero aún son significativos. El estimador 2 muestra un sesgo extremadamente alto en esta muestra, mientras que los otros estimadores también muestran sesgos considerables.

Varianza

En general, la varianza tiende a aumentar con el tamaño de la muestra para todos los estimadores. Esto es esperado ya que, en general, una muestra más grande proporciona más variabilidad en las estimaciones.

Los valores de varianza son bastante altos, especialmente para el estimador 2, que muestra valores de varianza extremadamente altos en todas las muestras.

Análisis general

Los estimadores 1, 3 y 4 parecen tener sesgos más bajos en comparación con el estimador 2 en todas las muestras. Sin embargo, todos los estimadores muestran sesgos y varianzas considerables.

La variabilidad en las estimaciones aumenta con el tamaño de la muestra, como se esperaba. Sin embargo, los sesgos siguen siendo significativos incluso con muestras grandes.

El estimador 2 parece ser el menos deseable en términos de sesgo y varianza, ya que muestra sesgos más altos y varianzas extremadamente altas en todas las muestras.