1. Propiedades de los estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

2. Objetivo

Analizar y evaluar las propiedades de los estimadores estadísticos en el contexto de la estimación de un parámetro θ en una distribución exponencial para cuatro estimadores diferentes.

3. Procedimiento

A continuación, se detalla el proceso para llevar a cabo estas simulaciones utilizando el lenguaje de programación R.

a) Definición de los estimadores

Se definen cuatro estimadores diferentes (θ^1, θ^2, θ^3 y θ^4) como funciones matemáticas que toman una muestra de cuatro valores (X1, X2, X3, X4) como entrada.
estimador1 <- function(x) {
  return((x[1] + x[2])/6 + (x[3] + x[4])/3)
}

estimador2 <- function(x) {
  return((x[1] + 2*x[2] + 3*x[3] + 4*x[4])/5)
}

estimador3 <- function(x) {
  return(mean(x))
}

estimador4 <- function(x) {
  return((min(x) + max(x))/2)
}

b) Definición de las poblaciones

Se establecen cuatro tamaños de población diferentes (20, 50, 100, 1000), cada una siguiendo una distribución exponencial con un parámetro θ=2. Además, se especifica la realización de 1000 simulaciones, y se prepara un vector para almacenar los resultados obtenidos de los cuatro estimadores.
theta <- 1
tamaño <- c(20, 50, 100, 1000)
num_simulations <- 1000

resultados <- data.frame()

c) Definición de los estimadores extrapolados para muestras de tamaño n:

A continuación, se definen los estimadores para tamaños de muestra mayores a 4, con el objetivo de obtener los parámetros de la población y realizar análisis de sesgo con respecto a dichos parámetros. Es importante señalar que se hace una excepción para el estimador 1, ya que no es posible extrapolarlo para tamaños de muestra mayores de 4 debido a su estructura específica.
estimadorr2 <- function(x) {
  n <- length(x)  # Obtener el tamaño de la muestra
  pesos <- 1:n    # Definir los pesos como 1, 2, 3, ... hasta n
  return(sum(x * pesos) / sum(pesos))
}

estimadorr3 <- function(x) {
  n <- length(x)  # Obtener el tamaño de la muestra
  return(sum(x) / n)
}

estimadorr4 <- function(x) {
  n <- length(x)  # Obtener el tamaño de la muestra
  return((min(x) + max(x)) / 2)
}

c) Calculo de las estimaciones

En esta sección, se calculan los cuatro estimadores utilizando muestras de tamaño 4 en 1000 ocasiones para cada uno de los tamaños de la población.
# Vectores para almacenar las medias de los estimadores

for (n in tamaño) {
  estimacion1 <- estimacion2 <- estimacion3 <- estimacion4 <-       numeric(num_simulations)
  sample_data <- rexp(n, 1/theta)
  es2<-estimadorr2(sample_data)
  es3<-estimadorr3(sample_data)
  es4<-estimadorr4(sample_data)
  
  
  

  
  

  for (i in 1:num_simulations) {
# Obtener cuatro índices aleatorios
    indices_aleatorios <- sample(1:length(sample_data), 4)

# Seleccionar los valores correspondientes
    valores_aleatorios <- sample_data[indices_aleatorios]

    estimacion1[i] <- estimador1(valores_aleatorios)
    estimacion2[i] <- estimador2(valores_aleatorios)
    estimacion3[i] <- estimador3(valores_aleatorios)
    estimacion4[i] <- estimador4(valores_aleatorios)
    

    
  }
  
      
# Crear un data frame con las estimaciones
  estimacioness <- data.frame(
  Estimador1 = estimacion1,
  Estimador2 = estimacion2,
  Estimador3 = estimacion3,
  Estimador4 = estimacion4
)

# Crear un boxplot para las estimaciones
  print(paste("Boxplot para poblacion: ",n))

  boxplot(estimacioness, main = "Boxplot de Estimaciones", ylab = "Valor Estimado")
    
 
    Mean1 = mean(estimacion1)
    Mean2 = mean(estimacion2)
    Mean3 = mean(estimacion3)
    Mean4 = mean(estimacion4)
    print(paste("Población de:",n))
    print(paste("media muestral estimador 1: ",Mean1))
    print(paste("media muestral estimador 2: ",Mean2))
    print(paste("media muestral estimador 3: ",Mean3))
    print(paste("media muestral estimador 4: ",Mean4))
    print(paste("Parametro 2: ",es2))
    print(paste("Parametro 3: ",es3))
    print(paste("Parametro 4: ",es4))
    
    sesgo2=Mean2-es2
    sesgo3=Mean2-es3
    sesgo4=Mean2-es4
    
    print(paste("sesgo 2: ",sesgo2))
    print(paste("sesgo 3: ",sesgo3))
    print(paste("sesgo 4: ",sesgo4))
    
    
# Calcular la varianza de cada estimador
   varianza_estimador1 <- var(estimacion1)
   varianza_estimador2 <- var(estimacion2)
   varianza_estimador3 <- var(estimacion3)
   varianza_estimador4 <- var(estimacion4)

# Imprimir los resultados
  cat("Varianza de Estimador 1:", varianza_estimador1, "\n")
  cat("Varianza de Estimador 2:", varianza_estimador2, "\n")
  cat("Varianza de Estimador 3:", varianza_estimador3, "\n")
  cat("Varianza de Estimador 4:", varianza_estimador4, "\n")

  

}
## [1] "Boxplot para poblacion:  20"

## [1] "Población de: 20"
## [1] "media muestral estimador 1:  0.711637715271799"
## [1] "media muestral estimador 2:  1.42116794368318"
## [1] "media muestral estimador 3:  0.714175339256405"
## [1] "media muestral estimador 4:  0.857634899212481"
## [1] "Parametro 2:  0.692981713580837"
## [1] "Parametro 3:  0.710854782609833"
## [1] "Parametro 4:  1.42053229698481"
## [1] "sesgo 2:  0.728186230102345"
## [1] "sesgo 3:  0.710313161073349"
## [1] "sesgo 4:  0.00063564669837457"
## Varianza de Estimador 1: 0.1187043 
## Varianza de Estimador 2: 0.5172421 
## Varianza de Estimador 3: 0.104295 
## Varianza de Estimador 4: 0.1742933 
## [1] "Boxplot para poblacion:  50"

## [1] "Población de: 50"
## [1] "media muestral estimador 1:  0.895600809060716"
## [1] "media muestral estimador 2:  1.79364988250307"
## [1] "media muestral estimador 3:  0.895157761275475"
## [1] "media muestral estimador 4:  0.996349575521824"
## [1] "Parametro 2:  0.769402257331164"
## [1] "Parametro 3:  0.924897810813665"
## [1] "Parametro 4:  1.60129716588164"
## [1] "sesgo 2:  1.0242476251719"
## [1] "sesgo 3:  0.868752071689402"
## [1] "sesgo 4:  0.192352716621424"
## Varianza de Estimador 1: 0.1680875 
## Varianza de Estimador 2: 0.7408597 
## Varianza de Estimador 3: 0.148435 
## Varianza de Estimador 4: 0.1847138 
## [1] "Boxplot para poblacion:  100"

## [1] "Población de: 100"
## [1] "media muestral estimador 1:  1.04617454102572"
## [1] "media muestral estimador 2:  2.09266779260679"
## [1] "media muestral estimador 3:  1.04855734277144"
## [1] "media muestral estimador 4:  1.14838139992579"
## [1] "Parametro 2:  0.927798489100828"
## [1] "Parametro 3:  1.04719068833085"
## [1] "Parametro 4:  1.86498357973735"
## [1] "sesgo 2:  1.16486930350596"
## [1] "sesgo 3:  1.04547710427594"
## [1] "sesgo 4:  0.227684212869435"
## Varianza de Estimador 1: 0.189058 
## Varianza de Estimador 2: 0.8042564 
## Varianza de Estimador 3: 0.1738691 
## Varianza de Estimador 4: 0.1875844 
## [1] "Boxplot para poblacion:  1000"

## [1] "Población de: 1000"
## [1] "media muestral estimador 1:  1.02571318506042"
## [1] "media muestral estimador 2:  2.05332606798638"
## [1] "media muestral estimador 3:  1.03075323352897"
## [1] "media muestral estimador 4:  1.20091485314166"
## [1] "Parametro 2:  0.993354567233716"
## [1] "Parametro 3:  1.02397933306836"
## [1] "Parametro 4:  3.14281371230003"
## [1] "sesgo 2:  1.05997150075267"
## [1] "sesgo 3:  1.02934673491803"
## [1] "sesgo 4:  -1.08948764431365"
## Varianza de Estimador 1: 0.2862705 
## Varianza de Estimador 2: 1.267284 
## Varianza de Estimador 3: 0.2657791 
## Varianza de Estimador 4: 0.4202108

d) Análisis

Población 20:

En la población de tamaño 20, el Estimador 4 exhibió el sesgo más cercano a cero, indicando que es el estimador mas insesgado en esta población. Por otro lado, el Estimador 3 presentó la varianza más baja, lo que lo convierte en el estimador más eficiente en términos de varianza. El Estimador 2 tuvo un sesgo positivo y una varianza relativamente alta, lo que indica que es menos preciso y tiende a sobreestimar el parámetro. El Estimador 1 no se evaluó en términos de sesgo debido a la falta de información sobre el parámetro verdadero, pero mostró una varianza relativamente baja en comparación con los Estimadores 2 y 4.

Población 50:

En la población de tamaño 50, el Estimador 4 exhibió el sesgo más cercano a cero, indicando que es el estimador insesgado en esta población. Por otro lado, los Estimadores 2 y 3 presentaron sesgos positivos, lo que indica que tienden a sobreestimar el parámetro poblacional. El Estimador 3 tiene un sesgo ligeramente menor que el Estimador 2.
En términos de eficiencia, el Estimador 3 sigue siendo el estimador con la varianza más baja, lo que lo convierte en el estimador más preciso en términos de varianza. El Estimador 1 tiene la segunda varianza más baja. Los Estimadores 2 y 4 tienen varianzas más altas en comparación con los Estimadores 1 y 3, lo que indica que son menos precisos en términos de varianza.En general, el Estimador 4 es el más insesgado, pero el Estimador 3 es el más eficiente en términos de varianza en esta población de tamaño 50.

Población :100

En la población de tamaño 100, el Estimador 4 exhibió el sesgo más cercano a cero, lo que indica que es el estimador insesgado en esta población. Por otro lado, los Estimadores 2 y 3 presentaron sesgos positivos, indicando que tienden a sobreestimar el parámetro poblacional. El Estimador 3 tiene un sesgo ligeramente mayor que el Estimador 2.
En cuanto a la eficiencia, el Estimador 3 sigue siendo el estimador con la varianza más baja, lo que lo convierte en el estimador más preciso en términos de varianza. El Estimador 1 tiene la segunda varianza más baja. Los Estimadores 2 y 4 tienen varianzas más altas en comparación con los Estimadores 1 y 3, lo que indica que son menos eficientes en términos de varianza.

Población : 1000

En la población de tamaño 1000, el Estimador 3 mostró el sesgo más cercano a cero, indicando que es el estimador insesgado en esta población. Por otro lado, el estimador 4 exhibió un sesgo negativo considerable, lo que sugiere que tiende a subestimar el parámetro poblacional. El Estimador 2 también mostró un sesgo positivo, aunque menor que el Estimador 4.
En términos de eficiencia, el Estimador 3 sigue siendo el estimador con la varianza más baja, lo que lo convierte en el estimador más preciso en términos de varianza. El Estimador 1 tiene la segunda varianza más baja. Los Estimadores 2 y 4 tienen varianzas más altas en comparación con los Estimadores 1 y 3, lo que indica que son menos precisos en términos de varianza.
El análisis de los resultados se ve respaldado y complementado de manera efectiva al observar detenidamente las gráficas boxplot correspondientes a cada población. Estas visualizaciones proporcionan una representación gráfica de las estadísticas resumidas previamente y permiten una comprensión más profunda de la distribución de los datos y la presencia de posibles valores atípicos evidentemente.

e) Conclusiones:

a) En cuanto a la eficiencia, se observó que el Estimador 3 mantuvo la varianza más baja en la mayoría de los casos, lo que lo convierte en el estimador más preciso en términos de varianza. Esta eficiencia se refleja en una menor dispersión en las estimaciones y, por lo tanto, en una mayor consistencia en la precisión de las estimaciones a lo largo de las simulaciones.
b) El Estimador 2, por otro lado, presentó sesgos positivos en la mayoría de los casos y varianzas relativamente altas, lo que indicó una menor insesgadez y eficiencia en comparación con los otros estimadores.
c) El Estimador 1, aunque no se evaluó en términos de sesgo debido a la falta de información sobre el parámetro verdadero, mostró una varianza relativamente baja en comparación con los Estimadores 2 y 4, lo que sugiere que podría ser una opción razonable cuando la insesgadez es una prioridad.