Problema 2

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

\[\hat{θ1} = (X_1+X_2)/6 + (X_3 + X_4)/3\] \[\hat{θ2} = (X_1+2X_2+3X_3 + 4X_4)/5\] \[\hat{θ3} = (X_1+X_2+X_3 + X_4)/4\] \[\hat{θ4} = (min{X_1,X_2,X_3,X_4} + max{X_1,X_2,X_3,X_4})/2\]

Iniciamos realizando la importación de librerias necesarias para nuestro proceso.

if(!require(tidyverse)){
  install.packages(tidyverse)
  
}
library(tidyverse)

if(!require(dplyr)){
  install.packages(dplyr)
  
}
library(dplyr)

if(!require(tidyr)){
  install.packages(tidyr)
  
}
library(tidyr)

# Instalaremos y cargaremos la librería ggplot2 si aún no está instalada
if (!require(ggplot2)) {
  install.packages("ggplot2")
}
library(ggplot2)

#Creación de Vectores y listas para los resultados de iteración

M1 <- vector("numeric") 
M2 <- vector("numeric")
M3 <- vector("numeric")
M4 <- vector("numeric")

l1 <- list()
l2 <- list()
l3 <- list()
l4 <- list()

Definimos nuestra variable muestra a partir de la definición de una distribución exponencial.

lambda <- 2 #Factor lambda
n <- 4 #Tamaño muestra

muestra <- rexp(n,lambda)

A continuación realizamos la definición de la función que iterara x veces a partir de un valor x para Determinar las características de cada uno de los siguientes estimadores propuestos.

estimadores <- function(x){
  M1 <- numeric(x)
  M2 <- numeric(x)
  M3 <- numeric(x)
  M4 <- numeric(x)
  
  for (i in seq(1, x)){
    muestra <- rexp(4, rate = 1)  # Generar una muestra aleatoria de tamaño 4 desde una exponencial
    
    M1[i] <- (muestra[1] + muestra[2])/6 + (muestra[3] + muestra[4])/3 
    M2[i] <- (muestra[1] + 2*muestra[2] + 3*muestra[3] + 4*muestra[4])/5
    M3[i] <- (muestra[1] + muestra[2] + muestra[3] + muestra[4])/4
    M4[i] <- (min(c(muestra[1], muestra[2], muestra[3], muestra[4])) + max(c(muestra[1], muestra[2], muestra[3], muestra[4])))/2
  }

  # Creación de un dataframe para los estimadores
  df <- data.frame(
    M1 = M1,
    M2 = M2,
    M3 = M3,
    M4 = M4
  )

  # Crear un dataframe largo (long) para la gráfica
  df_p <- df %>% 
    pivot_longer(cols = c(M1, M2, M3, M4), names_to = "Estimadores", values_to = "Valores")

  # Graficar
  grafica <- ggplot(df_p, aes(x = Estimadores, y = Valores, fill = Estimadores)) +
    geom_boxplot() +
    geom_jitter(alpha = 0.5)
  
  print(grafica)

  return(list(
    valores_estadisticos = cat(
      paste("Media primer estimador:", round(mean(M1), 2)),
      paste("Media segundo estimador:", round(mean(M2), 2)),
      paste("Media tercer estimador:", round(mean(M3), 2)),
      paste("Media cuarto estimador:", round(mean(M4), 2)),
      paste("Varianza primer estimador:", round(var(M1), 2)),
      paste("Varianza segundo estimador:", round(var(M2), 2)),
      paste("Varianza tercer estimador:", round(var(M3), 2)),
      paste("Varianza cuarto estimador:", round(var(M4), 2)),
      sep = "\n"
    ))
    )
}

MODELO CON 20 ITERACIONES

resultados <- estimadores(20)

## Media primer estimador: 0.85
## Media segundo estimador: 1.73
## Media tercer estimador: 0.85
## Media cuarto estimador: 1.05
## Varianza primer estimador: 0.18
## Varianza segundo estimador: 1.09
## Varianza tercer estimador: 0.12
## Varianza cuarto estimador: 0.32

MODELO CON 50 ITERACIONES

resultados <- estimadores(50)

## Media primer estimador: 0.99
## Media segundo estimador: 1.97
## Media tercer estimador: 1.04
## Media cuarto estimador: 1.26
## Varianza primer estimador: 0.25
## Varianza segundo estimador: 1.08
## Varianza tercer estimador: 0.26
## Varianza cuarto estimador: 0.52

MODELO CON 100 ITERACIONES

resultados <- estimadores(100)

## Media primer estimador: 1.03
## Media segundo estimador: 2.06
## Media tercer estimador: 1.02
## Media cuarto estimador: 1.2
## Varianza primer estimador: 0.32
## Varianza segundo estimador: 1.27
## Varianza tercer estimador: 0.27
## Varianza cuarto estimador: 0.46

MODELO CON 1000 ITERACIONES

resultados <- estimadores(1000)

## Media primer estimador: 0.99
## Media segundo estimador: 1.99
## Media tercer estimador: 1
## Media cuarto estimador: 1.17
## Varianza primer estimador: 0.28
## Varianza segundo estimador: 1.25
## Varianza tercer estimador: 0.26
## Varianza cuarto estimador: 0.41