La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\[\hat{θ1} = (X_1+X_2)/6 + (X_3 + X_4)/3\] \[\hat{θ2} = (X_1+2X_2+3X_3 + 4X_4)/5\] \[\hat{θ3} = (X_1+X_2+X_3 + X_4)/4\] \[\hat{θ4} = (min{X_1,X_2,X_3,X_4} + max{X_1,X_2,X_3,X_4})/2\]
Iniciamos realizando la importación de librerias necesarias para nuestro proceso.
if(!require(tidyverse)){
install.packages(tidyverse)
}
library(tidyverse)
if(!require(dplyr)){
install.packages(dplyr)
}
library(dplyr)
if(!require(tidyr)){
install.packages(tidyr)
}
library(tidyr)
# Instalaremos y cargaremos la librería ggplot2 si aún no está instalada
if (!require(ggplot2)) {
install.packages("ggplot2")
}
library(ggplot2)
#Creación de Vectores y listas para los resultados de iteración
M1 <- vector("numeric")
M2 <- vector("numeric")
M3 <- vector("numeric")
M4 <- vector("numeric")
l1 <- list()
l2 <- list()
l3 <- list()
l4 <- list()
Definimos nuestra variable muestra a partir de la definición de una distribución exponencial.
lambda <- 2 #Factor lambda
n <- 4 #Tamaño muestra
muestra <- rexp(n,lambda)
A continuación realizamos la definición de la función que iterara x veces a partir de un valor x para Determinar las características de cada uno de los siguientes estimadores propuestos.
estimadores <- function(x){
M1 <- numeric(x)
M2 <- numeric(x)
M3 <- numeric(x)
M4 <- numeric(x)
for (i in seq(1, x)){
muestra <- rexp(4, rate = 1) # Generar una muestra aleatoria de tamaño 4 desde una exponencial
M1[i] <- (muestra[1] + muestra[2])/6 + (muestra[3] + muestra[4])/3
M2[i] <- (muestra[1] + 2*muestra[2] + 3*muestra[3] + 4*muestra[4])/5
M3[i] <- (muestra[1] + muestra[2] + muestra[3] + muestra[4])/4
M4[i] <- (min(c(muestra[1], muestra[2], muestra[3], muestra[4])) + max(c(muestra[1], muestra[2], muestra[3], muestra[4])))/2
}
# Creación de un dataframe para los estimadores
df <- data.frame(
M1 = M1,
M2 = M2,
M3 = M3,
M4 = M4
)
# Crear un dataframe largo (long) para la gráfica
df_p <- df %>%
pivot_longer(cols = c(M1, M2, M3, M4), names_to = "Estimadores", values_to = "Valores")
# Graficar
grafica <- ggplot(df_p, aes(x = Estimadores, y = Valores, fill = Estimadores)) +
geom_boxplot() +
geom_jitter(alpha = 0.5)
print(grafica)
return(list(
valores_estadisticos = cat(
paste("Media primer estimador:", round(mean(M1), 2)),
paste("Media segundo estimador:", round(mean(M2), 2)),
paste("Media tercer estimador:", round(mean(M3), 2)),
paste("Media cuarto estimador:", round(mean(M4), 2)),
paste("Varianza primer estimador:", round(var(M1), 2)),
paste("Varianza segundo estimador:", round(var(M2), 2)),
paste("Varianza tercer estimador:", round(var(M3), 2)),
paste("Varianza cuarto estimador:", round(var(M4), 2)),
sep = "\n"
))
)
}
resultados <- estimadores(20)
## Media primer estimador: 0.85
## Media segundo estimador: 1.73
## Media tercer estimador: 0.85
## Media cuarto estimador: 1.05
## Varianza primer estimador: 0.18
## Varianza segundo estimador: 1.09
## Varianza tercer estimador: 0.12
## Varianza cuarto estimador: 0.32
resultados <- estimadores(50)
## Media primer estimador: 0.99
## Media segundo estimador: 1.97
## Media tercer estimador: 1.04
## Media cuarto estimador: 1.26
## Varianza primer estimador: 0.25
## Varianza segundo estimador: 1.08
## Varianza tercer estimador: 0.26
## Varianza cuarto estimador: 0.52
resultados <- estimadores(100)
## Media primer estimador: 1.03
## Media segundo estimador: 2.06
## Media tercer estimador: 1.02
## Media cuarto estimador: 1.2
## Varianza primer estimador: 0.32
## Varianza segundo estimador: 1.27
## Varianza tercer estimador: 0.27
## Varianza cuarto estimador: 0.46
resultados <- estimadores(1000)
## Media primer estimador: 0.99
## Media segundo estimador: 1.99
## Media tercer estimador: 1
## Media cuarto estimador: 1.17
## Varianza primer estimador: 0.28
## Varianza segundo estimador: 1.25
## Varianza tercer estimador: 0.26
## Varianza cuarto estimador: 0.41