Este informe aborda las propiedades de estimadores utilizados para estimar el parámetro θ de una distribución exponencial. Evaluaremos insesgadez, eficiencia y consistencia utilizando simulaciones.
Se simularon muestras de tamaños 20, 50, 100 y 1000 para los siguientes estimadores:
set.seed(123) # Fijar la semilla para reproducibilidad
# Definir tamaños de muestra
sizes <- c(20, 50, 100, 1000) # Tamaños de muestra
resultados <- list() # Lista para almacenar los resultados de los estimadores
# Bucle para las diferentes muestras
for (n in sizes) {
# Generar muestras aleatorias de una distribución exponencial
x1 <- rexp(n, 1/20)
x2 <- rexp(n, 1/20)
x3 <- rexp(n, 1/20)
x4 <- rexp(n, 1/20)
# Crear un data frame con los valores generados
data <- data.frame(x1, x2, x3, x4)
# Calcular los estimadores
t1 <- (data$x1 + data$x2) / 6 + (data$x3 + data$x4) / 3 # Estimador 1
t2 <- (data$x1 + 2 * data$x2 + 3 * data$x3 + 4 * data$x4) / 5 # Estimador 2
t3 <- (data$x1 + data$x2 + data$x3 + data$x4) / 4 # Estimador 3
minx <- apply(data, 1, min) # Mínimo
maxx <- apply(data, 1, max) # Máximo
t4 <- (minx + maxx) / 2 # Estimador 4
# Almacenar los resultados de los estimadores
resultados[[as.character(n)]] <- data.frame(t1, t2, t3, t4)
# Calcular medias y varianzas para cada estimador
medias <- apply(resultados[[as.character(n)]], 2, mean)
varianzas <- apply(resultados[[as.character(n)]], 2, var)
# Almacenar los resultados en un data frame
df_resultados <- data.frame(
Tamaño = n,
Estimador = c("t1", "t2", "t3", "t4"),
Media = medias,
Varianza = varianzas
)
# Mostrar resultados de medias y varianzas de forma organizada
cat("Resultados para n =", n, "\n")
print(df_resultados)
cat("-----------------------------\n")
# Graficar los resultados
boxplot(resultados[[as.character(n)]],
main=paste("Boxplot de Estimadores para n =", n),
ylab="Estimadores",
col=c("red", "blue", "green", "yellow"))
abline(h = 20, col = "red", lty = 2) # Línea horizontal representando theta
Sys.sleep(2) # Pausa para apreciar el gráfico, eliminar si no es necesario
}
Resultados para n = 20
Tamaño Estimador Media Varianza
t1 20 t1 20.70849 108.85332
t2 20 t2 40.87918 350.75080
t3 20 t3 20.34258 79.43927
t4 20 t4 24.01576 208.29069
-----------------------------
Resultados para n = 50
Tamaño Estimador Media Varianza
t1 50 t1 20.62452 81.27212
t2 50 t2 41.29552 338.92327
t3 50 t3 20.42986 70.31238
t4 50 t4 22.74067 101.77557
-----------------------------
Resultados para n = 100
Tamaño Estimador Media Varianza
t1 100 t1 19.95910 108.65853
t2 100 t2 40.43760 440.94993
t3 100 t3 19.92940 96.07281
t4 100 t4 23.37645 141.99101
-----------------------------
Resultados para n = 1000
Tamaño Estimador Media Varianza
t1 1000 t1 20.07867 117.6456
t2 1000 t2 40.11632 508.8401
t3 1000 t3 20.10106 110.0337
t4 1000 t4 23.49835 169.1580
-----------------------------
# Graficar los resultados
boxplot(resultados[[as.character(n)]],
main=paste("Boxplot de Estimadores para n =", n),
ylab="Estimadores",
col=c("red", "blue", "green", "yellow"))
abline(h = 20, col = "red", lty = 2) # Línea horizontal representando theta
Este informe evaluó las propiedades de varios estimadores en relación con el parámetro ( ) de una distribución exponencial, analizando su insesgadez, eficiencia y consistencia a través de simulaciones con diferentes tamaños de muestra.
A continuación, se presentan las conclusiones clave:
Definición: La insesgadez se refiere a que la media del estimador debe ser igual al verdadero valor del parámetro ( ). Resultados: Estimador ( t3 ) mostró la mejor insesgadez, promediando más cerca de ( = 20 ) en la mayoría de las simulaciones. Estimador ( t1 ) también presentó buenas características de insesgadez, aunque con medias ligeramente superiores. **Estimador ( t2 *)** y Estimador ( t4 ) mostraron mayores desviaciones de ( ), indicando menos confiabilidad en su insesgadez.
Definición: La eficiencia se mide por la varianza del estimador; un estimador más eficiente tiene menor varianza.
Resultados:
Estimador ( t3 ) no solo presentó la mejor insesgadez, sino que también exhibió la menor varianza en casi todos los tamaños de muestra, lo que lo hace más eficiente. **Estimador *( t1 ) mostró varianzas competitivas, mientras que Estimador ( t2 ) tuvo la mayor varianza, especialmente en muestras pequeñas, lo que sugiere que es menos eficiente. Estimador ( t4 )** tuvo varianzas intermedias, pero su inconsistencia en los resultados sugiere que su eficiencia podría ser comprometida.
Definición: La consistencia indica que, a medida que aumenta el tamaño de la muestra, el estimador converge en probabilidad al valor real del parámetro.
Resultados: Todos los estimadores muestran un comportamiento consistente, convergiendo a ( ) con el aumento del tamaño de la muestra.
Los resultados mostraron que, especialmente para ( n = 1000 ), los estimadores se acercaron al valor real, lo que respalda su consistencia.
Los diferentes tamaños de muestra demostraron tener un efecto significativo en la precisión y confiabilidad de las estimaciones.
Las simulaciones con ( n = 20 ) presentaron mayores variabilidades en las medias y varianzas, mientras que ( n = 1000 ) permitió una aproximación más cercana al verdadero valor de ( ).
Este comportamiento resalta la importancia de seleccionar un tamaño de muestra adecuado para estimaciones precisas.
Estimador más adecuado: Estimador ( t3 ), por su insesgadez y eficiencia (menor varianza), es recomendado como el mejor para estimar el parámetro ( ).
Observaciones de otros estimadores:
Estimador ( t1 ) es apropiado, pero su media es consistentemente más alta. Estimador ( t2 ) es el menos confiable debido a sus altas varianzas y sesgo. Estimador ( t4 ) mostro resultados inconstantes y no se recomienda para este propósito.
Las simulaciones y análisis patrón del informe reflejan la importancia del tamaño de muestra y la elección del estimador en la inferencia estadística. La selección del estimador adecuado y el tamaño de la muestra contribuyen significativamente a la precisión y confiabilidad de las estimaciones en cualquier análisis estadístico. En este ejercicio, el estimador ( t3 ) emergió como la mejor opción para estimar el parámetro ( ) de la distribución exponencial.