1. Propiedades de los estimadores
La simulación ayuda a entender y validad las propiedades de los
estimadores estadísticos como son. insesgadez, eficiencia y la
consistencia principalmente. El siguiente problema permite evidenciar
las principales características de un grupo de estimadores propuestos
para la estimación de un parámetro asociado a un modelo de
probabilidad.
2. Objetivo
Analizar y evaluar las propiedades de los estimadores estadísticos
en el contexto de la estimación de un parámetro θ en una distribución
exponencial para cuatro estimadores diferentes.
3. Procedimiento
A continuación, se detalla el proceso para llevar a cabo estas
simulaciones utilizando el lenguaje de programación R.
a) Definición de los estimadores
Se definen cuatro estimadores diferentes (θ^1, θ^2, θ^3 y θ^4) como
funciones matemáticas que toman una muestra de cuatro valores (X1, X2,
X3, X4) como entrada.
estimador1 <- function(x) {
return((x[1] + x[2])/6 + (x[3] + x[4])/3)
}
estimador2 <- function(x) {
return((x[1] + 2*x[2] + 3*x[3] + 4*x[4])/5)
}
estimador3 <- function(x) {
return(mean(x))
}
estimador4 <- function(x) {
return((min(x) + max(x))/2)
}
b) Definición de las poblaciones
Se establecen cuatro tamaños de población diferentes (20, 50, 100,
1000), cada una siguiendo una distribución exponencial con un parámetro
θ=2. Además, se especifica la realización de 1000 simulaciones, y se
prepara un vector para almacenar los resultados obtenidos de los cuatro
estimadores.
theta <- 1
tamaño <- c(20, 50, 100, 1000)
num_simulations <- 1000
resultados <- data.frame()
c) Calculo de las estimaciones
En esta sección, se calculan los cuatro estimadores utilizando
muestras de tamaño 4 en 1000 ocasiones para cada uno de los tamaños de
la población.
# Vectores para almacenar las medias de los estimadores
for (n in tamaño) {
estimacion1 <- estimacion2 <- estimacion3 <- estimacion4 <- numeric(num_simulations)
sample_data <- rexp(n, 1/theta)
es2<-estimadorr2(sample_data)
es3<-estimadorr3(sample_data)
es4<-estimadorr4(sample_data)
for (i in 1:num_simulations) {
# Obtener cuatro índices aleatorios
indices_aleatorios <- sample(1:length(sample_data), 4)
# Seleccionar los valores correspondientes
valores_aleatorios <- sample_data[indices_aleatorios]
estimacion1[i] <- estimador1(valores_aleatorios)
estimacion2[i] <- estimador2(valores_aleatorios)
estimacion3[i] <- estimador3(valores_aleatorios)
estimacion4[i] <- estimador4(valores_aleatorios)
}
# Crear un data frame con las estimaciones
estimacioness <- data.frame(
Estimador1 = estimacion1,
Estimador2 = estimacion2,
Estimador3 = estimacion3,
Estimador4 = estimacion4
)
# Crear un boxplot para las estimaciones
print(paste("Boxplot para poblacion: ",n))
boxplot(estimacioness, main = "Boxplot de Estimaciones", ylab = "Valor Estimado")
Mean1 = mean(estimacion1)
Mean2 = mean(estimacion2)
Mean3 = mean(estimacion3)
Mean4 = mean(estimacion4)
print(paste("Población de:",n))
print(paste("media muestral estimador 1: ",Mean1))
print(paste("media muestral estimador 2: ",Mean2))
print(paste("media muestral estimador 3: ",Mean3))
print(paste("media muestral estimador 4: ",Mean4))
print(paste("Parametro 2: ",es2))
print(paste("Parametro 3: ",es3))
print(paste("Parametro 4: ",es4))
sesgo2=Mean2-es2
sesgo3=Mean2-es3
sesgo4=Mean2-es4
print(paste("sesgo 2: ",sesgo2))
print(paste("sesgo 3: ",sesgo3))
print(paste("sesgo 4: ",sesgo4))
# Calcular la varianza de cada estimador
varianza_estimador1 <- var(estimacion1)
varianza_estimador2 <- var(estimacion2)
varianza_estimador3 <- var(estimacion3)
varianza_estimador4 <- var(estimacion4)
# Imprimir los resultados
cat("Varianza de Estimador 1:", varianza_estimador1, "\n")
cat("Varianza de Estimador 2:", varianza_estimador2, "\n")
cat("Varianza de Estimador 3:", varianza_estimador3, "\n")
cat("Varianza de Estimador 4:", varianza_estimador4, "\n")
}
## [1] "Boxplot para poblacion: 20"

## [1] "Población de: 20"
## [1] "media muestral estimador 1: 0.711637715271799"
## [1] "media muestral estimador 2: 1.42116794368318"
## [1] "media muestral estimador 3: 0.714175339256405"
## [1] "media muestral estimador 4: 0.857634899212481"
## [1] "Parametro 2: 0.692981713580837"
## [1] "Parametro 3: 0.710854782609833"
## [1] "Parametro 4: 1.42053229698481"
## [1] "sesgo 2: 0.728186230102345"
## [1] "sesgo 3: 0.710313161073349"
## [1] "sesgo 4: 0.00063564669837457"
## Varianza de Estimador 1: 0.1187043
## Varianza de Estimador 2: 0.5172421
## Varianza de Estimador 3: 0.104295
## Varianza de Estimador 4: 0.1742933
## [1] "Boxplot para poblacion: 50"

## [1] "Población de: 50"
## [1] "media muestral estimador 1: 0.895600809060716"
## [1] "media muestral estimador 2: 1.79364988250307"
## [1] "media muestral estimador 3: 0.895157761275475"
## [1] "media muestral estimador 4: 0.996349575521824"
## [1] "Parametro 2: 0.769402257331164"
## [1] "Parametro 3: 0.924897810813665"
## [1] "Parametro 4: 1.60129716588164"
## [1] "sesgo 2: 1.0242476251719"
## [1] "sesgo 3: 0.868752071689402"
## [1] "sesgo 4: 0.192352716621424"
## Varianza de Estimador 1: 0.1680875
## Varianza de Estimador 2: 0.7408597
## Varianza de Estimador 3: 0.148435
## Varianza de Estimador 4: 0.1847138
## [1] "Boxplot para poblacion: 100"

## [1] "Población de: 100"
## [1] "media muestral estimador 1: 1.04617454102572"
## [1] "media muestral estimador 2: 2.09266779260679"
## [1] "media muestral estimador 3: 1.04855734277144"
## [1] "media muestral estimador 4: 1.14838139992579"
## [1] "Parametro 2: 0.927798489100828"
## [1] "Parametro 3: 1.04719068833085"
## [1] "Parametro 4: 1.86498357973735"
## [1] "sesgo 2: 1.16486930350596"
## [1] "sesgo 3: 1.04547710427594"
## [1] "sesgo 4: 0.227684212869435"
## Varianza de Estimador 1: 0.189058
## Varianza de Estimador 2: 0.8042564
## Varianza de Estimador 3: 0.1738691
## Varianza de Estimador 4: 0.1875844
## [1] "Boxplot para poblacion: 1000"

## [1] "Población de: 1000"
## [1] "media muestral estimador 1: 1.02571318506042"
## [1] "media muestral estimador 2: 2.05332606798638"
## [1] "media muestral estimador 3: 1.03075323352897"
## [1] "media muestral estimador 4: 1.20091485314166"
## [1] "Parametro 2: 0.993354567233716"
## [1] "Parametro 3: 1.02397933306836"
## [1] "Parametro 4: 3.14281371230003"
## [1] "sesgo 2: 1.05997150075267"
## [1] "sesgo 3: 1.02934673491803"
## [1] "sesgo 4: -1.08948764431365"
## Varianza de Estimador 1: 0.2862705
## Varianza de Estimador 2: 1.267284
## Varianza de Estimador 3: 0.2657791
## Varianza de Estimador 4: 0.4202108
d) Análisis
Población 20:
En la población de tamaño 20, el Estimador 4 exhibió el sesgo más
cercano a cero, indicando que es el estimador mas insesgado en esta
población. Por otro lado, el Estimador 3 presentó la varianza más baja,
lo que lo convierte en el estimador más eficiente en términos de
varianza. El Estimador 2 tuvo un sesgo positivo y una varianza
relativamente alta, lo que indica que es menos preciso y tiende a
sobreestimar el parámetro. El Estimador 1 no se evaluó en términos de
sesgo debido a la falta de información sobre el parámetro verdadero,
pero mostró una varianza relativamente baja en comparación con los
Estimadores 2 y 4.
Población 50:
En la población de tamaño 50, el Estimador 4 exhibió el sesgo más
cercano a cero, indicando que es el estimador insesgado en esta
población. Por otro lado, los Estimadores 2 y 3 presentaron sesgos
positivos, lo que indica que tienden a sobreestimar el parámetro
poblacional. El Estimador 3 tiene un sesgo ligeramente menor que el
Estimador 2.
En términos de eficiencia, el Estimador 3 sigue siendo el estimador
con la varianza más baja, lo que lo convierte en el estimador más
preciso en términos de varianza. El Estimador 1 tiene la segunda
varianza más baja. Los Estimadores 2 y 4 tienen varianzas más altas en
comparación con los Estimadores 1 y 3, lo que indica que son menos
precisos en términos de varianza.En general, el Estimador 4 es el más
insesgado, pero el Estimador 3 es el más eficiente en términos de
varianza en esta población de tamaño 50.
Población :100
En la población de tamaño 100, el Estimador 4 exhibió el sesgo más
cercano a cero, lo que indica que es el estimador insesgado en esta
población. Por otro lado, los Estimadores 2 y 3 presentaron sesgos
positivos, indicando que tienden a sobreestimar el parámetro
poblacional. El Estimador 3 tiene un sesgo ligeramente mayor que el
Estimador 2.
En cuanto a la eficiencia, el Estimador 3 sigue siendo el estimador
con la varianza más baja, lo que lo convierte en el estimador más
preciso en términos de varianza. El Estimador 1 tiene la segunda
varianza más baja. Los Estimadores 2 y 4 tienen varianzas más altas en
comparación con los Estimadores 1 y 3, lo que indica que son menos
eficientes en términos de varianza.
Población : 1000
En la población de tamaño 1000, el Estimador 3 mostró el sesgo más
cercano a cero, indicando que es el estimador insesgado en esta
población. Por otro lado, el estimador 4 exhibió un sesgo negativo
considerable, lo que sugiere que tiende a subestimar el parámetro
poblacional. El Estimador 2 también mostró un sesgo positivo, aunque
menor que el Estimador 4.
En términos de eficiencia, el Estimador 3 sigue siendo el estimador
con la varianza más baja, lo que lo convierte en el estimador más
preciso en términos de varianza. El Estimador 1 tiene la segunda
varianza más baja. Los Estimadores 2 y 4 tienen varianzas más altas en
comparación con los Estimadores 1 y 3, lo que indica que son menos
precisos en términos de varianza.
El análisis de los resultados se ve respaldado y complementado de
manera efectiva al observar detenidamente las gráficas boxplot
correspondientes a cada población. Estas visualizaciones proporcionan
una representación gráfica de las estadísticas resumidas previamente y
permiten una comprensión más profunda de la distribución de los datos y
la presencia de posibles valores atípicos evidentemente.
e) Conclusiones:
a) En cuanto a la eficiencia, se observó que el Estimador 3 mantuvo
la varianza más baja en la mayoría de los casos, lo que lo convierte en
el estimador más preciso en términos de varianza. Esta eficiencia se
refleja en una menor dispersión en las estimaciones y, por lo tanto, en
una mayor consistencia en la precisión de las estimaciones a lo largo de
las simulaciones.
b) El Estimador 2, por otro lado, presentó sesgos positivos en la
mayoría de los casos y varianzas relativamente altas, lo que indicó una
menor insesgadez y eficiencia en comparación con los otros
estimadores.
c) El Estimador 1, aunque no se evaluó en términos de sesgo debido a
la falta de información sobre el parámetro verdadero, mostró una
varianza relativamente baja en comparación con los Estimadores 2 y 4, lo
que sugiere que podría ser una opción razonable cuando la insesgadez es
una prioridad.