Sean X1,X2,X3 y X4, una muestra aleatoria de tamaño θ cuya población la conforma una distribución exponencial con parámetro desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
Estimador 1
Estimador 2
Estimador 3
Estimador 4
n <- 20 # Tamaño de muestra
num_samples <- 1000 # Número de muestras a generar
set.seed(123) # Esto asegura que los números generados sean reproducibles
# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
muestra <- rexp(n, rate = 1) # Generar muestra
T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
T123[i, 3] <- mean(muestra)
T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}
# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)
# Mostrar resultados
cat("Resumen de los estimadores:\n")
## Resumen de los estimadores:
summary(T123)
## V1 V2 V3 V4
## Min. :0.1182 Min. :0.221 Min. :0.4197 Min. :0.6043
## 1st Qu.:0.6117 1st Qu.:1.204 1st Qu.:0.8437 1st Qu.:1.3860
## Median :0.8919 Median :1.765 Median :0.9960 Median :1.7421
## Mean :0.9899 Mean :1.960 Mean :1.0035 Mean :1.8229
## 3rd Qu.:1.2522 3rd Qu.:2.487 3rd Qu.:1.1432 3rd Qu.:2.1126
## Max. :3.7050 Max. :8.180 Max. :1.8014 Max. :5.5260
# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=20")
# Supongamos un valor para theta
theta <- 2
# Calcular sesgo
sesgo_T1 <- mean(T123[, 1]) - theta
sesgo_T2 <- mean(T123[, 2]) - theta
sesgo_T3 <- mean(T123[, 3]) - theta
sesgo_T4 <- mean(T123[, 4]) - theta
# Calcular varianza
var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")
## Supuesto valor de theta: 2
cat("\nSesgo de T1:", sesgo_T1, "\n")
##
## Sesgo de T1: -1.010149
cat("Varianza de T1:", var_T1, "\n\n")
## Varianza de T1: 0.2739041
cat("Sesgo de T2:", sesgo_T2, "\n")
## Sesgo de T2: -0.03999456
cat("Varianza de T2:", var_T2, "\n\n")
## Varianza de T2: 1.161061
cat("Sesgo de T3:", sesgo_T3, "\n")
## Sesgo de T3: -0.9965352
cat("Varianza de T3:", var_T3, "\n\n")
## Varianza de T3: 0.0493041
cat("Sesgo de T4:", sesgo_T4, "\n")
## Sesgo de T4: -0.1771207
cat("Varianza de T4:", var_T4, "\n")
## Varianza de T4: 0.4031057
Al analizar los estimadores con n= 20 se tiene que: el Sesgo de 1 : El sesgo es -1.010149. Esto significa que, en promedio, el estimador 1 subestima el verdadero valor del parámetro en aproximadamente 1.01 unidades. Dado que el sesgo es negativo, esto indica que el estimador tiende a subestimar el parámetro.
Varianza de 1: La varianza es 0.2739041. Una varianza más baja indica una menor dispersión de las estimaciones en relación con el verdadero valor del parámetro. En este caso, 1 tiene una varianza relativamente baja.
Sesgo de 2: El sesgo es -0.03999456. Este sesgo es cercano a cero, lo que indica que el estimador 2 está más cerca del verdadero valor del parámetro en promedio en comparación con 1. Además, el sesgo es negativo, lo que sugiere que el estimador tiende a subestimar el parámetro, aunque en menor medida que 1.
Varianza de 2: La varianza es 1.161061. 2 tiene una varianza más alta en comparación con 1, lo que sugiere una mayor dispersión en las estimaciones.
Sesgo de 3: El sesgo es -0.9965352. Este sesgo es cercano a -1, lo que indica que el estimador 3 subestima significativamente el verdadero valor del parámetro en aproximadamente 1 unidad. Además, el sesgo es negativo, lo que sugiere que el estimador tiende a subestimar el parámetro.
Varianza de 3: La varianza es 0.0493041. 3 tiene una varianza relativamente baja en comparación con 1 y 2, lo que sugiere una menor dispersión de las estimaciones.
Sesgo de 4: El sesgo es -0.1771207. Este sesgo es cercano a cero, pero aún indica una ligera subestimación del verdadero valor del parámetro. Además, el sesgo es negativo.
Varianza de 4: La varianza es 0.4031057. 4 tiene una varianza más baja en comparación con 2, lo que sugiere una menor dispersión en las estimaciones.
En resumen, en términos de insesgadez, eficiencia y consistencia:
3 parece ser el estimador más insesgado, ya que tiene un sesgo más cercano a cero en comparación con los otros estimadores. 2 tiene la varianza más alta, lo que sugiere una mayor dispersión en las estimaciones. 1 y 4 tienen una varianza relativamente baja en comparación con 2, lo que sugiere una menor dispersión en las estimaciones en relación con el verdadero valor del parámetro.n <- 50 # Tamaño de muestra
num_samples <- 1000 # Número de muestras a generar
set.seed(123) # Esto asegura que los números generados sean reproducibles
# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
muestra <- rexp(n, rate = 1) # Generar muestra
T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
T123[i, 3] <- mean(muestra)
T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}
# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)
# Mostrar resultados
cat("Resumen de los estimadores:\n")
## Resumen de los estimadores:
summary(T123)
## V1 V2 V3 V4
## Min. :0.1137 Min. :0.2193 Min. :0.6429 Min. :0.949
## 1st Qu.:0.6416 1st Qu.:1.2381 1st Qu.:0.9102 1st Qu.:1.808
## Median :0.9111 Median :1.8015 Median :0.9963 Median :2.119
## Mean :1.0106 Mean :2.0170 Mean :1.0034 Mean :2.237
## 3rd Qu.:1.2918 3rd Qu.:2.5972 3rd Qu.:1.0941 3rd Qu.:2.544
## Max. :3.5681 Max. :8.0094 Max. :1.4473 Max. :5.526
# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=50")
# Supongamos un valor para theta
theta <- 2
# Calcular sesgo
sesgo_T1 <- mean(T123[, 1]) - theta
sesgo_T2 <- mean(T123[, 2]) - theta
sesgo_T3 <- mean(T123[, 3]) - theta
sesgo_T4 <- mean(T123[, 4]) - theta
# Calcular varianza
var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")
## Supuesto valor de theta: 2
cat("\nSesgo de T1:", sesgo_T1, "\n")
##
## Sesgo de T1: -0.9893564
cat("Varianza de T1:", var_T1, "\n\n")
## Varianza de T1: 0.263298
cat("Sesgo de T2:", sesgo_T2, "\n")
## Sesgo de T2: 0.01702039
cat("Varianza de T2:", var_T2, "\n\n")
## Varianza de T2: 1.128764
cat("Sesgo de T3:", sesgo_T3, "\n")
## Sesgo de T3: -0.9966194
cat("Varianza de T3:", var_T3, "\n\n")
## Varianza de T3: 0.01882351
cat("Sesgo de T4:", sesgo_T4, "\n")
## Sesgo de T4: 0.237174
cat("Varianza de T4:", var_T4, "\n")
## Varianza de T4: 0.380036
Al realizar el análisis de los resultados con n= 50 se tiene que 1 y 3 tienen sesgos negativos, lo que indica una tendencia a subestimar el verdadero valor del parámetro. 2 y 4 tienen sesgos cercanos a cero, lo que sugiere que están centrados alrededor del verdadero valor del parámetro.
Al evaluar la eficiencia se tiene que la varianza más baja se observa en 3, lo que indica que este estimador podría ser más eficiente en comparación con los demás.
Al realizar el análisis comparando los resultados de los tamaños de n=20 y n=50 y se observa que en ambos casos, el estimador 3 parece ser el más insesgado, ya que su sesgo es cercano a cero. En cuanto a la eficiencia, la varianza de 3 es la más baja en ambos casos, lo que sugiere que 3 es el estimador más eficiente. En términos de consistencia, los sesgos de todos los estimadores no cambian significativamente al aumentar el tamaño de la muestra de 20 a 50, lo que sugiere que los estimadores son consistentes independientemente del tamaño de la muestra. se puede concluir que el estimador 3 es el más insesgado, y el más eficiente y los estimadores son consistentes independientemente del tamaño de la muestra.n <- 100 # Tamaño de muestra
num_samples <- 1000 # Número de muestras a generar
set.seed(123) # Esto asegura que los números generados sean reproducibles
# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
muestra <- rexp(n, rate = 1) # Generar muestra
T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
T123[i, 3] <- mean(muestra)
T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}
# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)
# Mostrar resultados
cat("Resumen de los estimadores:\n")
## Resumen de los estimadores:
summary(T123)
## V1 V2 V3 V4
## Min. :0.1223 Min. :0.2113 Min. :0.7228 Min. :1.343
## 1st Qu.:0.6200 1st Qu.:1.2076 1st Qu.:0.9271 1st Qu.:2.123
## Median :0.9108 Median :1.7945 Median :0.9984 Median :2.465
## Mean :0.9953 Mean :1.9868 Mean :0.9975 Mean :2.576
## 3rd Qu.:1.2902 3rd Qu.:2.5480 3rd Qu.:1.0617 3rd Qu.:2.916
## Max. :3.5520 Max. :6.9585 Max. :1.3202 Max. :5.526
# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=100")
# Supongamos un valor para theta
theta <- 2
# Calcular sesgo
sesgo_T1 <- mean(T123[, 1]) - theta
sesgo_T2 <- mean(T123[, 2]) - theta
sesgo_T3 <- mean(T123[, 3]) - theta
sesgo_T4 <- mean(T123[, 4]) - theta
# Calcular varianza
var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")
## Supuesto valor de theta: 2
cat("\nSesgo de T1:", sesgo_T1, "\n")
##
## Sesgo de T1: -1.004737
cat("Varianza de T1:", var_T1, "\n\n")
## Varianza de T1: 0.2612311
cat("Sesgo de T2:", sesgo_T2, "\n")
## Sesgo de T2: -0.01315317
cat("Varianza de T2:", var_T2, "\n\n")
## Varianza de T2: 1.125567
cat("Sesgo de T3:", sesgo_T3, "\n")
## Sesgo de T3: -1.002538
cat("Varianza de T3:", var_T3, "\n\n")
## Varianza de T3: 0.00956484
cat("Sesgo de T4:", sesgo_T4, "\n")
## Sesgo de T4: 0.5759165
cat("Varianza de T4:", var_T4, "\n")
## Varianza de T4: 0.3707602
Se realiza análisis del Sesgo encontrando que 1 y 3 tienen sesgos negativos, lo que indica una tendencia a subestimar el verdadero valor del parámetro. 2 tiene un sesgo cercano a cero, lo que sugiere que está centrado alrededor del verdadero valor del parámetro. 4 tiene un sesgo positivo, lo que indica una tendencia a sobrestimar el verdadero valor del parámetro.
Al análizar la Eficiencia se observa que la varianza más baja se observa en 3, lo que indica que este estimador podría ser más eficiente en comparación con los demás.Al comparar los estimadores con el tamaño de la muestra se observa que 3 parece ser el estimador más eficiente en términos de varianza en todos los tamaños de muestra. 1 y 3 tienen sesgos negativos, indicando una tendencia a subestimar el verdadero valor del parámetro. 2 muestra sesgos cercanos a cero en todos los tamaños de muestra. 4 exhibe un sesgo que cambia con el tamaño de la muestra, siendo positivo para muestras más grandes. En general, la varianza de los estimadores no sigue un patrón claro con respecto al tamaño de la muestra, pero 3 tiene consistentemente la varianza más baja.
n <- 1000 # Tamaño de muestra
num_samples <- 1000 # Número de muestras a generar
set.seed(123) # Esto asegura que los números generados sean reproducibles
# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
muestra <- rexp(n, rate = 1) # Generar muestra
T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
T123[i, 3] <- mean(muestra)
T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}
# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)
# Mostrar resultados
cat("Resumen de los estimadores:\n")
## Resumen de los estimadores:
summary(T123)
## V1 V2 V3 V4
## Min. :0.07363 Min. :0.1733 Min. :0.8733 Min. :2.534
## 1st Qu.:0.59554 1st Qu.:1.1519 1st Qu.:0.9798 1st Qu.:3.334
## Median :0.89634 Median :1.7434 Median :0.9983 Median :3.661
## Mean :0.98088 Mean :1.9603 Mean :0.9998 Mean :3.771
## 3rd Qu.:1.25858 3rd Qu.:2.5344 3rd Qu.:1.0213 3rd Qu.:4.072
## Max. :3.80608 Max. :8.0326 Max. :1.1082 Max. :7.266
# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=1000")
# Supongamos un valor para theta
theta <- 2
# Calcular sesgo
sesgo_T1 <- mean(T123[, 1]) - theta
sesgo_T2 <- mean(T123[, 2]) - theta
sesgo_T3 <- mean(T123[, 3]) - theta
sesgo_T4 <- mean(T123[, 4]) - theta
# Calcular varianza
var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")
## Supuesto valor de theta: 2
cat("\nSesgo de T1:", sesgo_T1, "\n")
##
## Sesgo de T1: -1.019116
cat("Varianza de T1:", var_T1, "\n\n")
## Varianza de T1: 0.2662982
cat("Sesgo de T2:", sesgo_T2, "\n")
## Sesgo de T2: -0.03974307
cat("Varianza de T2:", var_T2, "\n\n")
## Varianza de T2: 1.191116
cat("Sesgo de T3:", sesgo_T3, "\n")
## Sesgo de T3: -1.000194
cat("Varianza de T3:", var_T3, "\n\n")
## Varianza de T3: 0.000934193
cat("Sesgo de T4:", sesgo_T4, "\n")
## Sesgo de T4: 1.771412
cat("Varianza de T4:", var_T4, "\n")
## Varianza de T4: 0.4224341
Al realizar el análisis incluyendo n= 1000 se observa que en cuanto a la propiedad de insensgadez que el sesgo de 1 y 3 muestran sesgos negativos, lo que sugiere una tendencia a subestimar el verdadero valor del parámetro. 2 tiene un sesgo cercano a cero. 4 tiene un sesgo positivo, indicando una tendencia a sobrestimar el verdadero valor del parámetro.
En cuanto a la eficiencia la varianza más baja se observa en 3, lo que sugiere que este estimador podría ser más eficiente que los demás.
Al evaluar la Consistencia se observa que la varianza extremadamente baja de 3 sugiere una alta precisión y posiblemente consistencia en la estimación del parámetro.
Se puede concluir que:
1, 2 y 4 tienen sesgos, pero 3 parece ser insesgado o tener un sesgo muy pequeño. 3 muestra la varianza más baja, lo que sugiere una mayor eficiencia en comparación con los otros estimadores. 3 también tiene un sesgo pequeño y negativo, con lo que se puede interpretar que es consistente en la estimación del parámetro. 1 y 4 tienen sesgos que podrían afectar la precisión de la estimación del parámetro. 2 muestra un sesgo cercano a cero, pero su varianza es alta en comparación con 3, lo que sugiere que podría ser menos eficiente en la estimación del parámetro. Se concluye que el estimador 3 es el estimador más favorable en términos de insesgadez, eficiencia y consistencia.