Actividad 2

Problema 2

Sean X₁,X₂,X₃ y X₄, una muestra aleatoria de tamaño θ cuya población la conforma una distribución exponencial con parámetro desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

Genere una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados.
En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia
Suponga un valor $θ$ para el parámetro

Estimador 1

$\hat{θ} = (x 1 + x 2) \frac{1}{6}$ $+ (x 3 + x 4) \frac{1}{3}$

Estimador 2

$\hat{θ} = (x 1 + 2 x 2 + 3 x 3 + 4 x 4) \frac{1}{5}$

Estimador 3

$\hat{θ} = (x 1 + x 2 + x 3 + x 4) \frac{1}{4}$

Estimador 4

$\hat{θ} = (min {x 1, x 2, x 3, x 4} + max {x 1, x 2, x 3, x 4}) \frac{1}{2}$

Tamaño de muestra n = 20

n <- 20  # Tamaño de muestra
num_samples <- 1000  # Número de muestras a generar
set.seed(123)  # Esto asegura que los números generados sean reproducibles

# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
  muestra <- rexp(n, rate = 1)  # Generar muestra
  T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
  T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
  T123[i, 3] <- mean(muestra)
  T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}

# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)

# Mostrar resultados
cat("Resumen de los estimadores:\n")

## Resumen de los estimadores:

summary(T123)

##        V1               V2              V3               V4        
##  Min.   :0.1182   Min.   :0.221   Min.   :0.4197   Min.   :0.6043  
##  1st Qu.:0.6117   1st Qu.:1.204   1st Qu.:0.8437   1st Qu.:1.3860  
##  Median :0.8919   Median :1.765   Median :0.9960   Median :1.7421  
##  Mean   :0.9899   Mean   :1.960   Mean   :1.0035   Mean   :1.8229  
##  3rd Qu.:1.2522   3rd Qu.:2.487   3rd Qu.:1.1432   3rd Qu.:2.1126  
##  Max.   :3.7050   Max.   :8.180   Max.   :1.8014   Max.   :5.5260

# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=20")

# Supongamos un valor para theta
theta <- 2

# Calcular sesgo
  sesgo_T1 <- mean(T123[, 1]) - theta
  sesgo_T2 <- mean(T123[, 2]) - theta
  sesgo_T3 <- mean(T123[, 3]) - theta
  sesgo_T4 <- mean(T123[, 4]) - theta
  
  # Calcular varianza
  var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
  var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
  var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
  var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
  

# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")

## Supuesto valor de theta: 2

cat("\nSesgo de T1:", sesgo_T1, "\n")

## 
## Sesgo de T1: -1.010149

cat("Varianza de T1:", var_T1, "\n\n")

## Varianza de T1: 0.2739041

cat("Sesgo de T2:", sesgo_T2, "\n")

## Sesgo de T2: -0.03999456

cat("Varianza de T2:", var_T2, "\n\n")

## Varianza de T2: 1.161061

cat("Sesgo de T3:", sesgo_T3, "\n")

## Sesgo de T3: -0.9965352

cat("Varianza de T3:", var_T3, "\n\n")

## Varianza de T3: 0.0493041

cat("Sesgo de T4:", sesgo_T4, "\n")

## Sesgo de T4: -0.1771207

cat("Varianza de T4:", var_T4, "\n")

## Varianza de T4: 0.4031057

Conclusiones

Al analizar los estimadores con n= 20 se tiene que: el Sesgo de $\hat{θ}$ 1 : El sesgo es -1.010149. Esto significa que, en promedio, el estimador $\hat{θ}$ 1 subestima el verdadero valor del parámetro en aproximadamente 1.01 unidades. Dado que el sesgo es negativo, esto indica que el estimador tiende a subestimar el parámetro.

Varianza de $\hat{θ}$ 1: La varianza es 0.2739041. Una varianza más baja indica una menor dispersión de las estimaciones en relación con el verdadero valor del parámetro. En este caso, $\hat{θ}$ 1 tiene una varianza relativamente baja.

Sesgo de $\hat{θ}$ 2: El sesgo es -0.03999456. Este sesgo es cercano a cero, lo que indica que el estimador $\hat{θ}$ 2 está más cerca del verdadero valor del parámetro en promedio en comparación con $\hat{θ}$ 1. Además, el sesgo es negativo, lo que sugiere que el estimador tiende a subestimar el parámetro, aunque en menor medida que $\hat{θ}$ 1.

Varianza de $\hat{θ}$ 2: La varianza es 1.161061. $\hat{θ}$ 2 tiene una varianza más alta en comparación con $\hat{θ}$ 1, lo que sugiere una mayor dispersión en las estimaciones.

Sesgo de $\hat{θ}$ 3: El sesgo es -0.9965352. Este sesgo es cercano a -1, lo que indica que el estimador $\hat{θ}$ 3 subestima significativamente el verdadero valor del parámetro en aproximadamente 1 unidad. Además, el sesgo es negativo, lo que sugiere que el estimador tiende a subestimar el parámetro.

Varianza de $\hat{θ}$ 3: La varianza es 0.0493041. $\hat{θ}$ 3 tiene una varianza relativamente baja en comparación con $\hat{θ}$ 1 y $\hat{θ}$ 2, lo que sugiere una menor dispersión de las estimaciones.

Sesgo de $\hat{θ}$ 4: El sesgo es -0.1771207. Este sesgo es cercano a cero, pero aún indica una ligera subestimación del verdadero valor del parámetro. Además, el sesgo es negativo.

Varianza de $\hat{θ}$ 4: La varianza es 0.4031057. $\hat{θ}$ 4 tiene una varianza más baja en comparación con $\hat{θ}$ 2, lo que sugiere una menor dispersión en las estimaciones.

En resumen, en términos de insesgadez, eficiencia y consistencia:

\hat{θ}

3 parece ser el estimador más insesgado, ya que tiene un sesgo más cercano a cero en comparación con los otros estimadores.

\hat{θ}

2 tiene la varianza más alta, lo que sugiere una mayor dispersión en las estimaciones.

\hat{θ}

1 y

\hat{θ}

4 tienen una varianza relativamente baja en comparación con

\hat{θ}

2, lo que sugiere una menor dispersión en las estimaciones en relación con el verdadero valor del parámetro.

Tamaño de muestra n = 50

n <- 50  # Tamaño de muestra
num_samples <- 1000  # Número de muestras a generar
set.seed(123)  # Esto asegura que los números generados sean reproducibles

# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
  muestra <- rexp(n, rate = 1)  # Generar muestra
  T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
  T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
  T123[i, 3] <- mean(muestra)
  T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}

# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)

# Mostrar resultados
cat("Resumen de los estimadores:\n")

## Resumen de los estimadores:

summary(T123)

##        V1               V2               V3               V4       
##  Min.   :0.1137   Min.   :0.2193   Min.   :0.6429   Min.   :0.949  
##  1st Qu.:0.6416   1st Qu.:1.2381   1st Qu.:0.9102   1st Qu.:1.808  
##  Median :0.9111   Median :1.8015   Median :0.9963   Median :2.119  
##  Mean   :1.0106   Mean   :2.0170   Mean   :1.0034   Mean   :2.237  
##  3rd Qu.:1.2918   3rd Qu.:2.5972   3rd Qu.:1.0941   3rd Qu.:2.544  
##  Max.   :3.5681   Max.   :8.0094   Max.   :1.4473   Max.   :5.526

# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=50")

# Supongamos un valor para theta
theta <- 2

# Calcular sesgo
  sesgo_T1 <- mean(T123[, 1]) - theta
  sesgo_T2 <- mean(T123[, 2]) - theta
  sesgo_T3 <- mean(T123[, 3]) - theta
  sesgo_T4 <- mean(T123[, 4]) - theta
  
  # Calcular varianza
  var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
  var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
  var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
  var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
  

# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")

## Supuesto valor de theta: 2

cat("\nSesgo de T1:", sesgo_T1, "\n")

## 
## Sesgo de T1: -0.9893564

cat("Varianza de T1:", var_T1, "\n\n")

## Varianza de T1: 0.263298

cat("Sesgo de T2:", sesgo_T2, "\n")

## Sesgo de T2: 0.01702039

cat("Varianza de T2:", var_T2, "\n\n")

## Varianza de T2: 1.128764

cat("Sesgo de T3:", sesgo_T3, "\n")

## Sesgo de T3: -0.9966194

cat("Varianza de T3:", var_T3, "\n\n")

## Varianza de T3: 0.01882351

cat("Sesgo de T4:", sesgo_T4, "\n")

## Sesgo de T4: 0.237174

cat("Varianza de T4:", var_T4, "\n")

## Varianza de T4: 0.380036

Conclusiones

Al realizar el análisis de los resultados con n= 50 se tiene que $\hat{θ}$ 1 y $\hat{θ}$ 3 tienen sesgos negativos, lo que indica una tendencia a subestimar el verdadero valor del parámetro. $\hat{θ}$ 2 y $\hat{θ}$ 4 tienen sesgos cercanos a cero, lo que sugiere que están centrados alrededor del verdadero valor del parámetro.

Al evaluar la eficiencia se tiene que la varianza más baja se observa en $\hat{θ}$ 3, lo que indica que este estimador podría ser más eficiente en comparación con los demás.

Al realizar el análisis comparando los resultados de los tamaños de n=20 y n=50 y se observa que en ambos casos, el estimador

\hat{θ}

3 parece ser el más insesgado, ya que su sesgo es cercano a cero. En cuanto a la eficiencia, la varianza de

\hat{θ}

3 es la más baja en ambos casos, lo que sugiere que

\hat{θ}

3 es el estimador más eficiente. En términos de consistencia, los sesgos de todos los estimadores no cambian significativamente al aumentar el tamaño de la muestra de 20 a 50, lo que sugiere que los estimadores son consistentes independientemente del tamaño de la muestra. se puede concluir que el estimador

\hat{θ}

3 es el más insesgado, y el más eficiente y los estimadores son consistentes independientemente del tamaño de la muestra.

Tamaño de muestra n = 100

n <- 100  # Tamaño de muestra
num_samples <- 1000  # Número de muestras a generar
set.seed(123)  # Esto asegura que los números generados sean reproducibles

# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
  muestra <- rexp(n, rate = 1)  # Generar muestra
  T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
  T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
  T123[i, 3] <- mean(muestra)
  T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}

# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)

# Mostrar resultados
cat("Resumen de los estimadores:\n")

## Resumen de los estimadores:

summary(T123)

##        V1               V2               V3               V4       
##  Min.   :0.1223   Min.   :0.2113   Min.   :0.7228   Min.   :1.343  
##  1st Qu.:0.6200   1st Qu.:1.2076   1st Qu.:0.9271   1st Qu.:2.123  
##  Median :0.9108   Median :1.7945   Median :0.9984   Median :2.465  
##  Mean   :0.9953   Mean   :1.9868   Mean   :0.9975   Mean   :2.576  
##  3rd Qu.:1.2902   3rd Qu.:2.5480   3rd Qu.:1.0617   3rd Qu.:2.916  
##  Max.   :3.5520   Max.   :6.9585   Max.   :1.3202   Max.   :5.526

# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=100")

# Supongamos un valor para theta
theta <- 2

# Calcular sesgo
  sesgo_T1 <- mean(T123[, 1]) - theta
  sesgo_T2 <- mean(T123[, 2]) - theta
  sesgo_T3 <- mean(T123[, 3]) - theta
  sesgo_T4 <- mean(T123[, 4]) - theta
  
  # Calcular varianza
  var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
  var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
  var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
  var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
  

# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")

## Supuesto valor de theta: 2

cat("\nSesgo de T1:", sesgo_T1, "\n")

## 
## Sesgo de T1: -1.004737

cat("Varianza de T1:", var_T1, "\n\n")

## Varianza de T1: 0.2612311

cat("Sesgo de T2:", sesgo_T2, "\n")

## Sesgo de T2: -0.01315317

cat("Varianza de T2:", var_T2, "\n\n")

## Varianza de T2: 1.125567

cat("Sesgo de T3:", sesgo_T3, "\n")

## Sesgo de T3: -1.002538

cat("Varianza de T3:", var_T3, "\n\n")

## Varianza de T3: 0.00956484

cat("Sesgo de T4:", sesgo_T4, "\n")

## Sesgo de T4: 0.5759165

cat("Varianza de T4:", var_T4, "\n")

## Varianza de T4: 0.3707602

Conclusiones

Se realiza análisis del Sesgo encontrando que $\hat{θ}$ 1 y $\hat{θ}$ 3 tienen sesgos negativos, lo que indica una tendencia a subestimar el verdadero valor del parámetro. $\hat{θ}$ 2 tiene un sesgo cercano a cero, lo que sugiere que está centrado alrededor del verdadero valor del parámetro. $\hat{θ}$ 4 tiene un sesgo positivo, lo que indica una tendencia a sobrestimar el verdadero valor del parámetro.

Al análizar la Eficiencia se observa que la varianza más baja se observa en

\hat{θ}

3, lo que indica que este estimador podría ser más eficiente en comparación con los demás.

Al comparar los estimadores con el tamaño de la muestra se observa que $\hat{θ}$ 3 parece ser el estimador más eficiente en términos de varianza en todos los tamaños de muestra. $\hat{θ}$ 1 y $\hat{θ}$ 3 tienen sesgos negativos, indicando una tendencia a subestimar el verdadero valor del parámetro. $\hat{θ}$ 2 muestra sesgos cercanos a cero en todos los tamaños de muestra. $\hat{θ}$ 4 exhibe un sesgo que cambia con el tamaño de la muestra, siendo positivo para muestras más grandes. En general, la varianza de los estimadores no sigue un patrón claro con respecto al tamaño de la muestra, pero $\hat{θ}$ 3 tiene consistentemente la varianza más baja.

Tamaño de muestra n = 1000

n <- 1000  # Tamaño de muestra
num_samples <- 1000  # Número de muestras a generar
set.seed(123)  # Esto asegura que los números generados sean reproducibles

# Generar múltiples muestras y calcular los estimadores
T123 <- matrix(NA, ncol = 4, nrow = num_samples)
for (i in 1:num_samples) {
  muestra <- rexp(n, rate = 1)  # Generar muestra
  T123[i, 1] <- ((muestra[1] + muestra[2]) / 6) + ((muestra[3] + muestra[4]) / 3)
  T123[i, 2] <- (muestra[1] + 2 * muestra[2] + 3 * muestra[3] + 4 * muestra[4]) / 5
  T123[i, 3] <- mean(muestra)
  T123[i, 4] <- (min(muestra) + max(muestra)) / 2
}

# Convertir la matriz en un data frame
T123 <- as.data.frame(T123)

# Mostrar resultados
cat("Resumen de los estimadores:\n")

## Resumen de los estimadores:

summary(T123)

##        V1                V2               V3               V4       
##  Min.   :0.07363   Min.   :0.1733   Min.   :0.8733   Min.   :2.534  
##  1st Qu.:0.59554   1st Qu.:1.1519   1st Qu.:0.9798   1st Qu.:3.334  
##  Median :0.89634   Median :1.7434   Median :0.9983   Median :3.661  
##  Mean   :0.98088   Mean   :1.9603   Mean   :0.9998   Mean   :3.771  
##  3rd Qu.:1.25858   3rd Qu.:2.5344   3rd Qu.:1.0213   3rd Qu.:4.072  
##  Max.   :3.80608   Max.   :8.0326   Max.   :1.1082   Max.   :7.266

# Graficar
boxplot(T123, las = 1, main = "Comparación estimadores con n=1000")

# Supongamos un valor para theta
theta <- 2

# Calcular sesgo
  sesgo_T1 <- mean(T123[, 1]) - theta
  sesgo_T2 <- mean(T123[, 2]) - theta
  sesgo_T3 <- mean(T123[, 3]) - theta
  sesgo_T4 <- mean(T123[, 4]) - theta
  
  # Calcular varianza
  var_T1 <- apply(T123[, 1, drop = FALSE], 2, var)
  var_T2 <- apply(T123[, 2, drop = FALSE], 2, var)
  var_T3 <- apply(T123[, 3, drop = FALSE], 2, var)
  var_T4 <- apply(T123[, 4, drop = FALSE], 2, var)
  

# Mostrar resultados
cat("Supuesto valor de theta:", theta, "\n")

## Supuesto valor de theta: 2

cat("\nSesgo de T1:", sesgo_T1, "\n")

## 
## Sesgo de T1: -1.019116

cat("Varianza de T1:", var_T1, "\n\n")

## Varianza de T1: 0.2662982

cat("Sesgo de T2:", sesgo_T2, "\n")

## Sesgo de T2: -0.03974307

cat("Varianza de T2:", var_T2, "\n\n")

## Varianza de T2: 1.191116

cat("Sesgo de T3:", sesgo_T3, "\n")

## Sesgo de T3: -1.000194

cat("Varianza de T3:", var_T3, "\n\n")

## Varianza de T3: 0.000934193

cat("Sesgo de T4:", sesgo_T4, "\n")

## Sesgo de T4: 1.771412

cat("Varianza de T4:", var_T4, "\n")

## Varianza de T4: 0.4224341

Conclusiones

Al realizar el análisis incluyendo n= 1000 se observa que en cuanto a la propiedad de insensgadez que el sesgo de $\hat{θ}$ 1 y $\hat{θ}$ 3 muestran sesgos negativos, lo que sugiere una tendencia a subestimar el verdadero valor del parámetro. $\hat{θ}$ 2 tiene un sesgo cercano a cero. $\hat{θ}$ 4 tiene un sesgo positivo, indicando una tendencia a sobrestimar el verdadero valor del parámetro.

En cuanto a la eficiencia la varianza más baja se observa en $\hat{θ}$ 3, lo que sugiere que este estimador podría ser más eficiente que los demás.

Al evaluar la Consistencia se observa que la varianza extremadamente baja de $\hat{θ}$ 3 sugiere una alta precisión y posiblemente consistencia en la estimación del parámetro.

Se puede concluir que:

\hat{θ}

\hat{θ}

2 y

\hat{θ}

4 tienen sesgos, pero

\hat{θ}

3 parece ser insesgado o tener un sesgo muy pequeño.

\hat{θ}

3 muestra la varianza más baja, lo que sugiere una mayor eficiencia en comparación con los otros estimadores.

\hat{θ}

3 también tiene un sesgo pequeño y negativo, con lo que se puede interpretar que es consistente en la estimación del parámetro.

\hat{θ}

1 y

\hat{θ}

4 tienen sesgos que podrían afectar la precisión de la estimación del parámetro.

\hat{θ}

2 muestra un sesgo cercano a cero, pero su varianza es alta en comparación con

\hat{θ}

3, lo que sugiere que podría ser menos eficiente en la estimación del parámetro. Se concluye que el estimador

\hat{θ}

3 es el estimador más favorable en términos de insesgadez, eficiencia y consistencia.

Actividad 2

Sergio Andres Rueda Gonzalez - Giovanni Sanchez Soto

2024-03-17

Problema 2

Tamaño de muestra n = 20

Conclusiones

Tamaño de muestra n = 50

Conclusiones

Tamaño de muestra n = 100

Conclusiones

Tamaño de muestra n = 1000

Conclusiones