Simulación con n= 4

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.

Sean X1 , X2 , X3 y X4 , una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

Paso 1: Creación de la función con cada uno de los estimadores

n = 4
teta = 2

funcion_estimadores <- function(repeticiones, nmuestra, teta) {
  teta1_1 = c()
  teta2_1 = c()
  teta3_1 = c()
  teta4_1 = c()
  
  for (j in 1:repeticiones) {
    
    rep = rexp(nmuestra, rate = teta)
    datos = data.frame(matrix(data = rep, nrow = 1, ncol = nmuestra, byrow = TRUE))
    
    
    teta1 = sum(datos[, 1:round(length(datos) / 2)], na.rm = TRUE) / (round(length(datos)) + 2) + 
      sum(datos[, (round(length(datos) / 2) + 1):length(datos)], na.rm = TRUE) / (round(length(datos)) - 2)
    
    
    teta2 = c()
    for (i in datos) {
      x <- i * 2
      teta2 <- append(teta2, x)
    }
    teta2 <- sum(teta2, na.rm = TRUE) / (length(datos) + 1)
    
    teta3 <- sum(datos[, 1:length(datos)], na.rm = TRUE) / length(datos)
    teta4 <- (min(datos, na.rm = TRUE) + max(datos, na.rm = TRUE)) / 2
    
    teta1_1 = append(teta1_1, teta1)
    teta2_1 = append(teta2_1, teta2)
    teta3_1 = append(teta3_1, teta3)
    teta4_1 = append(teta4_1, teta4)
  }
  
  boxplot(teta1_1, teta2_1, teta3_1, teta4_1, col = c("red", "blue", "yellow", "purple"))
  
  promedio <- apply(data.frame(teta1_1, teta2_1, teta3_1, teta4_1), 2, mean, na.rm = TRUE)
  varianza <- apply(data.frame(teta1_1, teta2_1, teta3_1, teta4_1), 2, var, na.rm = TRUE)
  sesgo <- teta - promedio
  
  print("promedio")
  print(promedio)
  print("varianza")
  print(varianza)
  print("sesgo")
  print(sesgo)
  
}

Paso 2: Visualización de datos y resultados para n = 4

cuatro<-funcion_estimadores(1000,4,2)

## [1] "promedio"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 0.6476122 0.7898234 0.4936396 0.5724233 
## [1] "varianza"
##    teta1_1    teta2_1    teta3_1    teta4_1 
## 0.13190589 0.15702088 0.06133628 0.10419039 
## [1] "sesgo"
##  teta1_1  teta2_1  teta3_1  teta4_1 
## 1.352388 1.210177 1.506360 1.427577

Simulación con n= 20

veinte<-funcion_estimadores(1000,20,2)

## [1] "promedio"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 0.5104384 0.9632229 0.5056920 0.9190591 
## [1] "varianza"
##    teta1_1    teta2_1    teta3_1    teta4_1 
## 0.01240320 0.04405097 0.01214155 0.09890512 
## [1] "sesgo"
##  teta1_1  teta2_1  teta3_1  teta4_1 
## 1.489562 1.036777 1.494308 1.080941

Simulación con n= 50

cincuenta<-funcion_estimadores(1000,50,2)

## [1] "promedio"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 0.5029166 0.9845122 0.5021012 1.1161242 
## [1] "varianza"
##     teta1_1     teta2_1     teta3_1     teta4_1 
## 0.005225721 0.019978093 0.005196302 0.088097293 
## [1] "sesgo"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 1.4970834 1.0154878 1.4978988 0.8838758

Simulación con n= 100

cien<-funcion_estimadores(1000,100,2)

## [1] "promedio"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 0.5031416 0.9959907 0.5029753 1.2972406 
## [1] "varianza"
##     teta1_1     teta2_1     teta3_1     teta4_1 
## 0.002538503 0.009937998 0.002534438 0.092626975 
## [1] "sesgo"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 1.4968584 1.0040093 1.4970247 0.7027594

Simulación con n= 1000

mil<-funcion_estimadores(1000,1000,2)

## [1] "promedio"
##   teta1_1   teta2_1   teta3_1   teta4_1 
## 0.4999709 0.9989439 0.4999714 1.8812250 
## [1] "varianza"
##      teta1_1      teta2_1      teta3_1      teta4_1 
## 0.0002391283 0.0009545883 0.0002391246 0.1069382615 
## [1] "sesgo"
##  teta1_1  teta2_1  teta3_1  teta4_1 
## 1.500029 1.001056 1.500029 0.118775

Conclusiones

De acuerdo a la simulación con las diferentes numero de muestras podemos inferir que: