PROPIEDADES DE LOS est

La simulación ayuda a entender y validar las propiedades de los estimadores estadísticos como son insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
θ1ˆ=(X1+X2)/6+(X3+X4)/3
θ2ˆ=(X1+2X2+3X3+4X4)/5
θ3ˆ=(X1+X2+X3+X4)/4
θ4ˆ=(min{X1,X2,X3,X4}+max{X1,X2,X3,X4})/2
Nota:
+ Genere una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados.
+ En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia
+ Suponga un valor para el parámetro θ
+ funciones recomendadas : function(){}, rexp() , data.frame(), apply(), boxplot()
set.seed(1)
informe_2 <- function(n) {
  
  x1 = rexp(n,6);x2 = rexp(n,6);x3 = rexp(n, 6) ;x4 = rexp(n,6)
  
  datos = data.frame(x1,x2,x3,x4)
  dmin = apply(datos, 1, min) ### uso de la funcion appy
  dmax = apply(datos, 1, max)

  est = data.frame(
    t1 = (x1 + x2)/6 + (x3 + x4)/3,
    t2 = (x1 + 2*x2+ 3*x3+4*x4)/5,
    t3 = (x1+x2+x3+x4) / 4,
    t4 = (dmin + dmax)/2)
  
  colnames(est) <- c("est_propuesto 1", "est_propuesto 2", "est_propuesto 3", "est_propuesto 4")
  
  boxplot(est, main = paste(" muestra:", n),
          ylab = "Valor ", xlab = "est",notch = TRUE,outbg = "green",whiskcol = "red", outpch = 25,col = rgb(1, 0, 0, alpha = 0.4)) # Color de los bigotes)
  abline(h=0.2, col="blue")



  sesgo <- colMeans(est) - c(0.2, 0.2, 0.2, 0.2)  # Sesgo
  varianza <- apply(est, 2, var)  # Varianza
  eficiencia <- varianza + sesgo^2  # Eficiencia

  cat("tamaño de muestra:", n, "\n")
  
  cbind(sesgo,varianza,eficiencia)
}
Intento con 20 Muestras
informe_2(20)
## Warning in (function (z, notch = FALSE, width = NULL, varwidth = FALSE, : some
## notches went outside hinges ('box'): maybe set notch=FALSE

## tamaño de muestra: 20
##                       sesgo    varianza  eficiencia
## est_propuesto 1 -0.01352286 0.006288312 0.006471180
## est_propuesto 2  0.17678898 0.032427492 0.063681834
## est_propuesto 3 -0.01963904 0.004279601 0.004665293
## est_propuesto 4  0.01050837 0.009253131 0.009363557
Intento con 50 Muestras
informe_2(50)

## tamaño de muestra: 50
##                       sesgo    varianza  eficiencia
## est_propuesto 1 -0.03659382 0.007743606 0.009082714
## est_propuesto 2  0.13635851 0.038643788 0.057237431
## est_propuesto 3 -0.03619362 0.006151236 0.007461213
## est_propuesto 4 -0.01662053 0.009938925 0.010215167
Intento con 100 Muestras
informe_2(100)

## tamaño de muestra: 100
##                       sesgo    varianza  eficiencia
## est_propuesto 1 -0.03058713 0.008397672 0.009333245
## est_propuesto 2  0.13890398 0.036351594 0.055645910
## est_propuesto 3 -0.03514352 0.006244737 0.007479804
## est_propuesto 4 -0.00112908 0.011969677 0.011970952
Intento con 1000 Muestras
informe_2(1000)

## tamaño de muestra: 1000
##                        sesgo    varianza  eficiencia
## est_propuesto 1 -0.032672548 0.008126680 0.009194176
## est_propuesto 2  0.135521887 0.035871454 0.054237636
## est_propuesto 3 -0.031067730 0.007373413 0.008338617
## est_propuesto 4 -0.001654401 0.012701363 0.012704100

Resultado

El principal resultado se debe a que la gran a mayor cantidad se tenga la muestra esta va a ir generando valores atípicos en la muestra de 20 los datos no presenta ningún dato atípico, mientras que para una muestra de 50 este ya al menos refleja mínimo 2 datos atípicos para cada estimados, esto también se ve reflejado para una muestra de 100, pero para la muestra de 1000 estos datos atípicos se vuelven más presentes, Con respecto a los estimadores se evidencia que el estimador 2 es aquel que se diferencia en cualquiera de las 4 muestra teniendo cajas mucho más amplias y también su varianza es de las más altas, con respecto a la eficiencia en todas muestras es más alta y el estimador que menos eficiencia presenta es el número 3, por último el sesgo en el estimador 2 se encuentra positivo, en cualquiera de las muestras