Problema 1

Propiedades de estimadores

La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:

“Modelos de Estudio”
“Modelos de Estudio”

Solucion del problema planteado

Para poder dar solución al Problema primero debemos realizar una seria de pasos los cuales son :

  1. Inicializamos las variables de programación donde:
    • Muestras es la cantidad de muestras que manejaremos , para nuestro primer caso serán 20
    • N el numero de registros que tendrá cada muestra, para nuestro caso serán 20
    • Lambda de 0.5 debido a que es el negativo de 2

#seteamos la cantidad de muestras a ser tramitadas
Muestras=4
N=20
lambda=0.5
lista = list()
vectornombre =c()
vectornombremitad1 =c()
vectornombremitad2 =c()
#total de recorridos
numIni=1
numfin=Muestras/2

#segundo corte
numIni2=(Muestras/2)+1
numfin2=Muestras
j=1

  1. Ahora procederemos a crear los vectores de muestras que van desde X1 hasta Xn según las parametrización anterior y creamos un dataframe con los vectores creados , los vectores y dataframe creados son:

## [1] "vectores creados:"
## [1] "Muestra completa:"
## [1] "X1" "X2" "X3" "X4"
## [1] "Muestra de las dos mitades:"
## [1] "X1" "X2"
## [1] "X3" "X4"
## [1] "Muestra de data frame creado:"
##            X1        X2         X3        X4
## 1  0.78498932 0.5143789 1.24703088 4.6697909
## 2  0.39355552 0.1941256 6.50380874 0.8318970
## 3  5.19651965 0.1014664 1.11658821 2.5329085
## 4  0.96341655 2.6411156 1.90518056 3.3888331
## 5  0.68800820 5.6412779 2.79691139 0.5795586
## 6  0.98458787 2.8448432 1.44075143 0.8548124
## 7  0.03902342 1.7856077 0.02287216 3.1704445
## 8  0.74653135 1.5965512 0.66883886 1.7103814
## 9  0.60829273 1.1337478 1.94199863 0.2551734
## 10 3.46274300 1.2567207 0.37103370 7.1351895

  1. Ahora procederemos a crear las funciones de cada uno de los estimadores

#creamos las funciones de los 4 estimadores
#estimador numero 1
PrimerEstimador <- function(DataFrame){
 

  #genereamos las sumas de la primera mitad
  primeraparte=rowSums(DataFrame[ ,vectornombremitad1])/6

  #genereamos las sumas de la segunda mitad
  segundaaparte=rowSums(DataFrame[ ,vectornombremitad2])/3

  #resultadoFinal
  resultado1=primeraparte+segundaaparte
  
  #retornamos el resultado
  return(resultado1)
  

}

#estimador numero 2
SegundoEstimador <- function(DataFrame){
 resultadosum=0

  #generamos las sumatoria de todos los campos y se miltiplica por la secuencia
  for (i in 1:Muestras) {
    NameVariable =paste("X",i, sep = "")
    resultadosum=((DataFrame[ ,NameVariable])*i) +resultadosum
  }

  #resultadoFinal
  resultado1=resultadosum/(Muestras+1)
  
  #retornamos el resultado
  return(resultado1)

}

#estimador numero 3
TercerEstimador <- function(DataFrame){
 #genereamos las sumas de toda el data frame
  completa=rowSums(DataFrame[ ,vectornombre])

  #resultadoFinal
  resultado1=completa/Muestras
  
  #retornamos el resultado
  return(resultado1)

}

#estimador numero 4
CuartoEstimador <- function(DataFrame){
 #genereamos del minimo del dataframe
  primeraparte=apply(DataFrame,1, max)

  #genereamos el maximo del dataframe
  segundaaparte=apply(DataFrame,1, min)

  #resultadoFinal
  resultado1=(primeraparte+segundaaparte)/2
  
  #retornamos el resultado
  return(resultado1)

}

  1. Realizamos la grafica de cajas para los estimadores calculados

#resultado del primer estimador
T1 = PrimerEstimador(DataFrame)
T2 = SegundoEstimador(DataFrame)
T3 = TercerEstimador(DataFrame)
T4 = CuartoEstimador(DataFrame)

#T1 = apply(DataFrame,1,PrimerEstimador)
#T2 = apply(DataFrame,1,SegundoEstimador)
#T3 = apply(DataFrame,1,TercerEstimador)
#T4 = apply(DataFrame,1,CuartoEstimador)

#creamos el dataframe con los estimadores
Boxplot=data.frame(T1,T2,T3,T4)

#creamos el bloxpot de los estimadores
boxplot(Boxplot)
abline(h=2, col="red")

  1. A continuación se colocan un pequeño resumen para ver su media, mediana, varianza

#generamos un sumary del bloxplot
summary(Boxplot)
##        T1               T2               T3               T4       
##  Min.   :0.8089   Min.   : 1.701   Min.   :0.9848   Min.   :1.099  
##  1st Qu.:1.4744   1st Qu.: 3.036   1st Qu.:1.6137   1st Qu.:1.802  
##  Median :1.9715   Median : 3.755   Median :1.9074   Median :2.158  
##  Mean   :2.2100   Mean   : 4.477   Mean   :2.1897   Mean   :2.456  
##  3rd Qu.:2.5635   3rd Qu.: 5.185   3rd Qu.:2.3307   3rd Qu.:3.170  
##  Max.   :4.9213   Max.   :10.337   Max.   :5.4069   Max.   :4.054
## [1] "las variancias para T1 fue 1.11774610825248 para T2 fue de: 5.0465885472291 para T3 fue de: 1.17550806853217 para T4 fue de: 0.843391735257848"

  1. generamos los mismos resultados aumentado la muestra a 50 registros

##        T1               T2              T3               T4        
##  Min.   :0.6667   Min.   :1.315   Min.   :0.6936   Min.   :0.6568  
##  1st Qu.:1.2970   1st Qu.:2.666   1st Qu.:1.3648   1st Qu.:1.3526  
##  Median :1.9056   Median :3.530   Median :1.8367   Median :2.1805  
##  Mean   :1.9440   Mean   :3.932   Mean   :2.0194   Mean   :2.4106  
##  3rd Qu.:2.2996   3rd Qu.:4.852   3rd Qu.:2.5024   3rd Qu.:2.8608  
##  Max.   :4.6609   Max.   :9.834   Max.   :5.6879   Max.   :9.1886
##           T1       T2        T3       T4
## T1 0.7682930 1.650099 0.8037625 1.028427
## T2 1.6500987 3.724150 1.6545948 2.130964
## T3 0.8037625 1.654595 0.9715625 1.280037
## T4 1.0284270 2.130964 1.2800372 2.149405
## [1] "las variancias para T1 fue 0.768293016540131 para T2 fue de: 3.72414986876081 para T3 fue de: 0.971562489009812 para T4 fue de: 2.14940546925178"

  1. generamos los mismos resultados aumentado la muestra a 100 registros

##        T1               T2                T3               T4        
##  Min.   :0.5131   Min.   : 0.8683   Min.   :0.5879   Min.   :0.5967  
##  1st Qu.:1.1704   1st Qu.: 2.3781   1st Qu.:1.3136   1st Qu.:1.5043  
##  Median :1.8630   Median : 3.8660   Median :1.7628   Median :2.1518  
##  Mean   :1.9867   Mean   : 4.0697   Mean   :1.9410   Mean   :2.2942  
##  3rd Qu.:2.4891   3rd Qu.: 4.9524   3rd Qu.:2.4315   3rd Qu.:2.8111  
##  Max.   :5.0611   Max.   :12.0520   Max.   :4.1986   Max.   :7.4467
##           T1       T2        T3        T4
## T1 0.9220482 1.945710 0.7824087 1.0029616
## T2 1.9457102 4.297296 1.6058005 2.1233962
## T3 0.7824087 1.605800 0.7546296 0.9084197
## T4 1.0029616 2.123396 0.9084197 1.3388976
## [1] "las variancias para T1 fue 0.922048221991947 para T2 fue de: 4.29729603685213 para T3 fue de: 0.754629620672232 para T4 fue de: 1.3388975948146"

  1. generamos los mismos resultados aumentado la muestra a 1000 registros

##        T1               T2                T3               T4         
##  Min.   :0.2751   Min.   : 0.4124   Min.   :0.2616   Min.   : 0.2627  
##  1st Qu.:1.2575   1st Qu.: 2.4769   1st Qu.:1.3011   1st Qu.: 1.4737  
##  Median :1.8018   Median : 3.5871   Median :1.8514   Median : 2.0910  
##  Mean   :2.0010   Mean   : 3.9900   Mean   :2.0073   Mean   : 2.3557  
##  3rd Qu.:2.5256   3rd Qu.: 5.0489   3rd Qu.:2.5760   3rd Qu.: 3.0312  
##  Max.   :6.6727   Max.   :15.1346   Max.   :7.1286   Max.   :10.0501
##           T1       T2        T3       T4
## T1 1.0721495 2.202130 0.9688458 1.145293
## T2 2.2021300 4.706804 1.9403061 2.292140
## T3 0.9688458 1.940306 0.9827634 1.157042
## T4 1.1452932 2.292140 1.1570416 1.612139
## [1] "las variancias para T1 fue 1.07214948156479 para T2 fue de: 4.70680403548507 para T3 fue de: 0.982763412413505 para T4 fue de: 1.61213944648694"

Resultado

  1. los estimadores serán evaluados bajo las propiedades de Insesgadez, eficiencia y consistencia
    1.1. insesgadez
    Primer estimador se considera insesgado debido a que su media o centro esta muy cerca del 2, su comportamiento para las muestras fue:
## [1] "Para la muestra de 20 regisro la media fue  2.20994976464467"


## [1] "Para la muestra de 50 regisro la media fue  1.94398775312011"


## [1] "Para la muestra de 100 regisro la media fue  1.98664973496881"


## [1] "Para la muestra de 1000 regisro la media fue  2.00102611785622"


Segundo estimador se considera sesgado debido a que su media o centro esta muy lejos del 2, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la media fue  4.4771954101751"


## [1] "Para la muestra de 50 regisro la media fue  3.93233340193805"


## [1] "Para la muestra de 100 regisro la media fue  4.06966684963019"


## [1] "Para la muestra de 1000 regisro la media fue  3.98997698350806"


Tercer estimador se considera insesgado debido a que su media o centro esta muy cerca del 2, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la media fue  2.18967690060123"


## [1] "Para la muestra de 50 regisro la media fue  2.01941927476285"


## [1] "Para la muestra de 100 regisro la media fue  1.9409948501079"


## [1] "Para la muestra de 1000 regisro la media fue  2.00731835109281"


Cuarto estimador se considera insesgado debido a que su media o centro esta muy cerca del 2, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la media fue  2.45562993055249"


## [1] "Para la muestra de 50 regisro la media fue  2.410623651746"


## [1] "Para la muestra de 100 regisro la media fue  2.29420354928487"


## [1] "Para la muestra de 1000 regisro la media fue  2.3556864878574"

1.2. Eficiencia
Primer estimador se considera Eficiente debido a que su varianza es pequeña, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la Varianza fue:  1.11774610825248"


## [1] "Para la muestra de 50 regisro la Varianza fue:  0.768293016540131"


## [1] "Para la muestra de 100 regisro la Varianza fue:  0.922048221991947"


## [1] "Para la muestra de 1000 regisro la Varianza fue:  1.07214948156479"

Segundo estimador se considera Ineficiente debido a que su varianza es bastante alta muy lejos del 2, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la Varianza fue:  5.0465885472291"


## [1] "Para la muestra de 50 regisro la Varianza fue:  3.72414986876081"


## [1] "Para la muestra de 100 regisro la Varianza fue:  4.29729603685213"


## [1] "Para la muestra de 1000 regisro la Varianza fue:  4.70680403548507"

Tercer estimador se considera insesgado debido a que su media o centro esta muy cerca del 2, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la Varianza fue:  1.17550806853217"


## [1] "Para la muestra de 50 regisro la Varianza fue:  0.971562489009812"


## [1] "Para la muestra de 100 regisro la Varianza fue:  0.754629620672232"


## [1] "Para la muestra de 1000 regisro la Varianza fue:  0.982763412413505"

Cuarto estimador se considera insesgado debido a que su media o centro esta muy cerca del 2, su comportamiento para las muestras fue:

## [1] "Para la muestra de 20 regisro la Varianza fue:  0.843391735257848"


## [1] "Para la muestra de 50 regisro la Varianza fue:  2.14940546925178"


## [1] "Para la muestra de 100 regisro la Varianza fue:  1.3388975948146"


## [1] "Para la muestra de 1000 regisro la Varianza fue:  1.61213944648694"
1.3. Consistencia

Primer estimador podemos determinar que es consistente debido a que entre mas registros tiene la muestra se acerca mas a la media
Segundo estimador podemos determinar que no es consistente debido a que entre mas registros tiene la muestra se aleja de meda
Tercer estimador podemos determinar que es el mas consistente debido a que entre mas registros tiene la muestra se acerca mas a la media
Cuarto estimador podemos determinar que es consistente debido a que entre mas registros tiene la muestra se acerca mas a la media
los anterior resultados pueden variar dependiendo de la ejecucion de la simulaicon pero los comportamientos no cambian

Conclusion

Luego de realizado el análisis y de determinado el comportamiento de cada uno de los estimadores podemos llegar a las siguientes conclusiones:
Los estimadores 1, 3 y 4 presentan insesgadez además de ser eficientes y consistentes
El estimador 2 es sesgado y además poco eficiente
El estimador 3 según el análisis es el que mas se acerca a la media solicitada y tienes los menores valores de varianza y media lo que lo hace el mejor estimador de las 4 opciones