La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son. insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
Para poder dar solución al Problema primero debemos realizar una seria de pasos los cuales son :
#seteamos la cantidad de muestras a ser tramitadas
Muestras=4
N=20
lambda=0.5
lista = list()
vectornombre =c()
vectornombremitad1 =c()
vectornombremitad2 =c()
#total de recorridos
numIni=1
numfin=Muestras/2
#segundo corte
numIni2=(Muestras/2)+1
numfin2=Muestras
j=1
## [1] "vectores creados:"
## [1] "Muestra completa:"
## [1] "X1" "X2" "X3" "X4"
## [1] "Muestra de las dos mitades:"
## [1] "X1" "X2"
## [1] "X3" "X4"
## [1] "Muestra de data frame creado:"
## X1 X2 X3 X4
## 1 0.78498932 0.5143789 1.24703088 4.6697909
## 2 0.39355552 0.1941256 6.50380874 0.8318970
## 3 5.19651965 0.1014664 1.11658821 2.5329085
## 4 0.96341655 2.6411156 1.90518056 3.3888331
## 5 0.68800820 5.6412779 2.79691139 0.5795586
## 6 0.98458787 2.8448432 1.44075143 0.8548124
## 7 0.03902342 1.7856077 0.02287216 3.1704445
## 8 0.74653135 1.5965512 0.66883886 1.7103814
## 9 0.60829273 1.1337478 1.94199863 0.2551734
## 10 3.46274300 1.2567207 0.37103370 7.1351895
#creamos las funciones de los 4 estimadores
#estimador numero 1
PrimerEstimador <- function(DataFrame){
#genereamos las sumas de la primera mitad
primeraparte=rowSums(DataFrame[ ,vectornombremitad1])/6
#genereamos las sumas de la segunda mitad
segundaaparte=rowSums(DataFrame[ ,vectornombremitad2])/3
#resultadoFinal
resultado1=primeraparte+segundaaparte
#retornamos el resultado
return(resultado1)
}
#estimador numero 2
SegundoEstimador <- function(DataFrame){
resultadosum=0
#generamos las sumatoria de todos los campos y se miltiplica por la secuencia
for (i in 1:Muestras) {
NameVariable =paste("X",i, sep = "")
resultadosum=((DataFrame[ ,NameVariable])*i) +resultadosum
}
#resultadoFinal
resultado1=resultadosum/(Muestras+1)
#retornamos el resultado
return(resultado1)
}
#estimador numero 3
TercerEstimador <- function(DataFrame){
#genereamos las sumas de toda el data frame
completa=rowSums(DataFrame[ ,vectornombre])
#resultadoFinal
resultado1=completa/Muestras
#retornamos el resultado
return(resultado1)
}
#estimador numero 4
CuartoEstimador <- function(DataFrame){
#genereamos del minimo del dataframe
primeraparte=apply(DataFrame,1, max)
#genereamos el maximo del dataframe
segundaaparte=apply(DataFrame,1, min)
#resultadoFinal
resultado1=(primeraparte+segundaaparte)/2
#retornamos el resultado
return(resultado1)
}
#resultado del primer estimador
T1 = PrimerEstimador(DataFrame)
T2 = SegundoEstimador(DataFrame)
T3 = TercerEstimador(DataFrame)
T4 = CuartoEstimador(DataFrame)
#T1 = apply(DataFrame,1,PrimerEstimador)
#T2 = apply(DataFrame,1,SegundoEstimador)
#T3 = apply(DataFrame,1,TercerEstimador)
#T4 = apply(DataFrame,1,CuartoEstimador)
#creamos el dataframe con los estimadores
Boxplot=data.frame(T1,T2,T3,T4)
#creamos el bloxpot de los estimadores
boxplot(Boxplot)
abline(h=2, col="red")
#generamos un sumary del bloxplot
summary(Boxplot)
## T1 T2 T3 T4
## Min. :0.8089 Min. : 1.701 Min. :0.9848 Min. :1.099
## 1st Qu.:1.4744 1st Qu.: 3.036 1st Qu.:1.6137 1st Qu.:1.802
## Median :1.9715 Median : 3.755 Median :1.9074 Median :2.158
## Mean :2.2100 Mean : 4.477 Mean :2.1897 Mean :2.456
## 3rd Qu.:2.5635 3rd Qu.: 5.185 3rd Qu.:2.3307 3rd Qu.:3.170
## Max. :4.9213 Max. :10.337 Max. :5.4069 Max. :4.054
## [1] "las variancias para T1 fue 1.11774610825248 para T2 fue de: 5.0465885472291 para T3 fue de: 1.17550806853217 para T4 fue de: 0.843391735257848"
## T1 T2 T3 T4
## Min. :0.6667 Min. :1.315 Min. :0.6936 Min. :0.6568
## 1st Qu.:1.2970 1st Qu.:2.666 1st Qu.:1.3648 1st Qu.:1.3526
## Median :1.9056 Median :3.530 Median :1.8367 Median :2.1805
## Mean :1.9440 Mean :3.932 Mean :2.0194 Mean :2.4106
## 3rd Qu.:2.2996 3rd Qu.:4.852 3rd Qu.:2.5024 3rd Qu.:2.8608
## Max. :4.6609 Max. :9.834 Max. :5.6879 Max. :9.1886
## T1 T2 T3 T4
## T1 0.7682930 1.650099 0.8037625 1.028427
## T2 1.6500987 3.724150 1.6545948 2.130964
## T3 0.8037625 1.654595 0.9715625 1.280037
## T4 1.0284270 2.130964 1.2800372 2.149405
## [1] "las variancias para T1 fue 0.768293016540131 para T2 fue de: 3.72414986876081 para T3 fue de: 0.971562489009812 para T4 fue de: 2.14940546925178"
## T1 T2 T3 T4
## Min. :0.5131 Min. : 0.8683 Min. :0.5879 Min. :0.5967
## 1st Qu.:1.1704 1st Qu.: 2.3781 1st Qu.:1.3136 1st Qu.:1.5043
## Median :1.8630 Median : 3.8660 Median :1.7628 Median :2.1518
## Mean :1.9867 Mean : 4.0697 Mean :1.9410 Mean :2.2942
## 3rd Qu.:2.4891 3rd Qu.: 4.9524 3rd Qu.:2.4315 3rd Qu.:2.8111
## Max. :5.0611 Max. :12.0520 Max. :4.1986 Max. :7.4467
## T1 T2 T3 T4
## T1 0.9220482 1.945710 0.7824087 1.0029616
## T2 1.9457102 4.297296 1.6058005 2.1233962
## T3 0.7824087 1.605800 0.7546296 0.9084197
## T4 1.0029616 2.123396 0.9084197 1.3388976
## [1] "las variancias para T1 fue 0.922048221991947 para T2 fue de: 4.29729603685213 para T3 fue de: 0.754629620672232 para T4 fue de: 1.3388975948146"
## T1 T2 T3 T4
## Min. :0.2751 Min. : 0.4124 Min. :0.2616 Min. : 0.2627
## 1st Qu.:1.2575 1st Qu.: 2.4769 1st Qu.:1.3011 1st Qu.: 1.4737
## Median :1.8018 Median : 3.5871 Median :1.8514 Median : 2.0910
## Mean :2.0010 Mean : 3.9900 Mean :2.0073 Mean : 2.3557
## 3rd Qu.:2.5256 3rd Qu.: 5.0489 3rd Qu.:2.5760 3rd Qu.: 3.0312
## Max. :6.6727 Max. :15.1346 Max. :7.1286 Max. :10.0501
## T1 T2 T3 T4
## T1 1.0721495 2.202130 0.9688458 1.145293
## T2 2.2021300 4.706804 1.9403061 2.292140
## T3 0.9688458 1.940306 0.9827634 1.157042
## T4 1.1452932 2.292140 1.1570416 1.612139
## [1] "las variancias para T1 fue 1.07214948156479 para T2 fue de: 4.70680403548507 para T3 fue de: 0.982763412413505 para T4 fue de: 1.61213944648694"
## [1] "Para la muestra de 20 regisro la media fue 2.20994976464467"
## [1] "Para la muestra de 50 regisro la media fue 1.94398775312011"
## [1] "Para la muestra de 100 regisro la media fue 1.98664973496881"
## [1] "Para la muestra de 1000 regisro la media fue 2.00102611785622"
• Segundo estimador se considera sesgado debido a que su
media o centro esta muy lejos del 2, su comportamiento para las muestras
fue:
## [1] "Para la muestra de 20 regisro la media fue 4.4771954101751"
## [1] "Para la muestra de 50 regisro la media fue 3.93233340193805"
## [1] "Para la muestra de 100 regisro la media fue 4.06966684963019"
## [1] "Para la muestra de 1000 regisro la media fue 3.98997698350806"
• Tercer estimador se considera insesgado debido a que
su media o centro esta muy cerca del 2, su comportamiento para las
muestras fue:
## [1] "Para la muestra de 20 regisro la media fue 2.18967690060123"
## [1] "Para la muestra de 50 regisro la media fue 2.01941927476285"
## [1] "Para la muestra de 100 regisro la media fue 1.9409948501079"
## [1] "Para la muestra de 1000 regisro la media fue 2.00731835109281"
• Cuarto estimador se considera insesgado debido a que
su media o centro esta muy cerca del 2, su comportamiento para las
muestras fue:
## [1] "Para la muestra de 20 regisro la media fue 2.45562993055249"
## [1] "Para la muestra de 50 regisro la media fue 2.410623651746"
## [1] "Para la muestra de 100 regisro la media fue 2.29420354928487"
## [1] "Para la muestra de 1000 regisro la media fue 2.3556864878574"
1.2. Eficiencia
• Primer estimador se considera
Eficiente debido a que su varianza es pequeña, su comportamiento para
las muestras fue:
## [1] "Para la muestra de 20 regisro la Varianza fue: 1.11774610825248"
## [1] "Para la muestra de 50 regisro la Varianza fue: 0.768293016540131"
## [1] "Para la muestra de 100 regisro la Varianza fue: 0.922048221991947"
## [1] "Para la muestra de 1000 regisro la Varianza fue: 1.07214948156479"
• Segundo estimador se considera Ineficiente debido a que su
varianza es bastante alta muy lejos del 2, su comportamiento para las
muestras fue:
## [1] "Para la muestra de 20 regisro la Varianza fue: 5.0465885472291"
## [1] "Para la muestra de 50 regisro la Varianza fue: 3.72414986876081"
## [1] "Para la muestra de 100 regisro la Varianza fue: 4.29729603685213"
## [1] "Para la muestra de 1000 regisro la Varianza fue: 4.70680403548507"
• Tercer estimador se considera insesgado debido a que su
media o centro esta muy cerca del 2, su comportamiento para las muestras
fue:
## [1] "Para la muestra de 20 regisro la Varianza fue: 1.17550806853217"
## [1] "Para la muestra de 50 regisro la Varianza fue: 0.971562489009812"
## [1] "Para la muestra de 100 regisro la Varianza fue: 0.754629620672232"
## [1] "Para la muestra de 1000 regisro la Varianza fue: 0.982763412413505"
• Cuarto estimador se considera insesgado debido a que su
media o centro esta muy cerca del 2, su comportamiento para las muestras
fue:
## [1] "Para la muestra de 20 regisro la Varianza fue: 0.843391735257848"
## [1] "Para la muestra de 50 regisro la Varianza fue: 2.14940546925178"
## [1] "Para la muestra de 100 regisro la Varianza fue: 1.3388975948146"
## [1] "Para la muestra de 1000 regisro la Varianza fue: 1.61213944648694"
1.3. Consistencia Luego de realizado el análisis y de determinado el comportamiento de cada uno de los estimadores podemos llegar a las siguientes conclusiones: • Los estimadores 1, 3 y 4 presentan insesgadez además de ser eficientes y consistentes • El estimador 2 es sesgado y además poco eficiente • El estimador 3 según el análisis es el que mas se acerca a la media solicitada y tienes los menores valores de varianza y media lo que lo hace el mejor estimador de las 4 opciones