La simulación emerge como una herramienta invaluable para comprender y validar las propiedades de los estimadores estadísticos. Entre estas propiedades, se destacan la insesgadez, la eficiencia y la consistencia, las cuales son esenciales para evaluar la calidad y la confiabilidad de los estimadores. En este contexto, el siguiente problema se presenta como una oportunidad para explorar las características de un conjunto de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad. A través de una muestra aleatoria compuesta por X1, X2, X3 y X4, extraída de una distribución exponencial con parámetro θ desconocido y de tamaño n=4, se llevará a cabo un análisis detallado de cada uno de los estimadores propuestos, con el objetivo de comprender su desempeño y su idoneidad en la estimación del parámetro en cuestión.
t1=(X1 + X2) / 6 + (X3 + X4) / 3
t2=(X1 + 2X2 + 3X3 + 4*X4) / 5
t3=(X1 + X2 + X3 + X4) / 4
t4=(min{X1,X2,X3,X4} + max{X1,X2,X3,X4}) / 2
n=20
x1 = rexp(n,2)
x2 = rexp(n,2)
x3 = rexp(n,2)
x4 = rexp(n,2)
datos=data.frame(x1,x2,x3,x4)
dmin=apply(datos,1,min)
dmax=apply(datos,1,max)
estimadores=data.frame(
t1=(x1+x2) / 6 + (x3+x4) /3,
t2=((x1+2*x2+3*x3+4*x4)) /5,
t3=(x1+x2+x3+x4) / 4,
t4=(dmin+dmax)/2)
boxplot(estimadores, main ="Diagrama de Cajas")
abline(h=0.5,col="red")## Descriptive Statistics
## estimadores
## N: 20
##
## t1 t2 t3 t4
## ------------- ------ ------ ------ ------
## Std.Dev 0.14 0.28 0.14 0.14
##
## Table: Resumen de la Desviación Estándar
## Descriptive Statistics
## estimadores
## N: 20
##
## t1 t2 t3 t4
## ---------- ------ ------ ------ ------
## Mean 0.37 0.73 0.39 0.43
##
## Table: Resumen de la Media Aritmética
Evaluación de la Muestra
Teniendo en cuenta que el valor correcto es 0.5, se evalúan los siguientes puntos:
Para t1, el estimador de la media muestral es 0.49, lo cual se encuentra cercano al valor verdadero de 0.5, indicando una aparente sesgo.
Para t3, el estimador de la media muestral es 0.51, también cercano a 0.5, lo que sugiere un posible sesgo.
En cuanto a t1, la desviación estándar es de 0.21, una cifra relativamente baja, lo que sugiere que el estimador de la media podría ser eficiente, con una variabilidad reducida.
n=50
x1 = rexp(n,2)
x2 = rexp(n,2)
x3 = rexp(n,2)
x4 = rexp(n,2)
datos=data.frame(x1,x2,x3,x4)
dmin=apply(datos,1,min)
dmax=apply(datos,1,max)
estimadores=data.frame(
t1=(x1+x2) / 6 + (x3+x4) /3,
t2=((x1+2*x2+3*x3+4*x4)) /5,
t3=(x1+x2+x3+x4) / 4,
t4=(dmin+dmax)/2)
boxplot(estimadores, main ="Diagrama de Cajas")
abline(h=0.5,col="red")## Descriptive Statistics
## estimadores
## N: 50
##
## t1 t2 t3 t4
## ------------- ------ ------ ------ ------
## Std.Dev 0.23 0.49 0.22 0.25
##
## Table: Resumen de la Desviación Estándar
## Descriptive Statistics
## estimadores
## N: 50
##
## t1 t2 t3 t4
## ---------- ------ ------ ------ ------
## Mean 0.51 1.05 0.49 0.57
##
## Table: Resumen de la Media Aritmética
Evaluación de la Muestra
Insesgadez:
Para t1, la media muestral de 0.52 sigue estando muy cerca del valor verdadero asumido de 0.5, sugiriendo insesgadez.
Para t3, la media muestral de 0.50 es exactamente el valor verdadero, indicando insesgadez.
Para t2, la media de 1.05 se aleja bastante de 0.5, por lo que probablemente esté sesgada.
*Para t4, con media de 0.57, hay un pequeño sesgo alejándose ligeramente de 0.5.
Eficiencia:
Para t1, la desviación estándar aumentó ligeramente de 0.21 a 0.27, sugiriendo una leve disminución en eficiencia.
Para t2, la desviación estándar de 0.56 es alta, indicando baja eficiencia.
Para t3, la desviación estándar disminuyó de 0.26 a 0.24, mejorando la eficiencia del estimador.
Para t4, la desviación estándar de 0.29 es similar a la muestra previa, manteniendo una eficiencia intermedia.
Consistencia: Al tener ahora dos muestras de diferente tamaño (n=20 y n=50), se puedo intentar evaluar tentativamente la consistencia comparando el comportamiento de los estimadores:
Para t1 y t3, las medias casi no cambiaron, manteniéndose cercanas al valor verdadero. Esto sugiere consistencia tentativa.
Para t2, la media aumentó aún más al pasar de 0.97 a 1.05, alejándose más del valor verdadero conforme n crece, lo que indica falta de consistencia.
Para t4, la media disminuyó levemente de 0.61 a 0.57, acercándose un poco más al valor verdadero, leve indicio de consistencia.
Con esta muestra más grande, t1 y t3 parecen mantenerse insesgados, t3 es el más eficiente, y ambos muestran un comportamiento consistente tentativo. Por otro lado, t2 exhibe sesgo, baja eficiencia e indicios de falta de consistencia. Para t4 hay un leve sesgo, eficiencia intermedia y un indicio de posible consistencia.
n=100
x1 = rexp(n,2)
x2 = rexp(n,2)
x3 = rexp(n,2)
x4 = rexp(n,2)
datos=data.frame(x1,x2,x3,x4)
dmin=apply(datos,1,min)
dmax=apply(datos,1,max)
estimadores=data.frame(
t1=(x1+x2) / 6 + (x3+x4) /3,
t2=((x1+2*x2+3*x3+4*x4)) /5,
t3=(x1+x2+x3+x4) / 4,
t4=(dmin+dmax)/2)
boxplot(estimadores, main ="Diagrama de Cajas")
abline(h=0.5,col="red")## Descriptive Statistics
## estimadores
## N: 100
##
## t1 t2 t3 t4
## ------------- ------ ------ ------ ------
## Std.Dev 0.31 0.64 0.30 0.39
##
## Table: Resumen de la Desviación Estándar
## Descriptive Statistics
## estimadores
## N: 100
##
## t1 t2 t3 t4
## ---------- ------ ------ ------ ------
## Mean 0.51 1.02 0.51 0.60
##
## Table: Resumen de la Media Aritmética
Evaluación de la Muestra
Insesgadez:
Para t1, la media de 0.52 sigue muy cercana a 0.5, manteniendo la insesgadez.
Para t3, la media de 0.53 es prácticamente igual a 0.5, reforzando su insesgadez.
Para t2, con media de 1.03, el sesgo persiste y se mantiene alejado del valor verdadero.
Para t4, la media de 0.62 indica un sesgo más pronunciado que en las muestras previas.
Eficiencia:
Para t1, la desviación estándar aumentó de 0.27 a 0.32, disminuyendo ligeramente su eficiencia.
Para t2, la desviación estándar de 0.64 es aún mayor, confirmando su baja eficiencia.
Para t3, la desviación estándar aumentó de 0.24 a 0.31, reduciendo algo su eficiencia.
Para t4, el aumento de 0.29 a 0.38 en la desviación estándar implica una disminución en eficiencia.
Consistencia:
Para t1, las medias se mantienen muy cercanas a 0.5 en las tres muestras, reforzando su consistencia.
Para t3, el mismo patrón de medias próximas a 0.5 avala su consistencia.
Para t2, las medias (0.97, 1.05, 1.03) se alejan aún más del valor verdadero conforme n aumenta, evidenciando falta de consistencia.
Para t4, las medias (0.61, 0.57, 0.62) fluctúan sin una trayectoria clara hacia 0.5, por lo que es difícil concluir sobre su consistencia.
Con esta muestra más grande se refuerza la evaluación de que t1 y t3 son estimadores insesgados, relativamente eficientes y consistentes. Por otro lado, t2 exhibe sesgo sustancial, baja eficiencia y clara falta de consistencia. Para t4 se observa un sesgo creciente, disminución de eficiencia, y su consistencia es incierta debido a su comportamiento fluctuante.
n=1000
x1 = rexp(n,2)
x2 = rexp(n,2)
x3 = rexp(n,2)
x4 = rexp(n,2)
datos=data.frame(x1,x2,x3,x4)
dmin=apply(datos,1,min)
dmax=apply(datos,1,max)
estimadores=data.frame(
t1=(x1+x2) / 6 + (x3+x4) /3,
t2=((x1+2*x2+3*x3+4*x4)) /5,
t3=(x1+x2+x3+x4) / 4,
t4=(dmin+dmax)/2)
boxplot(estimadores, main ="Diagrama de Cajas")
abline(h=0.5,col="red")## Descriptive Statistics
## estimadores
## N: 1000
##
## t1 t2 t3 t4
## ------------- ------ ------ ------ ------
## Std.Dev 0.28 0.59 0.26 0.34
##
## Table: Resumen de la Desviación Estándar
## Descriptive Statistics
## estimadores
## N: 1000
##
## t1 t2 t3 t4
## ---------- ------ ------ ------ ------
## Mean 0.52 1.03 0.52 0.61
##
## Table: Resumen de la Media Aritmética
Evaluación de la Muestra
Insesgadez:
Para t1, la media de 0.49 está muy cerca del valor verdadero de 0.5, reforzando su insesgadez.
Para t3, la media de 0.50 es exactamente el valor verdadero, confirmando su insesgadez.
Para t2, la media de 0.99 se mantiene alejada de 0.5, evidenciando un sesgo sustancial.
Para t4, la media de 0.59 indica un sesgo moderado pero menor que en muestras previas.
Eficiencia:
Para t1, la desviación estándar de 0.25 es la más baja observada, sugiriendo una mayor eficiencia.
Para t2, con desviación estándar de 0.53, mantiene una eficiencia relativamente baja.
Para t3, la desviación estándar de 0.24 es la menor, indicando el estimador más eficiente.
Para t4, la desviación estándar de 0.31 es similar a muestras anteriores, una eficiencia intermedia.
Consistencia:
Para t1, las medias son 0.49, 0.52, 0.52, 0.49 para n=20, 50, 100, 1000, mostrando una clara convergencia hacia 0.5, evidenciando consistencia.
Para t3, las medias 0.51, 0.50, 0.53, 0.50 también convergen claramente al valor verdadero, confirmando consistencia.
Para t2, las medias 0.97, 1.05, 1.03, 0.99 fluctúan sin converger a 0.5, exhibiendo falta de consistencia.
Para t4, las medias 0.61, 0.57, 0.62, 0.59 parecen acercarse un poco más a 0.5 con n=1000, leve indicio de posible consistencia.
Con esta muestra muy grande se refuerza aún más que t1 y t3 son estimadores insesgados, eficientes y consistentes. Por otro lado, t2 mantiene un sesgo importante, baja eficiencia relativa y se confirma su falta de consistencia. Para t4 hay un sesgo moderado, eficiencia intermedia, y aunque fluctúa, podría mostrar una leve tendencia hacia la consistencia con el gran tamaño de muestra.
t1 y t3:
t2:
t4:
En general, t1 y t3 exhiben las propiedades deseables de insesgadez, eficiencia y consistencia como estimadores. Por otro lado, t2 no cumple con estas propiedades. El caso de t4 es intermedio, con una leve tendencia hacia la consistencia pero con sesgos y eficiencia moderados.
Elaboró…… Ricardo Buitrago Umaña - Willy Corzo