PONTIFICIA UNIVERSIDAD JAVERIANA DE CALI
La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1, X2, X3 y X4, una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
\[ \hat{\theta}_1 = \frac{X_1 + X_2}{6} + \frac{X_3 + X_4}{3} \].
\[ \hat{\theta}_2 = \frac{X_1 + 2X_2 + 3X_3 + 4X_4}{5} \].
\[ \hat{\theta}_3 = \frac{X_1 + X_2 + X_3 + X_4}{4} \].
\[ \hat{\theta}_4 = \frac{min(X_1, X_2, X_3, X_4)+max(X_1, X_2, X_3, X_4)}{2} \].
Nota:
Genere una muestras de n=20, 50, 100 y 1000 para cada uno de los estimadores planteados.
En cada caso evalue las propiedades de insesgadez, eficiencia y consistencia
Suponga un valor para el parámetro θ
Para el ejercicio se supone un valor del parámetro igual a 60.
Para \(n=20\)
n=20
x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)
datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2
datat=data.frame(E1,E2,E3,E4)
#gráfica
library (ggplot2)
library(tidyr)
# Crear un dataframe largo para la gráfica
data_es <- datat %>%
pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")
grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
geom_boxplot() +
geom_jitter(alpha = 0.1)+
geom_hline(yintercept = 60, linetype = "solid", color = "red")
print(grafica)
medias=round(apply(datat, 2, mean),2)
varianzas=round(apply(datat,2,var),2)
cat(" Tabla 1. Valor de medias y varianzas n=20")
Tabla 1. Valor de medias y varianzas n=20
rbind(medias, varianzas)
E1 E2 E3 E4
medias 62.13 122.64 61.03 72.05
varianzas 979.68 3156.76 714.95 1874.62
Conclusión: Los estimadores que más se acercan al parámetro son el E1 con un media aritmética de 62.13 y varianza de 979.69 y el E3 con una media aritmética de 61.03 y varianza de 714.95, pero el de mejor comportamiento es el E3.
Para \(n=50\)
n=50
x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)
datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2
datat=data.frame(E1,E2,E3,E4)
# Crear un dataframe largo para la gráfica
data_es <- datat %>%
pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")
grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
geom_boxplot() +
geom_jitter(alpha = 0.1)+
geom_hline(yintercept = 60, linetype = "solid", color = "red")
print(grafica)
medias=apply(datat, 2, mean)
varianzas=apply(datat,2,var)
cat("Tabla 2. Valor de medias y varianzas n= 50")
Tabla 2. Valor de medias y varianzas n= 50
rbind(medias, varianzas)
E1 E2 E3 E4
medias 62.08521 124.3894 61.55177 68.47497
varianzas 740.44175 3031.3488 641.82964 927.98670
Conclusión: Los estimadores que más se acercan al parámetro son el E1 con un media aritmética de 62.08 y varianza de 740.44 y el E3 con una media aritmética de 61.55 y varianza de 641.82, pero el de mejor comportamiento sigue siendo el E3.
Para \(n=100\)
n=100
x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)
datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2
datat=data.frame(E1,E2,E3,E4)
#gráfica
library (ggplot2)
library(tidyr)
# Crear un dataframe largo para la gráfica
data_es <- datat %>%
pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")
grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
geom_boxplot() +
geom_jitter(alpha = 0.1)+
geom_hline(yintercept = 60, linetype = "solid", color = "red")
print(grafica)
medias=round(apply(datat, 2, mean),2)
varianzas=round(apply(datat,2,var),2)
cat("Tabla 3. Valor de medias y varianza n=100")
Tabla 3. Valor de medias y varianza n=100
rbind(medias, varianzas)
E1 E2 E3 E4
medias 60.17 121.67 60.23 70.90
varianzas 980.81 3967.82 871.64 1300.38
Conclusión: Los estimadores que más se acercan al parámetro son el E1 con un media aritmética de 60.17 y varianza de 980.81 y el E3 con una media aritmética de 60.23 y varianza de 871.64, pero el de mejor comportamiento sigue siendo el E3 con una mimima varienza.
Para \(n=1000\)
n=1000
x1=rexp(n, 1/60)
x2=rexp(n, 1/60)
x3=rexp(n, 1/60)
x4=rexp(n,1/60)
datos=data.frame(x1,x2,x3,x4)
E1=(x1+x2)/6 + (x3+x4)/3
E2=(x1+2*x2+3*x3+4*x4)/5
E3=(x1+x2+x3+x4)/4
minx=apply(datos,1, min)
maxx=apply(datos, 1, max)
E4=(minx+maxx)/2
datat=data.frame(E1,E2,E3,E4)
#gráfica
library (ggplot2)
library(tidyr)
# Crear un dataframe largo para la gráfica
data_es <- datat %>%
pivot_longer(cols = c(E1, E2, E3, E4), names_to = "Estimadores", values_to = "Valores")
grafica <- ggplot(data_es, aes(x =Estimadores , y = Valores, fill =Estimadores )) +
geom_boxplot() +
geom_jitter(alpha = 0.1)+
geom_hline(yintercept = 60, linetype = "solid", color = "red")
print(grafica)
medias=round(apply(datat, 2, mean),2)
varianzas=round(apply(datat,2,var),2)
cat("Tabla 4. Valor de medias y varianzas n=1000")
Tabla 4. Valor de medias y varianzas n=1000
rbind(medias, varianzas)
E1 E2 E3 E4
medias 60.21 120.32 60.27 70.46
varianzas 1059.70 4582.17 991.05 1523.47
Los estimadores que más se acercan al parámetro son el E1 y E3, pero el de mejor comportamiento sigue siendo el E3 con una mimima varienza.
Se puede concluir que el mejor estimador para calcular el valor del parámetro es \(\hat{\theta}_3\), donde se acerca al parámetro con minima varianza, cumpliendo con la propiedad de insesgado, eficiente y consistente a medida que se aumenta el tamaño de la muestra.