La simulación ayuda a entender y validad las propiedades de los estimadores estadísticos como son, insesgadez, eficiencia y la consistencia principalmente. El siguiente problema permite evidenciar las principales características de un grupo de estimadores propuestos para la estimación de un parámetro asociado a un modelo de probabilidad.
Sean X1 , X2 , X3 y X4 , una muestra aleatoria de tamaño n=4 cuya población la conforma una distribución exponencial con parámetro θ desconocido. Determine las características de cada uno de los siguientes estimadores propuestos:
Paso 1: Creación de la función con cada uno de los estimadores
n = 4
teta = 2
funcion_estimadores <- function(repeticiones, nmuestra, teta) {
teta1_1 = c()
teta2_1 = c()
teta3_1 = c()
teta4_1 = c()
for (j in 1:repeticiones) {
rep = rexp(nmuestra, rate = teta)
datos = data.frame(matrix(data = rep, nrow = 1, ncol = nmuestra, byrow = TRUE))
teta1 = sum(datos[, 1:round(length(datos) / 2)], na.rm = TRUE) / (round(length(datos)) + 2) +
sum(datos[, (round(length(datos) / 2) + 1):length(datos)], na.rm = TRUE) / (round(length(datos)) - 2)
teta2 = c()
for (i in datos) {
x <- i * 2
teta2 <- append(teta2, x)
}
teta2 <- sum(teta2, na.rm = TRUE) / (length(datos) + 1)
teta3 <- sum(datos[, 1:length(datos)], na.rm = TRUE) / length(datos)
teta4 <- (min(datos, na.rm = TRUE) + max(datos, na.rm = TRUE)) / 2
teta1_1 = append(teta1_1, teta1)
teta2_1 = append(teta2_1, teta2)
teta3_1 = append(teta3_1, teta3)
teta4_1 = append(teta4_1, teta4)
}
boxplot(teta1_1, teta2_1, teta3_1, teta4_1, col = c("red", "blue", "yellow", "purple"))
promedio <- apply(data.frame(teta1_1, teta2_1, teta3_1, teta4_1), 2, mean, na.rm = TRUE)
varianza <- apply(data.frame(teta1_1, teta2_1, teta3_1, teta4_1), 2, var, na.rm = TRUE)
sesgo <- teta - promedio
print("promedio")
print(promedio)
print("varianza")
print(varianza)
print("sesgo")
print(sesgo)
}
Paso 2: Visualización de datos y resultados para n = 4
cuatro<-funcion_estimadores(1000,4,2)
## [1] "promedio"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.6476122 0.7898234 0.4936396 0.5724233
## [1] "varianza"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.13190589 0.15702088 0.06133628 0.10419039
## [1] "sesgo"
## teta1_1 teta2_1 teta3_1 teta4_1
## 1.352388 1.210177 1.506360 1.427577
veinte<-funcion_estimadores(1000,20,2)
## [1] "promedio"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.5104384 0.9632229 0.5056920 0.9190591
## [1] "varianza"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.01240320 0.04405097 0.01214155 0.09890512
## [1] "sesgo"
## teta1_1 teta2_1 teta3_1 teta4_1
## 1.489562 1.036777 1.494308 1.080941
cincuenta<-funcion_estimadores(1000,50,2)
## [1] "promedio"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.5029166 0.9845122 0.5021012 1.1161242
## [1] "varianza"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.005225721 0.019978093 0.005196302 0.088097293
## [1] "sesgo"
## teta1_1 teta2_1 teta3_1 teta4_1
## 1.4970834 1.0154878 1.4978988 0.8838758
cien<-funcion_estimadores(1000,100,2)
## [1] "promedio"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.5031416 0.9959907 0.5029753 1.2972406
## [1] "varianza"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.002538503 0.009937998 0.002534438 0.092626975
## [1] "sesgo"
## teta1_1 teta2_1 teta3_1 teta4_1
## 1.4968584 1.0040093 1.4970247 0.7027594
mil<-funcion_estimadores(1000,1000,2)
## [1] "promedio"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.4999709 0.9989439 0.4999714 1.8812250
## [1] "varianza"
## teta1_1 teta2_1 teta3_1 teta4_1
## 0.0002391283 0.0009545883 0.0002391246 0.1069382615
## [1] "sesgo"
## teta1_1 teta2_1 teta3_1 teta4_1
## 1.500029 1.001056 1.500029 0.118775
De acuerdo a la simulación con las diferentes numero de muestras podemos inferir que: