Propiedades de los estimadores

Informe 2

Primero generamos los estimadores de referencia.

muestra=rexp(4,rate = 0.5) # vector con cuatro datos que siguen una distribucion exponencial

# crear funciones que calculan los estimadores propuestos
est_1=function(x){
  e=((x[1]+x[2])/6)+((x[3]+x[4])/3)
  return(e)
}
est_2=function(x){
  e=(x[1]+2*x[2]+3*x[3]+4*x[4])/5
  return(e)
}
est_3=function(x){
  e=mean(x)
  return(e)
}
est_4=function(x){
  e=(min(x)+max(x))/2
  return(e)
}

Generando una muestra de n=20

# sesgo
library(ggplot2)
n=20 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
  s=x-rate
  }
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)

## [1]  4 20

# calculo de los estimadores

estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)

# calculo de sesgo

sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)

# varianza

var_estim=function(x){
  var=(x-mean(x))^2/n
  return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)

varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)

ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="sesgo estimadores")+
  theme_bw()

En esta gráfica podemos observar que todos los estimadores tienen sesgo y por ende no se puede confiar en el resultado de la muestra.

ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="varianza estimadores")+
  theme_bw()

Esta gráfica nos permite observar el alto nivel de eficiencia de los cuatro estimadores con una ligera superioridad del estimador 3.

Generando una muestra de n=50

# sesgo
library(ggplot2)
n=50 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
  s=x-rate
  }
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)

## [1]  4 50

# calculo de los estimadores

estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)

# calculo de sesgo

sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)

# varianza

var_estim=function(x){
  var=(x-mean(x))^2/n
  return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)

varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)

ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="sesgo estimadores")+
  theme_bw()

En esta gráfica podemos observar que todos los estimadores mantiene el sesgo y por ende no se puede confiar en el resultado de la muestra.

ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="varianza estimadores")+
  theme_bw()

Esta gráfica nos permite observar que se mantiene el alto nivel de eficiencia de los cuatro estimadores y se equiparan el estimador 1 y el estimador 3, así mismo es claro que el estimador menos eficiente es el estimador 2.

Generando una muestra de n=100

# sesgo
library(ggplot2)
n=100 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
  s=x-rate
  }
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)

## [1]   4 100

# calculo de los estimadores

estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)

# calculo de sesgo

sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)

# varianza

var_estim=function(x){
  var=(x-mean(x))^2/n
  return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)

varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)

ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="sesgo estimadores")+
  theme_bw()

En esta gráfica podemos observar que todos los estimadores mantiene el sesgo y por ende no se puede confiar en el resultado de la muestra.

ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="varianza estimadores")+
  theme_bw()

Esta gráfica nos permite observar que se mantiene el alto nivel de eficiencia de los cuatro estimadores.

Generando una muestra de n=1000

# sesgo
library(ggplot2)
n=1000 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
  s=x-rate
  }
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)

## [1]    4 1000

# calculo de los estimadores

estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)

# calculo de sesgo

sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)

# varianza

var_estim=function(x){
  var=(x-mean(x))^2/n
  return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)

varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)

ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="sesgo estimadores")+
  theme_bw()

En esta gráfica podemos observar que todos los estimadores mantiene el sesgo y por ende independientemente del tamaño de la muestra el sesgo es una constante.

ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
  geom_boxplot()+
  labs(y="varianza estimadores")+
  theme_bw()

Esta gráfica nos permite observar que se mantiene el alto nivel de eficiencia de los cuatro estimadores.

Por otra parte es preciso anotar que se cumple el principio de consistencia, puesto que la eficiencia de los estimadores aumenta a la medida que aumenta el tamaño de la muestra, sin embargo, estos aumentos son marginalmelte decrecientes.

Tambièn preciso apuntar que en la medida que crece el tamaño de la muestra aumenta el sesgo observado.

Propiedades de los Estimadores

Edwin Hernández

2023-09-15