Primero generamos los estimadores de referencia.
muestra=rexp(4,rate = 0.5) # vector con cuatro datos que siguen una distribucion exponencial
# crear funciones que calculan los estimadores propuestos
est_1=function(x){
e=((x[1]+x[2])/6)+((x[3]+x[4])/3)
return(e)
}
est_2=function(x){
e=(x[1]+2*x[2]+3*x[3]+4*x[4])/5
return(e)
}
est_3=function(x){
e=mean(x)
return(e)
}
est_4=function(x){
e=(min(x)+max(x))/2
return(e)
}
# sesgo
library(ggplot2)
n=20 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
s=x-rate
}
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)
## [1] 4 20
# calculo de los estimadores
estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)
# calculo de sesgo
sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)
# varianza
var_estim=function(x){
var=(x-mean(x))^2/n
return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)
varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)
ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="sesgo estimadores")+
theme_bw()
En esta gráfica podemos observar que todos los estimadores tienen sesgo y por ende no se puede confiar en el resultado de la muestra.
ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="varianza estimadores")+
theme_bw()
Esta gráfica nos permite observar el alto nivel de eficiencia de los cuatro estimadores con una ligera superioridad del estimador 3.
# sesgo
library(ggplot2)
n=50 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
s=x-rate
}
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)
## [1] 4 50
# calculo de los estimadores
estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)
# calculo de sesgo
sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)
# varianza
var_estim=function(x){
var=(x-mean(x))^2/n
return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)
varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)
ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="sesgo estimadores")+
theme_bw()
En esta gráfica podemos observar que todos los estimadores mantiene el sesgo y por ende no se puede confiar en el resultado de la muestra.
ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="varianza estimadores")+
theme_bw()
Esta gráfica nos permite observar que se mantiene el alto nivel de eficiencia de los cuatro estimadores y se equiparan el estimador 1 y el estimador 3, así mismo es claro que el estimador menos eficiente es el estimador 2.
# sesgo
library(ggplot2)
n=100 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
s=x-rate
}
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)
## [1] 4 100
# calculo de los estimadores
estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)
# calculo de sesgo
sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)
# varianza
var_estim=function(x){
var=(x-mean(x))^2/n
return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)
varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)
ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="sesgo estimadores")+
theme_bw()
En esta gráfica podemos observar que todos los estimadores mantiene el sesgo y por ende no se puede confiar en el resultado de la muestra.
ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="varianza estimadores")+
theme_bw()
Esta gráfica nos permite observar que se mantiene el alto nivel de eficiencia de los cuatro estimadores.
# sesgo
library(ggplot2)
n=1000 # cantidad de simulaciones
rate=0.5 # valor real
sesgo=function(x){
s=x-rate
}
sim1=replicate(n = n,expr = rexp(4,rate = rate)) # simulacion
dim(sim1)
## [1] 4 1000
# calculo de los estimadores
estim_1=apply(sim1,2,est_1)
estim_2=apply(sim1,2,est_2)
estim_3=apply(sim1,2,est_3)
estim_4=apply(sim1,2,est_4)
# calculo de sesgo
sesgo_1=sesgo(estim_1)
sesgo_2=sesgo(estim_2)
sesgo_3=sesgo(estim_3)
sesgo_4=sesgo(estim_4)
estimadores=c(sesgo_1,sesgo_2,sesgo_3,sesgo_4)
tipo_est=gl(n = 4,k = n,length = 4*n,labels = c("estim_1","estim_2","estim_3","estim_4"))
datos_sesgo=data.frame(tipo_est,estimadores)
# varianza
var_estim=function(x){
var=(x-mean(x))^2/n
return(var)
}
v_est_1=var_estim(estim_1)
v_est_2=var_estim(estim_2)
v_est_3=var_estim(estim_3)
v_est_4=var_estim(estim_4)
varianzas=c(v_est_1,v_est_2,v_est_3,v_est_4)
datos_varianzas=data.frame(tipo_est,varianzas)
ggplot(datos_sesgo,aes(y=estimadores,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="sesgo estimadores")+
theme_bw()
En esta gráfica podemos observar que todos los estimadores mantiene el sesgo y por ende independientemente del tamaño de la muestra el sesgo es una constante.
ggplot(datos_varianzas,aes(y=varianzas,x=tipo_est,fill=tipo_est))+
geom_boxplot()+
labs(y="varianza estimadores")+
theme_bw()
Esta gráfica nos permite observar que se mantiene el alto nivel de eficiencia de los cuatro estimadores.
Por otra parte es preciso anotar que se cumple el principio de consistencia, puesto que la eficiencia de los estimadores aumenta a la medida que aumenta el tamaño de la muestra, sin embargo, estos aumentos son marginalmelte decrecientes.
Tambièn preciso apuntar que en la medida que crece el tamaño de la muestra aumenta el sesgo observado.