Ejercicios 7.3 (Ruben)

1.- Escribir el cÃ³digo necesario para generar, por el mÃ©todo de inversiÃ³n, una muestra de n observaciones de una distribuciÃ³n de Cauchy.

#Usando el mÃ©todo de inversiÃ³n
rcauchy <- function(){
  U <- runif(1)
  return(tan(pi*(U-0.5)))
}

# SimulaciÃ³n n valores
rcauchyn <- function(n = 1000) {
  x <- numeric(n)
  for(i in 1:n) x[i]<-rcauchy()
  return(x)
}

Generar una muestra de \(10^{4}\) observaciones y obtener el tiempo de CPU.

set.seed(54321)
system.time(x <- rcauchyn(10^4))

##    user  system elapsed 
##    0.16    0.04    0.28

Representar el histograma (limitar el rango, e.g. \(xlim =c(-10, 10))\) y compararlo con la densidad teÃ³rica (dcauchy).

hist(x, breaks = "FD", xlim = c(-10,10), freq = FALSE)
curve(dcauchy(x),col='red', lwd=2, add = TRUE)

Notemos que parece que sigue una distribucion de Cauchy.

Obtener conclusiones sobre la existencia de una media teÃ³rica a partir de la media muestral aproximada por simulaciÃ³n (estudiar la convergencia de la media muestral). Suponiendo que el vector x contiene las simulaciones, estudiar la convergencia de la media muestral mediante el grÃ¡fico:\(plot(1:nsim, cumsum(x)/(1:nsim), type="l", ylab="Media muestral", xlab="NÂº de simulaciones")\)

plot(1:10^4, cumsum(x)/(1:10^4),lwd=2, type="l", ylab="Media muestral", xlab="NÂº de simulaciones")

Notemos que mientras mas simulaciones la variable converge a 0.

2.- El tiempo de respuesta (en centÃ©simas de segundo) de un servidor de bases de datos es una variable con funciÃ³n de densidad: \[ f(x) = x e^{-x}, \text{ si } x \geq 0 \]

Escribir el cÃ³digo necesario para generar, por el mÃ©todo de aceptaciÃ³n-rechazo, una muestra de n observaciones de esta distribuciÃ³n empleando como densidad auxiliar una exponencial: \[ g(x) = \lambda e^{-\lambda x}, \text{ si } x \geq 0 \] a) Aproximar numericamente el parÃ¡metro optimo \(\lambda_{opt}<1\) y la cota Ã³ptima \(c_{opt}\) de la densidad auxiliar y compararlos con los valores teoricos: \(\lambda_{opt} = \frac{1}{2}\) y \(c_{opt}=\frac{4}{e}\)

#Funcion de densidad
fun_ejer_2 <- function(x){
  ifelse((x>=0),x*exp(-x),0)
}

#Valores c y lambda Ã³ptimos
fopt <- function(lambda) {
  # Fijamos lambda
  optimize(f = function(x){fun_ejer_2(x)/dexp(x,lambda)},
           maximum=TRUE, interval=c(0,10))$objective
}
# Encontar lambda
res <- optimize(f=function(x){fopt(x)}, interval=c(0,10))
lambda.opt <- res$minimum
c.opt <- res$objective

cat("\n c Ã³ptimo = ", c.opt)

## 
##  c Ã³ptimo =  1.471518

#que es proximo a 4/exp(1)

cat("Lambda Ã³ptimo = ", lambda.opt)

## Lambda Ã³ptimo =  0.5000085

#que es proximo a 1/2

Generar una muestra de 1000 observaciones de la distribuciÃ³n de interÃ©s (tomando como semilla inicial el nÂº de grupo multiplicado por 100). Obtener el tiempo de CPU que tarda en generar la secuencia y calcular el nÃºmero medio de generaciones de la distribuciÃ³n auxiliar.

rfun <- function() {
  # SimulaciÃ³n por aceptaciÃ³n-rechazo
  while (TRUE) {
    U <- runif(1)
    X <- rexp(1,lambda.opt)
    n <<- n+1 
    if (c.opt * U * dexp(X,lambda.opt) <= fun_ejer_2(X)) return(X)
  }
}

rfunn <- function(n=1000) {
  # SimulaciÃ³n n valores 
  x <- numeric(n)
  for(i in 1:n) x[i]<-rfun()
  return(x)
}

#fijamos la semilla
set.seed(500)
n<-0
system.time(x <- rfunn(1000))

##    user  system elapsed 
##    0.08    0.00    0.15

cat("NÂº de generaciones = ", n)

## NÂº de generaciones =  1471

cat("\nNÂº medio de generaciones = ", n/1000)

## 
## NÂº medio de generaciones =  1.471

cat("\nProporciÃ³n de rechazos = ", 1-n/1000, "\n")

## 
## ProporciÃ³n de rechazos =  -0.471

Representar el histograma y compararlo con la densidad teÃ³rica.

hist(x, breaks="FD", freq=FALSE)
curve(fun_ejer_2(x), col='red',lwd=2,add=TRUE)

Ejercicios 7.3 (Ruben)

Xavier Jurado Cuesta

13 de mayo de 2019