TAREA 2 - MODELOS NORMALES

1 MDELO NORMAL CON VARIANZA CONOCIDA

CASO

El consumo de electricidad de un hogar es un indicador importante para evaluar el impacto ambiental y económico de las actividades domésticas. Supongamos que queremos analizar el consumo de electricidad de un hogar en un año. Nos interesa saber cuál es el promedio de kilovatios hora (kWh) que consume el hogar cada mes, y cómo varía este promedio según los datos que tenemos. Caso. El consumo mensual de electricidad de un hogar se distribuye normalmente con una varianza de 4 kWh, pero la media es desconocida. Se desea conocer la media de esta distribución a partir de una muestra de 12 meses en los que se registró el consumo de electricidad en kilovatios hora (kWh):

120 125 118 122 124 119 121 123 126 117 120 122

Se considera que la distribución a priori para la media es normal con media 120 y varianza 16.

\[ \theta \sim N(\mu_{o}= 120, \quad \tau_{o}^2=16 )\]

a) Hallar la distribución posterior para la media.

y <- c(120  ,125    ,118    ,122    ,124    ,119    ,121    ,123    ,126    ,117    ,120    ,122)
# mean(y)
sigma2 <- 4
n <- length(y)
ymean <- mean(y)
mu.0 <- 120
tau2.0 <- 16

mu.n <- (mu.0/tau2.0 + sum(y)/sigma2)/(1/tau2.0 + n/sigma2)
tau2.n <- 1/(1/tau2.0 + n/sigma2)
mu.n
## [1] 121.3878
tau2.n
## [1] 0.3265306

Distribución posterior

\[ \theta|y \sim N(\mu_{12}= 121.3878, \quad \tau_{12}^2=0.3265306 )\]

b) Calcular la probabilidad posterior que la media sea menor de 122 kWh.

'P(𝜃< 122|y)' 
pnorm(122, mean = mu.n, sd = sqrt(tau2.n))
## [1] 0.8580116

c) Calcular la probabilidad que el consumo mensual promedio, obtenido en un nuevo mes, sea mayor de 120 kWh.

'P(y_ > 120|y)' 
1 - pnorm(120, mean = mu.n, sd = sqrt(tau2.n + sigma2)) 
## [1] 0.7476714

2 MDELO NORMAL CON MEDIA CONOCIDA

CASO

Un profesor de matemáticas quiere evaluar la consistencia de las notas que obtienen sus alumnos en un examen mediante la estimación de la variabilidad de las notas. Él sabe que la media de las notas es un 14, pero desconoce la varianza. Para ello, elige al azar una muestra de 20 alumnos y registra sus notas (en una escala de 0 a 20):

13.4 14.4 13.8 14.2 14.6 13.4 14.5 13.0 14.0 15.0 13.2 15.2 14.4 12.8 14.2 13.8 14.6 13.6 14.7 14.0

Suponga que a priori: \(σ^2=X^2_{Inv Escala} (v_0=4, σ_0^2=0.02)\)

a) Hallar la distribución posterior.

y <- c(13.4 ,14.4 ,13.8 ,14.2 ,14.6 ,13.4 ,14.5 ,13.0 ,14.0 ,15.0,
       13.2 ,15.2 ,14.4 ,12.8 ,14.2 ,13.8 ,14.6 ,13.6 ,14.7 ,14.0); y
##  [1] 13.4 14.4 13.8 14.2 14.6 13.4 14.5 13.0 14.0 15.0 13.2 15.2 14.4 12.8 14.2
## [16] 13.8 14.6 13.6 14.7 14.0
n <- length(y)
theta <- 14
v0 <- 4
sigma2.0 <- 0.02

vn <- v0 + n    ; vn
## [1] 24
sigma2.n <- (v0*sigma2.0 + sum((y - theta)^2))/vn ; sigma2.n
## [1] 0.3508333

Distribución Posterior

\[σ^2|y=X^2_{Inv Escala} (v_{20}=24, σ_{20}^2=0.3508333)\]

b) Calcular la probabilidad posterior que el profesor esté satisfecho con la consistencia de las notas, es decir, que la varianza sea menor o igual que 0,4.

'P(sigma2 <= 0.4|y)'
library(extraDistr)
pinvchisq(0.4, nu = vn, tau = sigma2.n)
## [1] 0.6357738

Mediante simulación

library(geoR)
RNGkind(sample.kind = "Rejection")
set.seed(2023) 
sigma2 <- geoR::rinvchisq(10000000, df = vn, scale = sigma2.n) 
prob <- mean(sigma2 < 0.4) ; prob
## [1] 0.635969
sigma2.1 <- extraDistr::rinvchisq(10000000, nu =vn, tau=sigma2.n)
prob2 <- mean(sigma2.1 < 0.4) ; prob2
## [1] 0.6358501

  1. Universidad Nacional Agraria La Molina, ↩︎