setwd("~/ProbabilidadYEstadistica")

Introducción a los procesos estocástico

En la teoría de la probabilidad, un proceso estocástico es un concepto matemático que sirve para usar magnitudes aleatorias que varían con el tiempo o para caracterizar una sucesión de variables aleatorias (estocásticas) que evolucionan en función de otra variable, generalmente el tiempo. Cada una de las variables aleatorias del proceso tiene su propia función de distribución de probabilidad y pueden o no estar correlacionadas entre sí.

Cada variable o conjunto de variables sometidas a influencias o efectos aleatorios constituye un proceso estocástico. Un proceso estocástico \(xt\) puede entenderse como una familia uniparamétrica de variables aleatorias indexadas mediante el tiempo t. Los procesos estocásticos permiten tratar procesos dinámicos en los que hay cierta aleatoriedad.

Los siguientes son ejemplos dentro del amplio grupo de las series temporales: • señales de telecomunicación; • señales biomédicas (electrocardiograma, encefalograma, etc.); • señales sísmicas; • el número de manchas solares año tras año; • el índice de la bolsa segundo a segundo; • la evolución de la población de un municipio año tras año; • el tiempo de espera en la cola de cada uno de los usuarios que van llegando a una ventanilla; • el clima, un gigantesco conjunto de procesos estocásticos interrelacionados (velocidad del viento, humedad del aire, etcétera) que evolucionan en el espacio y en el tiempo; • los procesos estocásticos de orden mayor a uno, como el caso de una serie de tiempo de orden 2 y una correlación de cero con las demás observaciones.

Cádenas de markov

Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen memoria, “Recuerdan” el último evento y esto condiciona las posibilidades de los eventos futuros.

Esta dependencia del evento anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. En los negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra,los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo.

-> Ejemplo: Suponga que la posibilidad que llueva mañana depende de las condiciones del estado del clima de hoy. No importa las condiciones de los días anteriores, solo del estado del clima de hoy.

Suponga también que si llueve hoy, entonces lloverá mañana con una probabilidad α, y si no llueve hoy, entonces lloverá mañana con una probabilidad β.

library(markovchain)
## Package:  markovchain
## Version:  0.8.5-2
## Date:     2020-09-07
## BugReport: https://github.com/spedygiorgio/markovchain/issues
library(expm)
## Loading required package: Matrix
## 
## Attaching package: 'expm'
## The following object is masked from 'package:Matrix':
## 
##     expm
library(tm)
## Loading required package: NLP
library(dplyr)
## 
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
## 
##     filter, lag
## The following objects are masked from 'package:base':
## 
##     intersect, setdiff, setequal, union
library(tidyr)
## 
## Attaching package: 'tidyr'
## The following objects are masked from 'package:Matrix':
## 
##     expand, pack, unpack
library(diagram)
## Loading required package: shape
library(shape)

Ejercicio de cadena de markov en R

documentación del paquete markovchain: https://cran.r-project.org/web/packages/markovchain/markovchain.pdf

Esta libreria pretende proveer objetos para realizar analisis estadísticos de cadenas de markov a tiempos discretos. Asumamos que tenemos una cadena de markov X={X1,X2,…} definida en el espacio de estados S={a,b,c} y cuya matriz de transición es:

\[ P = \left( {\begin{array}{ccc} 0 & 0.5 & 0.5 \\ 0.5 & 0 & 0.5 \\ 0.5 & 0.5 & 0 \\ \end{array} } \right)\]

Dicha cadena podemos crearla en R, de la siguiente forma:

Crear la matriz de transicion P:

P = matrix(c(0,0.5,0.5,.5,0,.5,.5,.5,0),nrow = 3,byrow = TRUE) 
P
##      [,1] [,2] [,3]
## [1,]  0.0  0.5  0.5
## [2,]  0.5  0.0  0.5
## [3,]  0.5  0.5  0.0

El argumento “nrows” de la funcion matrix es para declarar el numero de filas que deseamos que nuestra matriz P posea, y el argumento “byrows” es para que almacene los elementos de la matriz almacenados en c(), fila por fila.

Crear la matriz de transición creamos el objeto “markovchain” de la siguiente forma:

mc = new("markovchain",transitionMatrix=P,states=c("a","b","c"),name="Cadena 1") 
  • La estructura del objeto mc (cadena de markov) esta dad por str:
str(mc)
## Formal class 'markovchain' [package "markovchain"] with 4 slots
##   ..@ states          : chr [1:3] "a" "b" "c"
##   ..@ byrow           : logi TRUE
##   ..@ transitionMatrix: num [1:3, 1:3] 0 0.5 0.5 0.5 0 0.5 0.5 0.5 0
##   .. ..- attr(*, "dimnames")=List of 2
##   .. .. ..$ : chr [1:3] "a" "b" "c"
##   .. .. ..$ : chr [1:3] "a" "b" "c"
##   ..@ name            : chr "Cadena 1"
  • Resumen de la cadena de markov 1:
summary(mc)
## Cadena 1  Markov chain that is composed by: 
## Closed classes: 
## a b c 
## Recurrent classes: 
## {a,b,c}
## Transient classes: 
## NONE 
## The Markov chain is irreducible 
## The absorbing states are: NONE

Para visualizar la transición de la cadena, utilizamos el comando plot:

plot(mc)

  • absorbingStates(): Identifica los estados Absorbentes

  • transientStates(): Identifica los estados Transitorios

  • recurrentClasses(): Identifica las clases recurrentes

Para la cadena de markov definida se obtiene que:

recurrentClasses(mc)
## [[1]]
## [1] "a" "b" "c"
transientStates(mc)
## character(0)
absorbingStates(mc)
## character(0)

Análisis probabilístico

Para conocer la probabilidad de transición en 1 paso entre un estado y otro basta con utilizar la función transitionProbability(), con los argumentos:

  • object: la cadena de markov

  • t0: el estado en el tiempo 0

  • t1: el estado en el tiempo 1

La probabilidad de transicion en un paso del estado “a” al estado “c” es:

transitionProbability(object = mc , t0="a", t1="c")
## [1] 0.5

Recuerde que dicha probabilidad es un elemento de la matriz de transición P, por lo tanto, la probabilidad de transicion del estado “a” al estado “b” es simplemente P23

mc[2,3]
## [1] 0.5

Es posible computar la matriz de transición en n pasos, simplemente computando la n-ésima potencia de la matriz de transición P, como ejemplo calcularemos la matriz de transición en n = 5 pasos.

n = 5 #el numero de pasos al futuro
mc^5
## Cadena 1^5 
##  A  3 - dimensional discrete Markov Chain defined by the following states: 
##  a, b, c 
##  The transition matrix  (by rows)  is defined as follows: 
##         a       b       c
## a 0.31250 0.34375 0.34375
## b 0.34375 0.31250 0.34375
## c 0.34375 0.34375 0.31250

Tambien se pueden conocer la distribución de la cadena en n pasos adelante (P(Xn)) multiplicando la distribucion inicial de X0 por la matriz de transición en n pasos (Pn), calcule la distribución de la cadena en el tiempo n = 6, si la ditribución inicial de la cadena es “(0.5, 0.2, 0.3)”.

x0 <- c(0.5,0.2,0.3) # La distribución de X en t = 0
n = 6
Xn = x0*(mc^n)
Xn
##              a       b         c
## [1,] 0.3359375 0.33125 0.3328125

Puesto que Xn es una función de densidad, la suma de las probabilidades en todos los estados debe ser 1.

sum(Xn)
## [1] 1

Finalmente encontrar la distribución estacionaria de la cadena se obtiene mediante la función “steadyStates” de la siguiente forma:

DistEst <- steadyStates(mc)
DistEst
##              a         b         c
## [1,] 0.3333333 0.3333333 0.3333333

Recuerde que los tiempos medio de recurrencia son los inversos multiplicativos de la distribución estacionaria y pueden ser computados facilmente.

M <- 1/DistEst
M
##      a b c
## [1,] 3 3 3

-> Asignación

Dibuje el diagrama de transición, determine las clases de comunicación de las siguientes cadenas de Markov, clasifique éstas como recurrentes o transitorias (20%), y encuentre la distribución estacionaria si existe (10%).

\[ P = \left( {\begin{array}{cccc} 1/2 & 1/2 & 0 & 0 \\ 0 & 1/2 & 1/2 & 0 \\ 0 & 1/2 & 1/2 & 0 \\ 1/4 & 1/4 & 1/4 & 1/4 \\ \end{array} } \right) \]

Creamos la matríz

Q = matrix(data = c(0.5,0.5,0,0,0,0.5,0.5,0,0,0.5,0.5,0,0.25,0.25,0.25,0.25),nrow = 4,byrow = TRUE)
Q
##      [,1] [,2] [,3] [,4]
## [1,] 0.50 0.50 0.00 0.00
## [2,] 0.00 0.50 0.50 0.00
## [3,] 0.00 0.50 0.50 0.00
## [4,] 0.25 0.25 0.25 0.25
matriz = new("markovchain",transitionMatrix = Q, states = c("E1","E2","E3","E4"))
matriz
## Unnamed Markov chain 
##  A  4 - dimensional discrete Markov Chain defined by the following states: 
##  E1, E2, E3, E4 
##  The transition matrix  (by rows)  is defined as follows: 
##      E1   E2   E3   E4
## E1 0.50 0.50 0.00 0.00
## E2 0.00 0.50 0.50 0.00
## E3 0.00 0.50 0.50 0.00
## E4 0.25 0.25 0.25 0.25
## Vemos su clasificación
summary(matriz)
## Unnamed Markov chain  Markov chain that is composed by: 
## Closed classes: 
## E2 E3 
## Recurrent classes: 
## {E2,E3}
## Transient classes: 
## {E1},{E4}
## The Markov chain is not irreducible 
## The absorbing states are: NONE

Creamos el diagrama

plot(matriz)

Estado estable

#Estado estable
steadyStates(matriz)
##      E1  E2  E3 E4
## [1,]  0 0.5 0.5  0

-> Asignación:

Encontrar un ejemplo práctico en código implementado en R de la cadena de markov a algún problema en particular y explicarlo.

Ejercicio N°1:

Cadenas de Markov

Cadenas de Markov utilizadas para predecir condiciones climáticas

Matriz de probablilidades de transición de estados

estados <- c("lluvia","soleado","nublado","granizo")
data <- c(.53,.15,.25,0.07,
                  .14,.72,.14,0,
                  .4,.25,.35,0,
                  .56,.1,.29,.05)
clima <- matrix(data, nrow=4, byrow=TRUE)

row.names(clima) <- estados
colnames(clima) <- estados

clima
##         lluvia soleado nublado granizo
## lluvia    0.53    0.15    0.25    0.07
## soleado   0.14    0.72    0.14    0.00
## nublado   0.40    0.25    0.35    0.00
## granizo   0.56    0.10    0.29    0.05

Sumatoria de probabilidades

rowSums(clima)
##  lluvia soleado nublado granizo 
##       1       1       1       1

Diagrama de transición de estados

Matriz de probabilidades de detransición de estados para el segundo día después

climaDia2 <- clima %^% 2 #Numero de días
climaDia2
##         lluvia soleado nublado granizo
## lluvia  0.4411  0.2570  0.2613  0.0406
## soleado 0.2310  0.5744  0.1848  0.0098
## nublado 0.3870  0.3275  0.2575  0.0280
## granizo 0.4548  0.2335  0.2700  0.0417

Matriz de probabilidades de detransición de estados para el tercer día después

climaDia3 <- clima %^% 3 #Numero de días
climaDia3
##           lluvia  soleado  nublado  granizo
## lluvia  0.397019 0.320590 0.249484 0.032907
## soleado 0.282254 0.495398 0.205688 0.016660
## nublado 0.369640 0.361025 0.240845 0.028490
## granizo 0.405086 0.308010 0.252983 0.033921

Matriz de probabilidades de detransición de estados para el quinto día después

climaDia5 <- clima %^% 5 #Numero de días
climaDia5
##            lluvia   soleado   nublado    granizo
## lluvia  0.3606978 0.3755706 0.2361131 0.02761853
## soleado 0.3261174 0.4283488 0.2227654 0.02276840
## nublado 0.3526092 0.3878994 0.2330142 0.02647712
## granizo 0.3631654 0.3718005 0.2370710 0.02796302

Matriz de probabilidades de detransición de estados para quince días después

climaDia15 <- clima %^% 15 #Numero de días
climaDia15
##            lluvia   soleado   nublado    granizo
## lluvia  0.3451274 0.3993311 0.2301086 0.02543303
## soleado 0.3450409 0.3994630 0.2300752 0.02542091
## nublado 0.3451071 0.3993619 0.2301007 0.02543020
## granizo 0.3451335 0.3993216 0.2301109 0.02543390

Matriz de probabilidades de detransición de estados para un mes después

climaMes1 <- clima %^% 30
climaMes1
##            lluvia   soleado   nublado    granizo
## lluvia  0.3450883 0.3993906 0.2300935 0.02542756
## soleado 0.3450883 0.3993906 0.2300935 0.02542756
## nublado 0.3450883 0.3993906 0.2300935 0.02542756
## granizo 0.3450883 0.3993906 0.2300935 0.02542756

Matriz de probabilidades de detransición de estados para dos mes después

climaMes2 <- clima %^% 60
climaMes2
##            lluvia   soleado   nublado    granizo
## lluvia  0.3450883 0.3993906 0.2300935 0.02542756
## soleado 0.3450883 0.3993906 0.2300935 0.02542756
## nublado 0.3450883 0.3993906 0.2300935 0.02542756
## granizo 0.3450883 0.3993906 0.2300935 0.02542756

Se observa que las probabilidades de cambio de clima se estabilizan entre quince dias y un mes aproximadamente

Vector de probabilidades para dos días despues si hoy fue un día de Granizo

u <- c(0,0,0,1)
vectorP<-(u %*% climaDia2)
vectorP
##      lluvia soleado nublado granizo
## [1,] 0.4548  0.2335    0.27  0.0417

Vemos que tiene un 45% de probabilidad de que llueva ese día después de que haya granizado

Probalidad de que mañana esté nublado ya que hoy es un día soleado

v <- matrix(c(0,0,1,0),nrow=4, byrow=TRUE)
u <- c(0,1,0,0)
vectorP2<-(u %*% clima %*% v)
vectorP2
##      [,1]
## [1,] 0.14

Hay un 14% de probabilidad

Probalidad de que mañana esté lloviendo ya que hoy es un día lluvioso

v <- matrix(c(0,0,0,1),nrow=4, byrow=TRUE)
u <- c(1,0,0,0)
vectorP3<-(u %*% clima %*% v)
vectorP3
##      [,1]
## [1,] 0.07

Hay un 7% de probabilidad