U2A7

HéctorZapata

23/11/2020

library(markovchain)
## Package:  markovchain
## Version:  0.8.5-2
## Date:     2020-09-07
## BugReport: https://github.com/spedygiorgio/markovchain/issues

Introducción a los procesos estocástico

En la teoría de la probabilidad, un proceso estocástico es un concepto matemático que sirve para usar magnitudes aleatorias que varían con el tiempo o para caracterizar una sucesión de variables aleatorias (estocásticas) que evolucionan en función de otra variable, generalmente el tiempo. Cada una de las variables aleatorias del proceso tiene su propia función de distribución de probabilidad y pueden o no estar correlacionadas entre sí.

Cada variable o conjunto de variables sometidas a influencias o efectos aleatorios constituye un proceso estocástico. Un proceso estocástico \(xt\) puede entenderse como una familia uniparamétrica de variables aleatorias indexadas mediante el tiempo t. Los procesos estocásticos permiten tratar procesos dinámicos en los que hay cierta aleatoriedad.

  • Ejemplos

Los siguientes son ejemplos dentro del amplio grupo de las series temporales: • señales de telecomunicación; • señales biomédicas (electrocardiograma, encefalograma, etc.); • señales sísmicas; • el número de manchas solares año tras año; • el índice de la bolsa segundo a segundo; • la evolución de la población de un municipio año tras año; • el tiempo de espera en la cola de cada uno de los usuarios que van llegando a una ventanilla; • el clima, un gigantesco conjunto de procesos estocásticos interrelacionados (velocidad del viento, humedad del aire, etcétera) que evolucionan en el espacio y en el tiempo; • los procesos estocásticos de orden mayor a uno, como el caso de una serie de tiempo de orden 2 y una correlación de cero con las demás observaciones.

Cádenas de markov

Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen memoria, “Recuerdan” el último evento y esto condiciona las posibilidades de los eventos futuros.

Esta dependencia del evento anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. En los negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra,los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo.

-> Ejemplo: Suponga que la posibilidad que llueva mañana depende de las condiciones del estado del clima de hoy. No importa las condiciones de los días anteriores, solo del estado del clima de hoy.

Suponga también que si llueve hoy, entonces lloverá mañana con una probabilidad α, y si no llueve hoy, entonces lloverá mañana con una probabilidad β.

Ejercicio de cadena de markov en R

documentación del paquete markovchain: https://cran.r-project.org/web/packages/markovchain/markovchain.pdf

Esta libreria pretende proveer objetos para realizar analisis estadísticos de cadenas de markov a tiempos discretos. Asumamos que tenemos una cadena de markov X={X1,X2,…} definida en el espacio de estados S={a,b,c} y cuya matriz de transición es:

\[ P = \left( {\begin{array}{ccc} 0 & 0.5 & 0.5 \\ 0.5 & 0 & 0.5 \\ 0.5 & 0.5 & 0 \\ \end{array} } \right)\]

Dicha cadena podemos crearla en R, de la siguiente forma:

Crear la matriz de transicion P:

P = matrix(c(0,0.5,0.5,.5,0,.5,.5,.5,0),nrow = 3,byrow = TRUE) 
P
##      [,1] [,2] [,3]
## [1,]  0.0  0.5  0.5
## [2,]  0.5  0.0  0.5
## [3,]  0.5  0.5  0.0

El argumento “nrows” de la funcion matrix es para declarar el numero de filas que deseamos que nuestra matriz P posea, y el argumento “byrows” es para que almacene los elementos de la matriz almacenados en c(), fila por fila.

Crear la matriz de transición creamos el objeto “markovchain” de la siguiente forma:

mc = new("markovchain",transitionMatrix=P,states=c("a","b","c"),name="Cadena 1") 
  • La estructura del objeto mc (cadena de markov) esta dad por str:
str(mc)
## Formal class 'markovchain' [package "markovchain"] with 4 slots
##   ..@ states          : chr [1:3] "a" "b" "c"
##   ..@ byrow           : logi TRUE
##   ..@ transitionMatrix: num [1:3, 1:3] 0 0.5 0.5 0.5 0 0.5 0.5 0.5 0
##   .. ..- attr(*, "dimnames")=List of 2
##   .. .. ..$ : chr [1:3] "a" "b" "c"
##   .. .. ..$ : chr [1:3] "a" "b" "c"
##   ..@ name            : chr "Cadena 1"
  • Resumen de la cadena de markov 1:
summary(mc)
## Cadena 1  Markov chain that is composed by: 
## Closed classes: 
## a b c 
## Recurrent classes: 
## {a,b,c}
## Transient classes: 
## NONE 
## The Markov chain is irreducible 
## The absorbing states are: NONE

Para visualizar la transición de la cadena, utilizamos el comando plot:

plot(mc)

Otras funciones importantes son:

  • absorbingStates(): Identifica los estados Absorbentes

  • transientStates(): Identifica los estados Transitorios

  • recurrentClasses(): Identifica las clases recurrentes

Para la cadena de markov definida se obtiene que:

recurrentClasses(mc)
## [[1]]
## [1] "a" "b" "c"
transientStates(mc)
## character(0)
absorbingStates(mc)
## character(0)

Análisis probabilístico

Para conocer la probabilidad de transición en 1 paso entre un estado y otro basta con utilizar la función transitionProbability(), con los argumentos:

  • object: la cadena de markov

  • t0: el estado en el tiempo 0

  • t1: el estado en el tiempo 1

La probabilidad de transicion en un paso del estado “a” al estado “c” es:

transitionProbability(object = mc , t0="a", t1="c")
## [1] 0.5

Recuerde que dicha probabilidad es un elemento de la matriz de transición P, por lo tanto, la probabilidad de transicion del estado “a” al estado “b” es simplemente P23

mc[2,3]
## [1] 0.5

Es posible computar la matriz de transición en n pasos, simplemente computando la n-ésima potencia de la matriz de transición P, como ejemplo calcularemos la matriz de transición en n = 5 pasos.

n = 5 #el numero de pasos al futuro
mc^5
## Cadena 1^5 
##  A  3 - dimensional discrete Markov Chain defined by the following states: 
##  a, b, c 
##  The transition matrix  (by rows)  is defined as follows: 
##         a       b       c
## a 0.31250 0.34375 0.34375
## b 0.34375 0.31250 0.34375
## c 0.34375 0.34375 0.31250

Tambien se pueden conocer la distribución de la cadena en n pasos adelante (P(Xn)) multiplicando la distribucion inicial de X0 por la matriz de transición en n pasos (Pn), calcule la distribución de la cadena en el tiempo n = 6, si la ditribución inicial de la cadena es “(0.5, 0.2, 0.3)”.

x0 <- c(0.5,0.2,0.3) # La distribución de X en t = 0
n = 6
Xn = x0*(mc^n)
Xn
##              a       b         c
## [1,] 0.3359375 0.33125 0.3328125

Puesto que Xn es una función de densidad, la suma de las probabilidades en todos los estados debe ser 1.

sum(Xn)
## [1] 1

Finalmente encontrar la distribución estacionaria de la cadena se obtiene mediante la función “steadyStates” de la siguiente forma:

DistEst <- steadyStates(mc)
DistEst
##              a         b         c
## [1,] 0.3333333 0.3333333 0.3333333

Recuerde que los tiempos medio de recurrencia son los inversos multiplicativos de la distribución estacionaria y pueden ser computados facilmente.

M <- 1/DistEst
M
##      a b c
## [1,] 3 3 3

Asignación 1:

Dibuje el diagrama de transición, determine las clases de comunicación de las siguientes cadenas de Markov, clasifique éstas como recurrentes o transitorias (20%), y encuentre la distribución estacionaria si existe (10%).

\[ P = \left( {\begin{array}{cccc} 1/2 & 1/2 & 0 & 0 \\ 0 & 1/2 & 1/2 & 0 \\ 0 & 1/2 & 1/2 & 0 \\ 1/4 & 1/4 & 1/4 & 1/4 \\ \end{array} } \right) \]

EJ <- matrix(c(0.5,0.5,0,0,0,0.5,0.5,0,0,0.5,0.5,0,0.25,0.25,0.25,0.25),nrow = 4, byrow = TRUE)
colnames(EJ) <- c('A','B','C','D')
rownames(EJ) <- c('A','B','C','D')
EJ
##      A    B    C    D
## A 0.50 0.50 0.00 0.00
## B 0.00 0.50 0.50 0.00
## C 0.00 0.50 0.50 0.00
## D 0.25 0.25 0.25 0.25

Generando la Matriz para la elaboración de la cadena de markov

MC <- new("markovchain",transitionMatrix=EJ,states=c("A","B","C","D"),name="Ejericio") 

La estructura de la cadena esta dada por str

str(MC)
## Formal class 'markovchain' [package "markovchain"] with 4 slots
##   ..@ states          : chr [1:4] "A" "B" "C" "D"
##   ..@ byrow           : logi TRUE
##   ..@ transitionMatrix: num [1:4, 1:4] 0.5 0 0 0.25 0.5 0.5 0.5 0.25 0 0.5 ...
##   .. ..- attr(*, "dimnames")=List of 2
##   .. .. ..$ : chr [1:4] "A" "B" "C" "D"
##   .. .. ..$ : chr [1:4] "A" "B" "C" "D"
##   ..@ name            : chr "Ejericio"

Resumen de la cadena:

summary(MC)
## Ejericio  Markov chain that is composed by: 
## Closed classes: 
## B C 
## Recurrent classes: 
## {B,C}
## Transient classes: 
## {A},{D}
## The Markov chain is not irreducible 
## The absorbing states are: NONE

Los estados Recurrentes de la cadena son:

recurrentClasses(MC)
## [[1]]
## [1] "B" "C"

Los estados Transitorios de la cadena son:

transientStates(MC)
## [1] "A" "D"

Los estados Absorbentes de ka cadena son:

absorbingStates(MC)
## character(0)

Calculando la probabilidad de pasar del estado (A:A) (A:B) (A:C) (A:D), (B:A) (B:B) (B:C) (B:D), (C:A) (C:B) (C:C) (C:D) y (D:A) (D:B) (D:C) (D:D)

transitionProbability(object = MC , t0="A", t1="A")
## [1] 0.5
transitionProbability(object = MC , t0="A", t1="B")
## [1] 0.5
transitionProbability(object = MC , t0="A", t1="C")
## [1] 0
transitionProbability(object = MC , t0="A", t1="D")
## [1] 0
transitionProbability(object = MC , t0="B", t1="A")
## [1] 0
transitionProbability(object = MC , t0="B", t1="B")
## [1] 0.5
transitionProbability(object = MC , t0="B", t1="C")
## [1] 0.5
transitionProbability(object = MC , t0="B", t1="D")
## [1] 0
transitionProbability(object = MC , t0="C", t1="A")
## [1] 0
transitionProbability(object = MC , t0="C", t1="B")
## [1] 0.5
transitionProbability(object = MC , t0="C", t1="C")
## [1] 0.5
transitionProbability(object = MC , t0="C", t1="D")
## [1] 0
transitionProbability(object = MC , t0="D", t1="A")
## [1] 0.25
transitionProbability(object = MC , t0="D", t1="B")
## [1] 0.25
transitionProbability(object = MC , t0="D", t1="C")
## [1] 0.25
transitionProbability(object = MC , t0="D", t1="D")
## [1] 0.25

Calculemos como será la matriz de transición en 7 pasos al futuro:

pasos <- 7
MC^pasos
## Ejericio^7 
##  A  4 - dimensional discrete Markov Chain defined by the following states: 
##  A, B, C, D 
##  The transition matrix  (by rows)  is defined as follows: 
##             A        B         C            D
## A 0.007812500 0.500000 0.4921875 0.000000e+00
## B 0.000000000 0.500000 0.5000000 0.000000e+00
## C 0.000000000 0.500000 0.5000000 0.000000e+00
## D 0.007751465 0.499939 0.4922485 6.103516e-05

Conociendo la distribución estacionaria de la cadena:

est <- steadyStates(MC)
est
##      A   B   C D
## [1,] 0 0.5 0.5 0

Tiempos medios de recurrencia

x <- 1/est
x
##        A B C   D
## [1,] Inf 2 2 Inf

Grafico de la cadena

plot(MC)

Grafico de la cadena

mosaicplot(EJ,main = "Cadena" , color = c(6,3,5,8),cex.axis = 1.1, off = 4)

Asignación 2:

Encontrar un ejemplo práctico en código implementado en R de la cadena de markov a algún problema en particular y explicarlo.

Ejemplo:

Al travez del tiempo las clases sociales se hacen cada vez mas distantes, es mas dificil de pasar de pobre a rico y de rico a pobre, en este caso se intentara ver como es esa transicion entre las clases sociales a travez del tiempo.

Generando la matriz para la elaboración de la cadena de markov

clases <- matrix(c(0.7,0.25,0.05,0.3,0.55,0.15,0.1,0.4,0.5),nrow = 3,byrow = TRUE) 
colnames(clases) <- c('B','M','A')
rownames(clases) <- c('B','M','A')
clases
##     B    M    A
## B 0.7 0.25 0.05
## M 0.3 0.55 0.15
## A 0.1 0.40 0.50

Generando la cadena

AS = new("markovchain",transitionMatrix=clases,name="Clases sociales") 

La estructura del objeto mc (cadena de markov) esta dad por str:

str(AS)
## Formal class 'markovchain' [package "markovchain"] with 4 slots
##   ..@ states          : chr [1:3] "B" "M" "A"
##   ..@ byrow           : logi TRUE
##   ..@ transitionMatrix: num [1:3, 1:3] 0.7 0.3 0.1 0.25 0.55 0.4 0.05 0.15 0.5
##   .. ..- attr(*, "dimnames")=List of 2
##   .. .. ..$ : chr [1:3] "B" "M" "A"
##   .. .. ..$ : chr [1:3] "B" "M" "A"
##   ..@ name            : chr "Clases sociales"

Resumen de la cadena de las clases sociales:

summary(AS)
## Clases sociales  Markov chain that is composed by: 
## Closed classes: 
## B M A 
## Recurrent classes: 
## {B,M,A}
## Transient classes: 
## NONE 
## The Markov chain is irreducible 
## The absorbing states are: NONE

Los estados Recurrentes de la cadena de clases sociales son:

recurrentClasses(AS)
## [[1]]
## [1] "B" "M" "A"

Los estados Transitorios de la cadena de clases sociales son:

transientStates(AS)
## character(0)

Los estados Absorbentes de la cadena de clases socuales son:

absorbingStates(AS)
## character(0)

Calculando la probabilidad de pasar del estado (A:A) (A:B) (A:C), (B:A) (B:B) (B:C) y (C:A) (C:B) (C:C)

transitionProbability(object = AS , t0="B", t1="B")
## [1] 0.7
transitionProbability(object = AS , t0="B", t1="M")
## [1] 0.25
transitionProbability(object = AS , t0="B", t1="A")
## [1] 0.05
transitionProbability(object = AS , t0="M", t1="B")
## [1] 0.3
transitionProbability(object = AS , t0="M", t1="M")
## [1] 0.55
transitionProbability(object = AS , t0="M", t1="A")
## [1] 0.15
transitionProbability(object = AS , t0="A", t1="B")
## [1] 0.1
transitionProbability(object = AS , t0="A", t1="M")
## [1] 0.4
transitionProbability(object = AS , t0="A", t1="A")
## [1] 0.5

Calculemos como será la matriz de transición en 7 pasos al futuro:

futuro <- 7
AS^pasos
## Clases sociales^7 
##  A  3 - dimensional discrete Markov Chain defined by the following states: 
##  B, M, A 
##  The transition matrix  (by rows)  is defined as follows: 
##           B         M         A
## B 0.4503714 0.3900852 0.1595435
## M 0.4444332 0.3925226 0.1630442
## A 0.4374319 0.3953362 0.1672320

Conociendo la distribución estacionaria de la cadena:

estados <- steadyStates(AS)
estados
##              B         M         A
## [1,] 0.4459459 0.3918919 0.1621622

Tiempos medios de recurrencia

x <- 1/estados
x
##             B        M        A
## [1,] 2.242424 2.551724 6.166667

Para visualizar la transición de la cadena, utilizamos el comando plot:

plot(AS)

### Grafica de la cadena

mosaicplot(clases,main = "Transisión de clase social a clase social entre generaciones" , color = c(6,3,5),cex.axis = 1.1, off = 3)
cx <- c(.18,.5,.82)
leyendas<- clases[3, ]
text(cx,c(0,0.07,0.25),leyendas,cex =1.2)

leyendas <- clases[2, ]
text(cx,c(0.15,0.4,0.7),leyendas,cex =1.2)

leyendas <- clases[1, ]
text(cx,c(0.65,.85,0.93),leyendas,cex =1.2)

Conclusión:

Como podemos ver los datos hablan por si solos, se observa que un rico es muy probable que en futuras generaciones siga siendo rico, mientras que un pobre es muy probable que siga siendo pobre.