Introducción a los procesos estocástico
En la teoría de la probabilidad, un proceso estocástico es un concepto matemático que sirve para usar magnitudes aleatorias que varían con el tiempo o para caracterizar una sucesión de variables aleatorias (estocásticas) que evolucionan en función de otra variable, generalmente el tiempo. Cada una de las variables aleatorias del proceso tiene su propia función de distribución de probabilidad y pueden o no estar correlacionadas entre sí.
Cada variable o conjunto de variables sometidas a influencias o efectos aleatorios constituye un proceso estocástico. Un proceso estocástico \(xt\) puede entenderse como una familia uniparamétrica de variables aleatorias indexadas mediante el tiempo t. Los procesos estocásticos permiten tratar procesos dinámicos en los que hay cierta aleatoriedad.
- Ejemplos
Los siguientes son ejemplos dentro del amplio grupo de las series temporales: • señales de telecomunicación; • señales biomédicas (electrocardiograma, encefalograma, etc.); • señales sísmicas; • el número de manchas solares año tras año; • el índice de la bolsa segundo a segundo; • la evolución de la población de un municipio año tras año; • el tiempo de espera en la cola de cada uno de los usuarios que van llegando a una ventanilla; • el clima, un gigantesco conjunto de procesos estocásticos interrelacionados (velocidad del viento, humedad del aire, etcétera) que evolucionan en el espacio y en el tiempo; • los procesos estocásticos de orden mayor a uno, como el caso de una serie de tiempo de orden 2 y una correlación de cero con las demás observaciones.
Cádenas de markov
Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen memoria, “Recuerdan” el último evento y esto condiciona las posibilidades de los eventos futuros.
Esta dependencia del evento anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. En los negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra,los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo.
-> Ejemplo: Suponga que la posibilidad que llueva mañana depende de las condiciones del estado del clima de hoy. No importa las condiciones de los días anteriores, solo del estado del clima de hoy.
Suponga también que si llueve hoy, entonces lloverá mañana con una probabilidad α, y si no llueve hoy, entonces lloverá mañana con una probabilidad β.
## Package: markovchain
## Version: 0.8.5-2
## Date: 2020-09-07
## BugReport: https://github.com/spedygiorgio/markovchain/issues
## Loading required package: Matrix
##
## Attaching package: 'expm'
## The following object is masked from 'package:Matrix':
##
## expm
## Loading required package: NLP
##
## Attaching package: 'dplyr'
## The following objects are masked from 'package:stats':
##
## filter, lag
## The following objects are masked from 'package:base':
##
## intersect, setdiff, setequal, union
##
## Attaching package: 'tidyr'
## The following objects are masked from 'package:Matrix':
##
## expand, pack, unpack
## Loading required package: shape
Ejercicio de cadena de markov en R
documentación del paquete markovchain: https://cran.r-project.org/web/packages/markovchain/markovchain.pdf
Esta libreria pretende proveer objetos para realizar analisis estadísticos de cadenas de markov a tiempos discretos. Asumamos que tenemos una cadena de markov X={X1,X2,…} definida en el espacio de estados S={a,b,c} y cuya matriz de transición es:
\[ P = \left( {\begin{array}{ccc} 0 & 0.5 & 0.5 \\ 0.5 & 0 & 0.5 \\ 0.5 & 0.5 & 0 \\ \end{array} } \right)\]
Dicha cadena podemos crearla en R, de la siguiente forma:
Crear la matriz de transicion P:
## [,1] [,2] [,3]
## [1,] 0.0 0.5 0.5
## [2,] 0.5 0.0 0.5
## [3,] 0.5 0.5 0.0
El argumento “nrows” de la funcion matrix es para declarar el numero de filas que deseamos que nuestra matriz P posea, y el argumento “byrows” es para que almacene los elementos de la matriz almacenados en c(), fila por fila.
Crear la matriz de transición creamos el objeto “markovchain” de la siguiente forma:
- La estructura del objeto mc (cadena de markov) esta dad por str:
## Formal class 'markovchain' [package "markovchain"] with 4 slots
## ..@ states : chr [1:3] "a" "b" "c"
## ..@ byrow : logi TRUE
## ..@ transitionMatrix: num [1:3, 1:3] 0 0.5 0.5 0.5 0 0.5 0.5 0.5 0
## .. ..- attr(*, "dimnames")=List of 2
## .. .. ..$ : chr [1:3] "a" "b" "c"
## .. .. ..$ : chr [1:3] "a" "b" "c"
## ..@ name : chr "Cadena 1"
- Resumen de la cadena de markov 1:
## Cadena 1 Markov chain that is composed by:
## Closed classes:
## a b c
## Recurrent classes:
## {a,b,c}
## Transient classes:
## NONE
## The Markov chain is irreducible
## The absorbing states are: NONE
Para visualizar la transición de la cadena, utilizamos el comando plot:
absorbingStates(): Identifica los estados Absorbentes
transientStates(): Identifica los estados Transitorios
recurrentClasses(): Identifica las clases recurrentes
Para la cadena de markov definida se obtiene que:
## [[1]]
## [1] "a" "b" "c"
## character(0)
## character(0)
Análisis probabilístico
Para conocer la probabilidad de transición en 1 paso entre un estado y otro basta con utilizar la función transitionProbability(), con los argumentos:
object: la cadena de markov
t0: el estado en el tiempo 0
t1: el estado en el tiempo 1
La probabilidad de transicion en un paso del estado “a” al estado “c” es:
## [1] 0.5
Recuerde que dicha probabilidad es un elemento de la matriz de transición P, por lo tanto, la probabilidad de transicion del estado “a” al estado “b” es simplemente P23
## [1] 0.5
Es posible computar la matriz de transición en n pasos, simplemente computando la n-ésima potencia de la matriz de transición P, como ejemplo calcularemos la matriz de transición en n = 5 pasos.
## Cadena 1^5
## A 3 - dimensional discrete Markov Chain defined by the following states:
## a, b, c
## The transition matrix (by rows) is defined as follows:
## a b c
## a 0.31250 0.34375 0.34375
## b 0.34375 0.31250 0.34375
## c 0.34375 0.34375 0.31250
Tambien se pueden conocer la distribución de la cadena en n pasos adelante (P(Xn)) multiplicando la distribucion inicial de X0 por la matriz de transición en n pasos (Pn), calcule la distribución de la cadena en el tiempo n = 6, si la ditribución inicial de la cadena es “(0.5, 0.2, 0.3)”.
## a b c
## [1,] 0.3359375 0.33125 0.3328125
Puesto que Xn es una función de densidad, la suma de las probabilidades en todos los estados debe ser 1.
## [1] 1
Finalmente encontrar la distribución estacionaria de la cadena se obtiene mediante la función “steadyStates” de la siguiente forma:
## a b c
## [1,] 0.3333333 0.3333333 0.3333333
Recuerde que los tiempos medio de recurrencia son los inversos multiplicativos de la distribución estacionaria y pueden ser computados facilmente.
## a b c
## [1,] 3 3 3
-> Asignación
Dibuje el diagrama de transición, determine las clases de comunicación de las siguientes cadenas de Markov, clasifique éstas como recurrentes o transitorias (20%), y encuentre la distribución estacionaria si existe (10%).
\[ P = \left( {\begin{array}{cccc} 1/2 & 1/2 & 0 & 0 \\ 0 & 1/2 & 1/2 & 0 \\ 0 & 1/2 & 1/2 & 0 \\ 1/4 & 1/4 & 1/4 & 1/4 \\ \end{array} } \right) \]
Creamos la matríz
Q = matrix(data = c(0.5,0.5,0,0,0,0.5,0.5,0,0,0.5,0.5,0,0.25,0.25,0.25,0.25),nrow = 4,byrow = TRUE)
Q## [,1] [,2] [,3] [,4]
## [1,] 0.50 0.50 0.00 0.00
## [2,] 0.00 0.50 0.50 0.00
## [3,] 0.00 0.50 0.50 0.00
## [4,] 0.25 0.25 0.25 0.25
## Unnamed Markov chain
## A 4 - dimensional discrete Markov Chain defined by the following states:
## E1, E2, E3, E4
## The transition matrix (by rows) is defined as follows:
## E1 E2 E3 E4
## E1 0.50 0.50 0.00 0.00
## E2 0.00 0.50 0.50 0.00
## E3 0.00 0.50 0.50 0.00
## E4 0.25 0.25 0.25 0.25
## Unnamed Markov chain Markov chain that is composed by:
## Closed classes:
## E2 E3
## Recurrent classes:
## {E2,E3}
## Transient classes:
## {E1},{E4}
## The Markov chain is not irreducible
## The absorbing states are: NONE
Estado estable
## E1 E2 E3 E4
## [1,] 0 0.5 0.5 0
-> Asignación:
Encontrar un ejemplo práctico en código implementado en R de la cadena de markov a algún problema en particular y explicarlo.
Ejercicio N°1:
Cadenas de Markov
Cadenas de Markov utilizadas para predecir condiciones climáticas
Matriz de probablilidades de transición de estados
estados <- c("lluvia","soleado","nublado","granizo")
data <- c(.53,.15,.25,0.07,
.14,.72,.14,0,
.4,.25,.35,0,
.56,.1,.29,.05)
clima <- matrix(data, nrow=4, byrow=TRUE)
row.names(clima) <- estados
colnames(clima) <- estados
clima## lluvia soleado nublado granizo
## lluvia 0.53 0.15 0.25 0.07
## soleado 0.14 0.72 0.14 0.00
## nublado 0.40 0.25 0.35 0.00
## granizo 0.56 0.10 0.29 0.05
Diagrama de transición de estados
Matriz de probabilidades de detransición de estados para el segundo día después
## lluvia soleado nublado granizo
## lluvia 0.4411 0.2570 0.2613 0.0406
## soleado 0.2310 0.5744 0.1848 0.0098
## nublado 0.3870 0.3275 0.2575 0.0280
## granizo 0.4548 0.2335 0.2700 0.0417
Matriz de probabilidades de detransición de estados para el tercer día después
## lluvia soleado nublado granizo
## lluvia 0.397019 0.320590 0.249484 0.032907
## soleado 0.282254 0.495398 0.205688 0.016660
## nublado 0.369640 0.361025 0.240845 0.028490
## granizo 0.405086 0.308010 0.252983 0.033921
Matriz de probabilidades de detransición de estados para el quinto día después
## lluvia soleado nublado granizo
## lluvia 0.3606978 0.3755706 0.2361131 0.02761853
## soleado 0.3261174 0.4283488 0.2227654 0.02276840
## nublado 0.3526092 0.3878994 0.2330142 0.02647712
## granizo 0.3631654 0.3718005 0.2370710 0.02796302
Matriz de probabilidades de detransición de estados para quince días después
## lluvia soleado nublado granizo
## lluvia 0.3451274 0.3993311 0.2301086 0.02543303
## soleado 0.3450409 0.3994630 0.2300752 0.02542091
## nublado 0.3451071 0.3993619 0.2301007 0.02543020
## granizo 0.3451335 0.3993216 0.2301109 0.02543390
Matriz de probabilidades de detransición de estados para un mes después
## lluvia soleado nublado granizo
## lluvia 0.3450883 0.3993906 0.2300935 0.02542756
## soleado 0.3450883 0.3993906 0.2300935 0.02542756
## nublado 0.3450883 0.3993906 0.2300935 0.02542756
## granizo 0.3450883 0.3993906 0.2300935 0.02542756
Matriz de probabilidades de detransición de estados para dos mes después
## lluvia soleado nublado granizo
## lluvia 0.3450883 0.3993906 0.2300935 0.02542756
## soleado 0.3450883 0.3993906 0.2300935 0.02542756
## nublado 0.3450883 0.3993906 0.2300935 0.02542756
## granizo 0.3450883 0.3993906 0.2300935 0.02542756
Se observa que las probabilidades de cambio de clima se estabilizan entre quince dias y un mes aproximadamente
Vector de probabilidades para dos días despues si hoy fue un día de Granizo
## lluvia soleado nublado granizo
## [1,] 0.4548 0.2335 0.27 0.0417
Vemos que tiene un 45% de probabilidad de que llueva ese día después de que haya granizado
Probalidad de que mañana esté nublado ya que hoy es un día soleado
## [,1]
## [1,] 0.14
Hay un 14% de probabilidad