-> Introducción a la relación entre eventos con análisis de cadenas de markov y análisis montecarlo

En la teoría de la probabilidad, un proceso estocástico es un concepto matemático que sirve para usar magnitudes aleatorias que varían con el tiempo o para caracterizar una sucesión de variables aleatorias (estocásticas) que evolucionan en función de otra variable, generalmente el tiempo. Cada una de las variables aleatorias del proceso tiene su propia función de distribución de probabilidad y pueden o no estar correlacionadas entre sí.

Cada variable o conjunto de variables sometidas a influencias o efectos aleatorios constituye un proceso estocástico. Un proceso estocástico \(xt\) puede entenderse como una familia uniparamétrica de variables aleatorias indexadas mediante el tiempo t. Los procesos estocásticos permiten tratar procesos dinámicos en los que hay cierta aleatoriedad.

Los siguientes son ejemplos dentro del amplio grupo de las series temporales: • señales de telecomunicación; • señales biomédicas (electrocardiograma, encefalograma, etc.); • señales sísmicas; • el número de manchas solares año tras año; • el índice de la bolsa segundo a segundo; • la evolución de la población de un municipio año tras año; • el tiempo de espera en la cola de cada uno de los usuarios que van llegando a una ventanilla; • el clima, un gigantesco conjunto de procesos estocásticos interrelacionados (velocidad del viento, humedad del aire, etcétera) que evolucionan en el espacio y en el tiempo; • los procesos estocásticos de orden mayor a uno, como el caso de una serie de tiempo de orden 2 y una correlación de cero con las demás observaciones.

Cádenas de markov

Una cadena de Markov es una serie de eventos, en la cual la probabilidad de que ocurra un evento depende del evento inmediato anterior. En efecto, las cadenas de este tipo tienen memoria, “Recuerdan” el último evento y esto condiciona las posibilidades de los eventos futuros.

Esta dependencia del evento anterior distingue a las cadenas de Markov de las series de eventos independientes, como tirar una moneda al aire o un dado. En los negocios, las cadenas de Markov se han utilizado para analizar los patrones de compra,los deudores morosos, para planear las necesidades de personal y para analizar el reemplazo de equipo.

El anáisis de Markov, llamado así en honor de un matemático ruso que desarrollo el m�todo en 1907, permite encontrar la probabilidad de que un sistema se encuentre en un estado en particular en un momento dado. Algo m�s importante a�n, es que permite encontrar el promedio a la larga o las probabilidades de estado estable para cada estado. Con esta informaci�n se puede predecir el comportamiento del sistema a trav�s del tiempo. La tarea m�s dif�cil es reconocer cu�ndo puede aplicarse. La caracteristica m�s importante que hay que buscar en la memoria de un evento a otro.

Cadenas de markov implementadas en R

-> instalar el paquete markovchain

-> Activar el paquete markov chain

setwd("~/EA 1011")
library(markovchain)

## Package:  markovchain
## Version:  0.8.5-2
## Date:     2020-09-07
## BugReport: https://github.com/spedygiorgio/markovchain/issues

documentación: https://cran.r-project.org/web/packages/markovchain/markovchain.pdf

Esta libreria pretende proveer objetos para realizar analisis estadísticos de cadenas de markov a tiempos discretos. Asumamos que tenemos una cadena de markov X={X1,X2,…} definida en el espacio de estados S={a,b,c} y cuya matriz de transición es:

\[ P = \left( {\begin{array}{ccc} 0 & 0.5 & 0.5 \\ 0.5 & 0 & 0.5 \\ 0.5 & 0.5 & 0 \\ \end{array} } \right) \]

Crear la matriz de transicion P:

P = matrix(c(0,0.5,0.5,.5,0,.5,.5,.5,0),nrow = 3,byrow=TRUE      )
P

##      [,1] [,2] [,3]
## [1,]  0.0  0.5  0.5
## [2,]  0.5  0.0  0.5
## [3,]  0.5  0.5  0.0

El argumento “nrows” de la funcion matrix es para declarar el numero de filas que deseamos que nuestra matriz P posea, y el argumento “byrows” es para que almacene los elementos de la matriz almacenados en c(), fila por fila.

Crear la matriz de transición creamos el objeto “markovchain” de la siguiente forma:

mc <- new("markovchain", transitionMatrix=P, states=c("a","b","c"), name="Cadena 1")

na revisión previa al análisis de nuestra cadena se puede realizar mediante los comandos “str()” y “summary”, que devuelven la estructura del objeto y el resumen general de los resultados respectivamente. Para mayor informacion revisar los comandos mediante la función help().

La estructura del objeto mc es:

str(mc)

## Formal class 'markovchain' [package "markovchain"] with 4 slots
##   ..@ states          : chr [1:3] "a" "b" "c"
##   ..@ byrow           : logi TRUE
##   ..@ transitionMatrix: num [1:3, 1:3] 0 0.5 0.5 0.5 0 0.5 0.5 0.5 0
##   .. ..- attr(*, "dimnames")=List of 2
##   .. .. ..$ : chr [1:3] "a" "b" "c"
##   .. .. ..$ : chr [1:3] "a" "b" "c"
##   ..@ name            : chr "Cadena 1"

sumario de mc

summary(mc)

## Cadena 1  Markov chain that is composed by: 
## Closed classes: 
## a b c 
## Recurrent classes: 
## {a,b,c}
## Transient classes: 
## NONE 
## The Markov chain is irreducible 
## The absorbing states are: NONE

Visualizar de manera gráfica esta cadena de markov

plot(mc)

-> Asignación:

Investigar aplicaciones de las cm en su área del conocimento

Cadenas de Markov aplicadas al ordenamiento de páginas web

Cuando deseamos encontrar alguna información en internet, solemos usar “buscadores”.

Google basa su éxito en un procedimiento que asocia acad a página de la red un número que cuantifica su relevancia (ó importancia), y enfunción de ello ordena los resultados de la búsqueda.

¿Cómo ordenar las páginas en la red?

Suponga un pequeño universo de 4páginas: A,B,C,D. Si todas esas páginas enlazan a A,entonces el PR(PageRank) de la página A sería la suma del PR de las páginas B, C y D.

\[PR(A) = PR(B) + PR(C) + PR(D)\]

Pero supóngase que B también tiene un enlace a C y que D tiene enlaces a las otras 3 páginas. Una página no puede votar 2 veces, y por esa razón se considera que B da medio voto a A y medio voto a C. De la misma manera sólo un tercio del voto de D se cuenta para el de A.

\[ PR(A) = PR(B)/2 + PR(C) + PR(D)/3\]

En otras palabras, divídase el PR entre el número total de enlaces que salen de esa página.

\[PR(A) = PR(B)/C(B) + PR(C)/C(C) + PR(D)/C(D)\]

El PageRank de una página se define como:

\[PR_j = ∑_{i∈lj}\frac{PR_i}{|O_{i}|}\]

en donde \(PR_i\) es el PageRank de la página i y \(O_i\) es el número de enlaces salientes de la página i, esto lo podemos escribir en forma matricial de la siguiente manera \(π=πP\), donde π es el vector PageRank y P es la matriz de transición de la web. Cada vez que nosotros hacemos una búsqueda en internet, Google recuerda solo la búsqueda anterior sin importar las demás, esto quiere decir que, nosotros iniciamos con un valor de PageRank \(π_0\), si seguimos navegando en internet, al hacer una nueva búsqueda, el siguiente valor de PageRank seria \(π_1 = π_0P\), este proceso lo podemos escribir \(π_{k+1}=π_kP[5]\),en donde \(π_k\) es el vector PageRank, que nos dice la importancia de cada página

Una página tiene una clasificación alta si la suma de las clasificaciones de sus vínculos entrante se saltó. Esto cubre ambos casos: muchos vínculos entrantes o pocos con alta clasificación. El algoritmo original del PageRank fue descrito en varios trabajos de Brin y Page [3]. Posteriormente presentaron una versión mejorada, que es la que expondremos. El propósito es cuantificar la probabilidad de que un usuario (aleatorio) llegue a la página A utilizando la Red. Se define el PageRank por [3]:

\[PR(A) = \frac{1-\alpha}{N}+\alpha({\frac{PR(T_1)}{C(T_1)}+...+\frac{PR(T_n)}{C(T_n)}})\]

En donde: \(N\): es el número total de páginas web desde las que salen vínculos. \(n\): es el número total de páginas web desde las que salen vínculos a la página A. \(PR(T_i)\): es el PR de las páginas Ti que tienen un vínculo hacia la página A. \(C(T_i)\): es el número de vínculos salientes de la página Ti. \(\alpha\): es un factor de amortiguación que puede ser tomado entre 0 y 1.

El modelo no tiene en cuenta para nada el contenido de las páginas. Se supone que es más probable que siga uno de los enlaces de la página en que está; de hecho, trabajan con un parámetro de 0.85 (85%). Esta probabilidad la representan con la letra \(\alpha\) y la probabilidad de que teclee una dirección sin usar uno de los enlaces disponibles es, por lo tanto, \(1-\alpha\), en este caso, 0.15 (el restante 15 % de las veces) [8]. La probabilidad de elegir uno de los vínculos salientes entre los que figuran en la página se distribuye uniformemente entre la cantidad que allí haya. Ahora veamos; para el 15% de casos en que el usuario digital a dirección, la probabilidad de que llegue a Ti es de uno sobre el total de páginas web(N).

U2A6

David Picos

23/11/2020