Luego de realizar un análisis exhaustivo del primer caso, podríamos decir que la transición entre las etapas de cada oportunidad si se puede modelar usando una cadena de Markov de orden uno, ya que solo es necesario analizar o tener en cuenta el periodo anterior para saber dónde se encontraba el cliente, esto quiere decir que presenta perdida de memoria basta con saber su ultimo pasado el cual recoge toda la información de este.
Tabla de Datos
## [1] "DatosNoviembre"
## # A tibble: 6 × 2
## Cliente Secuencia
## <dbl> <chr>
## 1 1 A
## 2 1 B
## 3 1 C
## 4 1 L
## 5 1 L
## 6 1 NA
## [1] "DatosDiciembre"
## # A tibble: 6 × 2
## Cliente Secuencia
## <dbl> <chr>
## 1 1 A
## 2 1 A
## 3 1 B
## 4 1 C
## 5 1 C
## 6 1 L
## [1] "DatosEnero"
## # A tibble: 6 × 2
## Cliente Secuencia
## <dbl> <chr>
## 1 1 A
## 2 1 A
## 3 1 L
## 4 1 L
## 5 1 NA
## 6 2 A
Matriz de Frecuencias
NoviembreFrec = createSequenceMatrix(DatosNoviembre$Secuencia)
DiciembreFrec = createSequenceMatrix(DatosDiciembre$Secuencia)
EneroFrec = createSequenceMatrix(DatosEnero$Secuencia)
print("Frecuencias en Noviembre")
## [1] "Frecuencias en Noviembre"
NoviembreFrec
## A B C L W
## A 10053 5999 0 4001 0
## B 0 3868 4539 1460 0
## C 0 0 1972 2958 1581
## L 0 0 0 8419 0
## W 0 0 0 0 1581
print("Frecuencias en Diciembre")
## [1] "Frecuencias en Diciembre"
DiciembreFrec
## A B C L W
## A 9832 5979 0 4021 0
## B 0 3990 4561 1418 0
## C 0 0 1903 2943 1618
## L 0 0 0 8382 0
## W 0 0 0 0 1618
print("Frecuencias en Enero")
## [1] "Frecuencias en Enero"
EneroFrec
## A B C L W
## A 10246 6087 0 3911 0
## B 0 3899 4517 1570 0
## C 0 0 1978 2904 1613
## L 0 0 0 8385 0
## W 0 0 0 0 1613
Estadística descriptiva
## [1] "Uso de estadistica a partir de la observacion con grafico (Noviembre)"
## [1] "Uso de estadistica a partir de la observacion con grafico (Diciembre)"
## [1] "Uso de estadistica a partir de la observacion con grafico (Enero)"
Viendo las matrices de frecuencias para cada mes, no logramos observar un caso en donde partiendo del estado W, frecuente a otro estado, si no a el mismo. De igual manera el estado L presenta la misma situación. Por otro lado, al observar la tendencia en los tres periodos (meses), se puede decir que hay un comportamiento homogéneo y por lo tanto un estudio de estadística descriptiva no tiene la relevancia que se busca.
NoviembreProba = createSequenceMatrix(DatosNoviembre$Secuencia, toRowProbs = TRUE)
DiciembreProba = createSequenceMatrix(DatosDiciembre$Secuencia, toRowProbs = TRUE)
EneroProba = createSequenceMatrix(DatosEnero$Secuencia, toRowProbs = TRUE)
print("Se encuentran las probabilidades en el mes de Noviembre y se presentan los siguientes resultados:")
## [1] "Se encuentran las probabilidades en el mes de Noviembre y se presentan los siguientes resultados:"
NoviembreProba
## A B C L W
## A 0.5013215 0.2991572 0.0000000 0.1995213 0.0000000
## B 0.0000000 0.3920138 0.4600182 0.1479680 0.0000000
## C 0.0000000 0.0000000 0.3028721 0.4543081 0.2428198
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
print("Se encuentran las probabilidades en el mes de Diciembre y se presentan los siguientes resultados:")
## [1] "Se encuentran las probabilidades en el mes de Diciembre y se presentan los siguientes resultados:"
DiciembreProba
## A B C L W
## A 0.4957644 0.3014825 0.0000000 0.2027531 0.0000000
## B 0.0000000 0.4002407 0.4575183 0.1422409 0.0000000
## C 0.0000000 0.0000000 0.2943998 0.4552908 0.2503094
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
print("Se encuentran las probabilidades en el mes de Enero y se presentan los siguientes resultados:")
## [1] "Se encuentran las probabilidades en el mes de Enero y se presentan los siguientes resultados:"
EneroProba
## A B C L W
## A 0.5061253 0.3006817 0.0000000 0.1931930 0.0000000
## B 0.0000000 0.3904466 0.4523333 0.1572201 0.0000000
## C 0.0000000 0.0000000 0.3045420 0.4471132 0.2483449
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
Se usa la libreria de Markov con el fin de obtener la matriz y luego poder graficarla.
NoviembreMarkov<-matrix(c(0.5013215,0.2991572,0,0.1995213,0,0,0.3920138,0.4600182,0.1479680,0,0,0,0.3028722,0.4543081,0.2428198,0,0,0,1,0,0,0,0,0,1), ncol=5,nrow=5, byrow=T)
Estados <- c("A","B","C","L","W")
NoviembreMarkovchain<- new("markovchain", states=Estados, transitionMatrix=NoviembreMarkov)
print("Matriz markov Noviembre")
## [1] "Matriz markov Noviembre"
NoviembreMarkovchain
## Unnamed Markov chain
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 0.5013215 0.2991572 0.0000000 0.1995213 0.0000000
## B 0.0000000 0.3920138 0.4600182 0.1479680 0.0000000
## C 0.0000000 0.0000000 0.3028722 0.4543081 0.2428198
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
DiciembreMarkov<-matrix(c(0.4957644,0.3014825,0,0.2027531,0,0,0.4002407,0.4575183,0.1422410,0,0,0,0.2943998,0.4552908,0.2503094,0,0,0,1,0,0,0,0,0,1), ncol=5,nrow=5, byrow=T)
Estados <- c("A","B","C","L","W")
DiciembreMarkovchain<- new("markovchain", states=Estados, transitionMatrix=DiciembreMarkov)
print("Matriz markov Diciembre")
## [1] "Matriz markov Diciembre"
DiciembreMarkovchain
## Unnamed Markov chain
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 0.4957644 0.3014825 0.0000000 0.2027531 0.0000000
## B 0.0000000 0.4002407 0.4575183 0.1422410 0.0000000
## C 0.0000000 0.0000000 0.2943998 0.4552908 0.2503094
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
EneroMarkov<-matrix(c(0.5061253,0.3006817,0,0.1931930,0,0,0.3904466,0.4523333,0.1572201,0,0,0,0.3045420,0.4471132,0.2483448,0,0,0,1,0,0,0,0,0,1), ncol=5,nrow=5, byrow=T)
Estados <- c("A","B","C","L","W")
EneroMarkovchain<- new("markovchain", states=Estados, transitionMatrix=EneroMarkov)
print("Matriz markov Enero")
## [1] "Matriz markov Enero"
EneroMarkovchain
## Unnamed Markov chain
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 0.5061253 0.3006817 0.0000000 0.1931930 0.0000000
## B 0.0000000 0.3904466 0.4523333 0.1572201 0.0000000
## C 0.0000000 0.0000000 0.3045420 0.4471132 0.2483448
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
De acuerdo a las matrices de probabilidades de los periodos analizados, se puede concluir que estas están correctamente calculadas, ya que la suma correspondiente de cada fila, arroja un resultado de 1. También se concluye que los estados W y L son estados absorbentes, ya que sus probabilidades de transición son 1.
print ("Grafica de estados en Noviembre")
## [1] "Grafica de estados en Noviembre"
plot(NoviembreMarkovchain)
print ("Grafica de estados en Diciembre")
## [1] "Grafica de estados en Diciembre"
plot(DiciembreMarkovchain)
print ("Grafica de estados en Enero")
## [1] "Grafica de estados en Enero"
plot(EneroMarkovchain)
De acuerdo a los gráficos de estados, se pudo observar que es una CM no ergódica, es decir, reducible (Ya que tiene más de una clase), periódica y sus estados son transitorios, ya que se puede ir a los estados L & W, pero de allí no pueden salir. Teniendo en cuenta que la cadena es reducible, entonces Pi no es única y depende de la distribución inicial, por lo que Pi gorrito no existe.
## [1] "Prueba de chi para el mes de noviembre es:"
## Testing markovianity property on given data sequence
## Chi - square statistic is: 11.66607
## Degrees of freedom are: 18
## And corresponding p-value is: 0.8639898
## [1] "Prueba de chi para el mes de diciembre es:"
## Testing markovianity property on given data sequence
## Chi - square statistic is: 9.902623
## Degrees of freedom are: 18
## And corresponding p-value is: 0.9350383
## [1] "Prueba de chi para el mes de enero es:"
## Testing markovianity property on given data sequence
## Chi - square statistic is: 9.893509
## Degrees of freedom are: 18
## And corresponding p-value is: 0.9353267
Se puede decir que se cumple efectivamente con el supuesto de Markov, ya que el p-value en la prueba de chi cuadrado realizada, se obtiene que en los tres periodos es superior a 0.05.
## [1] "Frecuencias en Noviembre"
## A B C L W
## A 10053 5999 0 4001 0
## B 0 3868 4539 1460 0
## C 0 0 1972 2958 1581
## L 0 0 0 8419 0
## W 0 0 0 0 1581
## [1] "Frecuencias en Diciembre"
## A B C L W
## A 9832 5979 0 4021 0
## B 0 3990 4561 1418 0
## C 0 0 1903 2943 1618
## L 0 0 0 8382 0
## W 0 0 0 0 1618
## [1] "Frecuencias en Enero"
## A B C L W
## A 10246 6087 0 3911 0
## B 0 3899 4517 1570 0
## C 0 0 1978 2904 1613
## L 0 0 0 8385 0
## W 0 0 0 0 1613
Homogeneidad por mes
## [1] "Homogeneidad para el mes de Noviembre"
## Testing homogeneity of DTMC underlying input list
## ChiSq statistic is 0 d.o.f are 2880 corresponding p-value is 1
## $statistic
## [1] 0
##
## $dof
## [1] 2880
##
## $pvalue
## [1] 1
## [1] "Homogeneidad para el mes de Diciembre"
## Testing homogeneity of DTMC underlying input list
## ChiSq statistic is 0 d.o.f are 2880 corresponding p-value is 1
## $statistic
## [1] 0
##
## $dof
## [1] 2880
##
## $pvalue
## [1] 1
## [1] "Homogeneidad para el mes de Enero"
## Testing homogeneity of DTMC underlying input list
## ChiSq statistic is 0 d.o.f are 4032 corresponding p-value is 1
## $statistic
## [1] 0
##
## $dof
## [1] 4032
##
## $pvalue
## [1] 1
Homogeneidad
## [1] "Homogeneidad para la lista"
## Testing homogeneity of DTMC underlying input list
## ChiSq statistic is 23.00604 d.o.f are 48 corresponding p-value is 0.9991519
## $statistic
## [1] 23.00604
##
## $dof
## [1] 48
##
## $pvalue
## [1] 0.9991519
Se puede observar que se cumple la homogeneidad entre los tres periodos con sus respectivas matrices, ya que el p value que nos arroja (0.9991519) es mayor a 0.05, lo cual nos permite construir la matriz agregada.
DiciembreMarkovchain
## Unnamed Markov chain
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 0.4957644 0.3014825 0.0000000 0.2027531 0.0000000
## B 0.0000000 0.4002407 0.4575183 0.1422410 0.0000000
## C 0.0000000 0.0000000 0.2943998 0.4552908 0.2503094
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
## [1] "Datos agregados Arreglados"
## # A tibble: 6 × 2
## Columna1 Secuencia
## <dbl> <chr>
## 1 1 A
## 2 1 B
## 3 1 C
## 4 1 L
## 5 1 L
## 6 1 NA
## [1] "Datos agregados frecuencias"
## A B C L W
## A 30131 18065 0 11933 0
## B 0 11757 13617 4448 0
## C 0 0 5853 8805 4812
## L 0 0 0 25186 0
## W 0 0 0 0 4812
## [1] "Matriz Markov Datos agregados "
## Unnamed Markov chain
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 0.5010894 0.3004474 0.0000000 0.1984633 0.0000000
## B 0.0000000 0.3942391 0.4566092 0.1491516 0.0000000
## C 0.0000000 0.0000000 0.3006163 0.4522342 0.2471495
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
## [1] "probabilidad de que pase dos transiciones en la etapa A, una a B y 5 en ganada es"
## [1] 0.01898452
la probabilidad de que una oportunidad pase dos transiciones en la etapa A, después pase inmediatamente a la etapa B y de ahí se demore 5 transiciones en ser ganada es de 1.9%
## [1] "Despues de tres etapas una oportunidad ganada en A"
## [1] 0.0339057
la probabilidad de que una oportunidad en la etapa A termine siendo ganada después de tres etapas es de 3.4%
La gráfica nos demuestra un comportamiento con tendencia alcista en el que en el que la probabilidad en el punto 3 está en (2%) en el punto 4 en (7%) en el punto 5 (11%) en el punto 6 (13%) en el punto 7 (14%) en el punto 8 (15%) en el punto 9 (15%) y finalmente en el punto 10 (16%), siendo estos los cambios en probabilidades desde el punto 3 hasta el 10.
## Unnamed Markov chain^1000
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 8.225857e-301 2.312992e-300 5.268208e-300 0.8395893 0.1604107
## B 0.000000e+00 0.000000e+00 0.000000e+00 0.7336286 0.2663714
## C 0.000000e+00 0.000000e+00 0.000000e+00 0.6466182 0.3533818
## L 0.000000e+00 0.000000e+00 0.000000e+00 1.0000000 0.0000000
## W 0.000000e+00 0.000000e+00 0.000000e+00 0.0000000 1.0000000
## [1] 0.6452532
## [1] 0.6429047
## [1] 0.6466182
## [1] 0.6466182
## [1] 0.6466182
## [1] 0.6466182
## [1] 0.6466182
La probabilidad de que una oportunidad llegue a C y termine por ser perdida es del 64%, dónde se utilizaron las matrices de diciembre, enero y la agregada elevadas a un número grande, lo cual nos arrojo varios datos similares (posiblemente por la homogeneidad).
## Unnamed Markov chain Markov chain that is composed by:
## Closed classes:
## L
## W
## Recurrent classes:
## {L},{W}
## Transient classes:
## {A},{B},{C}
## The Markov chain is not irreducible
## The absorbing states are: L W
## Unnamed Markov chain
## A 5 - dimensional discrete Markov Chain defined by the following states:
## A, B, C, L, W
## The transition matrix (by rows) is defined as follows:
## A B C L W
## A 0.5010894 0.3004474 0.0000000 0.1984633 0.0000000
## B 0.0000000 0.3942391 0.4566092 0.1491516 0.0000000
## C 0.0000000 0.0000000 0.3006163 0.4522342 0.2471495
## L 0.0000000 0.0000000 0.0000000 1.0000000 0.0000000
## W 0.0000000 0.0000000 0.0000000 0.0000000 1.0000000
## [1] "Se analiza y obtiene que las probabilidades de absorcion son las siguientes"
## L W
## A 0.8395893 0.1604107
## B 0.7336286 0.2663714
## C 0.6466182 0.3533818
## [1] "Se analiza y se obtiene que los tiempos de absorcion son los siguientes"
## A B C
## 3.647543 2.728591 1.429830
Probabilidades de absorción:La probabilidad de que saliendo del estado A sea absorbido por L es del 84% y que sea absorbido por W es del 16%; La probabilidad de que saliendo del estado B sea absorbido por L es del 73% y que sea absorbido por W es del 27%; La probabilidad de que saliendo del estado C sea absorbido por L es del 65% y que sea absorbido por W es del 35%. Tiempos esperados de absorción: Empezado por el estado A transcurren en promedio 3.7 transiciones antes de ser absorbido; Empezado por el estado B transcurren en promedio 2.7 transiciones antes de ser absorbido; Empezado por el estado C transcurren en promedio 1.4 transiciones antes de ser absorbido.
PronosticoVentas= (60000*((50000 * transitionProbability(AgregadaMarkovchain^1000,"A","W"))+(30000*transitionProbability(AgregadaMarkovchain^1000,"B","W"))+(15000*transitionProbability(AgregadaMarkovchain^1000,"C","W"))))
PronosticoVentas
## [1] 1278744272
El pronóstico de ventas es de $1278’744.272USD, dónde utilizamos la matriz agregada elevada a un número grande (1000).