Los procesos estocásticos, también llamados procesos aleatorios son varios datos o variables aleatorias ordenadas en el tiempo. En los procesos estocásticos las variables aleatorias y continuas se denominan Y(t), mientras que las variables aleatorias y discretas se denominan Y(t)*. Las variables aleatorias y continuas son valores infinitos de números enteros positivos. Las variables aleatorias y discretas son valores finitos de números enteros positivos.
Un ejemplo de una variable Y(t) son los electrocardiogramas, los cuales mantienen un comportamiento constante e infinito, mientras que un ejemplo de una variable Y(t)* es el PIB, ya que estes puede presentar cambios en su comportamieno cuando variables exógenas influyen sobre este y también cuenta con datos finitos, ya que estos se acumulan dependiendo del tiempo que haya pasado.
Los procesos estocásticos estacionarios son aquellos procesos cuya media y varianza son constantes en el tiempo y el valor de la covarianza depende de la distacia o rezago entre los periodos y no el tiempo que ha trasncurrido desde e cálculo de la covarianza.
Los procesos estocásticos estacionarios pueden ser conocidos como; proceso estocástico débilmente estacionario, estacionario covariante, estacionario de segundo orden o proceso estocástico en amplio sentido.
Para el cálculo de los procesos estocásticos estacionarios se utilizan:
· Media: E(Yt) = μ
· Varianza: var(Yt) = E(Yt − μ)^2 = σ^2
· Covarianza: γk = E[(Yt − μ)(Yt+k − μ)]
En este caso la covarianza también puede tomar el nombre de autocovarianza.
datosx <- c(2, 3, 4, 5, 6)
datosy <- c(7, 8, 9, 10, 11)
media <- mean(datosx)
media
## [1] 4
varianza <- var(datosx)
varianza
## [1] 2.5
covarianza <- cov(datosx, datosy)
covarianza
## [1] 2.5
Los procesos puramente aleatorios son aquellos en loscuales no existe ningún tipo de patrón o tendencia en la serie de datos a lo largo de un serie de datos. Los procesos puramente aleatorios son utilizados para modelar errores aleatorios que se pueden encontrar dentro de la serie de datos.
Un ejemplo de un proceso puramente aleatorio es el ruido blanco, ya que este cuenta con una secuencia aleatoria y no correlacionada entre sus valores dentro de la secuencia. En r el código a utilizar para generar y evaluar el ruido blanco es:
#checkresiduals(modelo$residuals)
Es importante tomar en consideración que previamente se necesita hacer un análisis de datos e informaciónpara obtener el modelo que se quiere utilizar y seguir analizando.
Se realizan procesos no estacionarios únicamente cuando las series de tiempo no son estacionarias. Las series de tiempo no estacionarias son aquellas que presentan un comportamiento aleatoria.En el caso de los procesos estocásticos no estacionarios, la media, varianza y covarianza cambian a lo largo del tiempo, haciendo que se obtengan resultados diferentes en un periodo diferente.
En el caso de los procesos estocásticos no estacionarios es difícil poder realizar un pronóstico preciso o exacto de la información debido a su variabilidad y cambios a lo largo del tiempo.
para los procesos estocásticos no estacionarios al tener una tendencia deterministica se utiliza la diferenciación para así eliminar la tendencia y obtener un proceso estacionario.
#data <- datos
#diff_ts<-diff(data)
Las variables integradas so aquellas variables no estacionarias, es decir que su comportamiento no es constante y cambia a lo largo del tiempo. las variables integradas cuentan con la característica de que luego de aplicar una diferenciación a la serie de datos la tendencia que volvía no estacionaria a esta se elimina, volviendola estacionaria.
Los modelos de caminata aleatoria son aquellos en los cuales las variables aleatorias cambian aleatoriamente su valor a lo largo del tiempo. Por lo cual, el valor presente de una variable aleatoria no depende del valor pasado de otra variable aleatoria por lo mismo que ninguna de estas presentan un patrón o relación entre ellas.
Los modelos de caminata aleatoria cuyo modelo base AR es:
Yt = Y(t−1) + ut
En donde Yt es el valor de Y en el tiempo t, Y(t−1) es el valor de Y en el tiempo t-1 más un choque aleatorio ut.
Este modelo es útil, ya que se pueden realizar una variedad de predicciones al tener una gran cantidad de variables aleatorias, generando diferentes escenarios y situaciones para los modelos.
Para calcular un modelo de caminata aleatoria en r se utiliza la función de “arima()” y para predecir los datos futuros de la serie de tiempo se utiliza “pred <- forecast(fit, h = 5)” y en “h=x” se colocan la cantidad de valores que se buscan predecir.
set.seed(234)
x <- cumsum(rnorm(50))
fit <- arima(x, order = c(0, 1, 0))
summary(fit)
##
## Call:
## arima(x = x, order = c(0, 1, 0))
##
##
## sigma^2 estimated as 0.9192: log likelihood = -67.46, aic = 136.93
##
## Training set error measures:
## ME RMSE MAE MPE MAPE MASE
## Training set -0.07618027 0.9491137 0.7252171 83.54717 140.2468 0.9800179
## ACF1
## Training set 0.0914593
pred <- forecast(fit, h = 5)
print(pred)
## Point Forecast Lo 80 Hi 80 Lo 95 Hi 95
## 51 -3.148905 -4.377592 -1.9202174 -5.028019 -1.2697898
## 52 -3.148905 -4.886530 -1.4112786 -5.806374 -0.4914349
## 53 -3.148905 -5.277053 -1.0207560 -6.403627 0.1058177
## 54 -3.148905 -5.606279 -0.6915303 -6.907134 0.6093250
## 55 -3.148905 -5.896332 -0.4014766 -7.350733 1.0529238
La cointegración es la regresión de una serie de tiempo con raíz unitaria sobre otra serie de tiempo con raíz unitaria. La cointegración es útil para determinar cual es la relación o significancia que existe entre dos variables que se encuentran en la misma serie de tiempo.
La prueba que se realiza para probar si se presenta cointegración es:
· Prueba de Engle-Granger
Las tendencias deterministas y estocásticas se diferencian en que las tendencias deterministas tienen una forma específica y no es aleatoria, mientras que las tendencias estocásticas tienen una forma aleatoria.
La prueba de raíz unitaria es una prueba que se utiliza para determinar si una serie temporal es estacionaria o no. Existen diferentes tipos de pruebas que se pueden realizar para la prueba de raíz unitaria, entre estas estan:
· La prueba Dickey-Fuller aumentada
· Prueba de la significancia de más de un coeficiente (prueba F)
· Las pruebas de raíz unitaria Phillips-Perron
· Prueba de cambios estructurales
Existen varios tipos de prueba para la raíz unitaria, ya que todo dependerá del tamaño y de la potencia de los datos a utilizar. Es importante tomar enconsideración la potencia, ya que de esta dependerá el tipo de error (error I Y II) corriendo el riesgo de aceptar una hipótesis nula falsa.
La prueba más común a utilizar es la prueba Dickey-Fuller, ya que esta es más sensible.
AAPLdata <- pdfetch_YAHOO("AAPL",from = c("2019-01-01"),to = c("2023-02-18"), interval = '1d')
Apple <- AAPLdata[,4]
length(Apple)
## [1] 1041
tsApple <- ts(Apple, start = c(2019,1),frequency=365)
#Prueba Dickey-Fuller
tseries::adf.test(tsApple)
##
## Augmented Dickey-Fuller Test
##
## data: tsApple
## Dickey-Fuller = -1.819, Lag order = 10, p-value = 0.6549
## alternative hypothesis: stationary
Como se puede observar en el resultado, nuestro p-value es de 0.6549, siendo este mayor a 0.05 nos indica que la serie no es estacionaria.