A la hora de analizar datos, uno de los objetivos de estudio es determinar el grado de dependencia o asociación entre variables. Para ello, los estadísticos denominados coeficientes de correlación indican si existe o no esta asociación y permiten también saber el sentido en que se da esa asociación o correlación entre variables (positiva o negativa).
Para el propósito del presente informe, se trabajará con dos series de datos obtenidas del Banco de la República de Colombia. Una corresponde a la Tasa de Intervención de Política Monetaria, la cual es la tasa de interés mínima que cobra el Banco de la Republica a las entidades financieras por la liquidez que le suministra, regulando así la cantidad de dinero que circula en la economía; y la otra, es la Tasa de Inflación histórica del país, que tiene incidencia en el índice de precios al consumidor.
Lo que se busca, partiendo de estos datos, es establecer qué tipo de correlación existe entre la tasa de inflación y la tasa de intervención (o interés) de la política monetaria.
Para empezar el análisis, se carga el set de datos a R:
library(readxl)
Data_tallerRL <- read_excel("C:/Users/RICARDO NARVAEZ/OneDrive/Desktop/Data_tallerRL.xlsx")
Tasa_Interes <- Data_tallerRL$`Tasa de intervención de política monetaria (%)`
Tasa_Inflacion <- Data_tallerRL$Inflacion
dataf <- data.frame(Tasa_Interes,Tasa_Inflacion)
head(dataf)
## Tasa_Interes Tasa_Inflacion
## 1 12.65323 7.36
## 2 12.75000 7.74
## 3 13.00000 8.35
## 4 13.15323 9.28
## 5 13.25000 10.15
## 6 13.25000 10.48
Se realiza el gráfico de dispersión para visualizar el comportamiento de los datos:
Al observar el gráfico de dispersión, se puede inferir por el comportamiento de los puntos, que existe cierto nivel de correlación entre la tasa de inflación y la tasa de intervención, y que esta es positiva.
Para determinar qué coeficiente de correlación utilizar, es decir, si el Coeficiente de Pearson o el coeficiente de Spearman, es necesario realizar una prueba de normalidad a los datos. Realizando la gráfica Q-Q Plot se obtiene:
Al observar las representaciones gráficas obtenidas, los puntos no se ajustan a la línea diagonal trazada, lo que sugiere que los datos no se distribuyen normalmente. Para contrastar esta inferencia, se realiza la prueba de Shapiro-Wilk, obteniendo:
shapiro.test(Tasa_Interes)
##
## Shapiro-Wilk normality test
##
## data: Tasa_Interes
## W = 0.87442, p-value = 4.991e-15
shapiro.test(Tasa_Inflacion)
##
## Shapiro-Wilk normality test
##
## data: Tasa_Inflacion
## W = 0.93284, p-value = 1.808e-10
Para interpretar el resultado de la prueba de Shapiro-Wilk, se parte de que si el valor p es mayor que el nivel de significancia (se va a tomar por defecto un valor de 0.05), los datos presentan una distribución normal. Para el caso de los datos de tasa de interés e inflación, se observa que el valor p obtenido es significativamente inferior al nivel de significancia de 0.05, por lo que se rechaza la normalidad y se concluye que los datos no se distribuyen normalmente, tal como se había visualizado previamente con el grafico Q-Q Plot.
Descartado el supuesto de normalidad, no se puede aplicar la prueba de correlación de Pearson, por lo que se decide aplicar la Prueba de correlación de Spearman, la cual evalúa la relación monotónica entre dos variables, especialmente cuando las relaciones no son lineales.
El coeficiente de correlación de Spearman es un método no paramétrico, para el cual no es necesario hacer ninguna hipótesis acerca de la distribución que siguen los datos. El rango de valores que toma va desde -1 a 1, presentando un grado más fuerte de asociación entre más cerca se esté de los extremos y el signo indica si la relación funcional entre ambas variables es creciente o decreciente. Al aplicar la prueba se obtiene:
resultado_correlacion <- cor.test(Tasa_Interes, Tasa_Inflacion, method = "spearman")
## Warning in cor.test.default(Tasa_Interes, Tasa_Inflacion, method = "spearman"):
## Cannot compute exact p-value with ties
print(resultado_correlacion)
##
## Spearman's rank correlation rho
##
## data: Tasa_Interes and Tasa_Inflacion
## S = 625568, p-value < 2.2e-16
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.8650719
El coeficiente Rho obtenido es de 0.8650719, el cual es un valor alto con signo positivo. Esto permite ver que existe una relación significativa entre la tasa de inflación y la tasa de intervención del banco de la república, con signo positivo, es decir, que conforme una variable crece, es probable que la otra variable también crezca y viceversa.
regresion <- lm(Tasa_Interes ~ Tasa_Inflacion, data = dataf)
summary(regresion)
##
## Call:
## lm(formula = Tasa_Interes ~ Tasa_Inflacion, data = dataf)
##
## Residuals:
## Min 1Q Median 3Q Max
## -6.1673 -0.6124 0.1312 0.8700 7.3554
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 0.4874 0.2565 1.90 0.0583 .
## Tasa_Inflacion 1.1348 0.0408 27.81 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 2.051 on 301 degrees of freedom
## Multiple R-squared: 0.7199, Adjusted R-squared: 0.7189
## F-statistic: 773.5 on 1 and 301 DF, p-value: < 2.2e-16
anova(regresion)
## Analysis of Variance Table
##
## Response: Tasa_Interes
## Df Sum Sq Mean Sq F value Pr(>F)
## Tasa_Inflacion 1 3252.3 3252.3 773.47 < 2.2e-16 ***
## Residuals 301 1265.7 4.2
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
par(mfrow = c(2, 2))
plot(regresion)
library(visreg)
## Warning: package 'visreg' was built under R version 4.3.3
par(mfrow = c(1, 1))
visreg(regresion, "Tasa_Inflacion", partial = F)
#Otra forma grafica con ggplot2
library(ggplot2)#ggplot2 es una extension poderosa para graficar
ggplot(regresion, aes(x=Tasa_Interes, y=Tasa_Inflacion)) +
geom_point(shape=1) + # genera circulos en el grafico
geom_smooth(method=lm) # adjunta la linea de regresion por defecto es al 95% de confianza
## `geom_smooth()` using formula = 'y ~ x'
shapiro.test(resid(regresion))
##
## Shapiro-Wilk normality test
##
## data: resid(regresion)
## W = 0.927, p-value = 5.055e-11
library(car)
## Loading required package: carData
ncvTest(regresion)
## Non-constant Variance Score Test
## Variance formula: ~ fitted.values
## Chisquare = 186.2239, Df = 1, p = < 2.22e-16
Tasa de intervención de politica monentaria: https://www.banrep.gov.co/es/estadisticas/tasas-interes-politica-monetaria
Tasa de inflación: https://www.banrep.gov.co/es/estadisticas/inflacion-total-y-meta
Correlación y regresión lineal: https://rpubs.com/osoramirez/316691
Prueba de hipótesis: https://rpubs.com/KarolZ/1119798