Emerson Trujillo Sierra
12/agosto/2022
library(readxl)
library(ggplot2)
datos<- read_excel("C:/Users/portatil/DatosR/Metodos2/PrecioPetroleo.xlsx")
attach(datos)
head(datos,n=18)
## # A tibble: 18 × 3
## PrecioAcciones_Pesos PrecioPetroleo_Dolar Fecha
## <dbl> <dbl> <chr>
## 1 1090 35.6 dic 14-15
## 2 1170 36.3 dic 15-15
## 3 1160 37.4 dic 16-15
## 4 1230 35.0 dic 18-15
## 5 1155 34.5 dic 21-15
## 6 1165 35.8 dic 22-15
## 7 1205 36.1 dic 23-15
## 8 1170 37.5 dic 24-15
## 9 1150 37.8 dic 28-15
## 10 1130 36.8 dic 29-15
## 11 1110 37.9 dic 30-15
## 12 1105 37.0 ene 04-16
## 13 1085 36.8 ene 05-16
## 14 1060 36.0 ene 06-16
## 15 1035 34.0 ene 07-16
## 16 1015 33.3 ene 08-16
## 17 955 31.4 ene 12-16
## 18 961 30.4 ene 13-16
grafico=ggplot(datos,aes(y=PrecioAcciones_Pesos,x=PrecioPetroleo_Dolar)) + geom_point(colour = "red", size = 2) + geom_smooth()
grafico
cor(datos$PrecioPetroleo_Dolar, datos$PrecioAcciones_Pesos)
## [1] 0.7074373
Del resultado anterior vemos que existe una correlación de 0.7074373 (relación positiva bebil) entre las dos variables, eso significa que el Precio del Petróleo WTI en dólares por barril cuando aumenta su valor, tiende a aumentar el Precio Acciones de Ecopetrol(en pesos).
a. Proponga un modelo de regresión lineal simple que permita predecir el valor de las Acciones de Ecopetrol con base en el Precio del barril de petróleo en Colombia. Indique la ecuación de regresión y el valor del r cuadrado.
modelo_simple=lm(PrecioAcciones_Pesos~PrecioPetroleo_Dolar, data = datos)
summary(modelo_simple)
##
## Call:
## lm(formula = PrecioAcciones_Pesos ~ PrecioPetroleo_Dolar, data = datos)
##
## Residuals:
## Min 1Q Median 3Q Max
## -59.90 -40.74 -15.94 33.40 136.82
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) 177.768 232.828 0.764 0.45627
## PrecioPetroleo_Dolar 26.192 6.542 4.004 0.00102 **
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 57.13 on 16 degrees of freedom
## Multiple R-squared: 0.5005, Adjusted R-squared: 0.4692
## F-statistic: 16.03 on 1 and 16 DF, p-value: 0.001024
La ecuación de regresión corresponde a: PrecioAcciones_Pesos = 177.768 + 26.192 PrecioPetroleo_Dolar, de igual manera el valor de R2 ajustado corresponde a:0.4692, es decir que el modelo explica el 46% la Predicción del precio de las acciones de la empresa Ecopetrol .
b. Pruebe la significancia del modelo propuesto en “a)” plantee las hipótesis respectivas y use el concepto de Valor p para tomar la decisión sobre las hipótesis. Use α = 0.05
Hipótesis para ßo: H0:β0=0,Ha:βo≠0 p−value=0.45627 Ya que p-value > 0.05, no se rechaza Ho: ßo = 0
Hipótesis para ß1: H0:β1=0,Ha:β1≠0 p−value=0.00102∗∗ Ya que p-value < 0.05, se rechaza Ho: ß1 = 0
c. Interprete los coeficientes del modelo propuesto en “a)”
βo=177.768,β1=26.192
Interpretacion: Por cada unidad que incremente el precio del barril de petroleo en dolares(variable independiente), se aumenta 26.192 dolares el precio de la acción de Ecopetrol. Como ß1 es diferente de cero (Hipótesis para ß1), se considera que es significativo para el modelo.
d. Haga un análisis de los residuos. ¿Qué supuesto no se cumple?
Supuesto 1: El valor esperado de los errores es cero E[u]=0
summary(modelo_simple$residuals)
## Min. 1st Qu. Median Mean 3rd Qu. Max.
## -59.90 -40.74 -15.94 0.00 33.40 136.82
t.test(modelo_simple$residuals, mu=0)
##
## One Sample t-test
##
## data: modelo_simple$residuals
## t = -4.2309e-16, df = 17, p-value = 1
## alternative hypothesis: true mean is not equal to 0
## 95 percent confidence interval:
## -27.56364 27.56364
## sample estimates:
## mean of x
## -5.527407e-15
p-value = 1 > α = 0.05, se tiene evidencia suficiente para no rechazar que H0: ß0 = 0, por tanto el supuesto se cumple.
Supuesto 2 : Los errores tienen varianza constante. V[ui]=σ2
library(lmtest)
lmtest::gqtest(modelo_simple) ##La prueba de Goldfeld-Quandt se utiliza para determinar si la heterocedasticidad está presente en un modelo de regresión.##
##
## Goldfeld-Quandt test
##
## data: modelo_simple
## GQ = 0.17924, df1 = 7, df2 = 7, p-value = 0.9813
## alternative hypothesis: variance increases from segment 1 to 2
como p-value = 0.9813 > α =0.05, no rechazamos la hipótesis nula, por tanto, no tenemos evidencia suficiente para decir que la heterocedasticidad está presente en el modelo de regresión, los errores tienen varianza constante, el supuesto se cumple.
Supuesto 3 : u es una variable con distribución normal. u∼ Normal
shapiro.test(modelo_simple$residuals)
##
## Shapiro-Wilk normality test
##
## data: modelo_simple$residuals
## W = 0.89259, p-value = 0.04276
Como p-value = 0.04276 < α = 0.05, se rechaza la hipótesis nula, quiere decir que, los errores no se distibuyen de forma normal, el supuesto no se cumple.
Supuesto 4 : Los errores son independientes unos de otros E[ui,uj]
lmtest::dwtest(modelo_simple)
##
## Durbin-Watson test
##
## data: modelo_simple
## DW = 0.74504, p-value = 0.0004666
## alternative hypothesis: true autocorrelation is greater than 0
Como p-value = 0.0004666 < α = 0.05, se rechaza la hipótesis nula, por tanto, los errores no son indepentientes, el supuesto no se cumple.
e. Concluya sobre la validez del modelo propuesto en a)
Pra la hipótesis de los parámetros se tiene evidencia suficiente para decir que β1 es diferente de cero, por tanto es significativo en el modelo. El R2 = 0.4692 indica que la variable PrecioPetroleo_Dolar de petroleo explica el 46% del precio de las acciones de la empresa Ecopetrol, por lo anterior, no es recomendable el uso de este modelo para predecir el precio de la acción en la empresa Ecopetrol, pero si permite estimar su impacto sobre la variable dependiente. En los cuatro supuestos, dos de ellos no se cumplen, por lo que el modelo podría no ser lo suficientemente valido para predecir el precio de las acciones de la empresa Ecopetrol.