library(pacman)
p_load(dplyr,GGally,tidyverse,broom)
datos <- read.table(file = "PC1_RLS_UTILIDADES.txt", header = TRUE)
datos |> select_if(is.numeric) |> pairs()
ESTIMACION DEL IC PARA “ρ”:
X = datos$Participacion
Y = datos$Utilidad
r<-cor(X,Y,method="pearson")
Zr <- 1/2*log((1+r)/(1-r))
alfa <- 0.01
n <- length(X)
Zrho_inf <- Zr - qnorm(1-alfa/2)*sqrt(1/(n-3))
Zrho_sup <- Zr + qnorm(1-alfa/2)*sqrt(1/(n-3))
rho_inf <- (exp(2*Zrho_inf)-1)/(exp(2*Zrho_inf)+1)
rho_sup <- (exp(2*Zrho_sup)-1)/(exp(2*Zrho_sup)+1)
c(rho_inf,rho_sup)
## [1] 0.2890851 0.9650575
Interpretación: Como el IC no contiene al “0”, se puede afirmar que a un nivel de confianza del 99% ρ!=0 (hay correlación lineal entre las variables).
lm(Y ~ X) -> modelo
modelo |> coef()
## (Intercept) X
## 122.034444 2.196816
Interpretación:
## Limite inferior
(LI.var = sum(modelo$residual^2)/qchisq(0.91,df=2))
## [1] 445.3118
## Limite superior
(LS.var = sum(modelo$residuals^2)/qchisq(0.09,df=2))
## [1] 11369.73
Interpretación: A un 91% de confianza la varianza de los errores se encontrara entre 445.3118 y 11369.73 und^2.
modelo %>% predict(data.frame(X=17.5),
interval = "prediction",
level = 0.95)
## fit lwr upr
## 1 160.4787 126.4933 194.4642
Interpretación: A un 95% de confianza el valor estimado para las utilidades, dado X= 17.5% de participacion en el mercado, se encontrara entre 126.4933 y 194.4642 miles de soles..