Lea los datos y estime un intervalo de confianza al 99% para la correlación entre las variables

library(pacman)
p_load(dplyr,GGally,tidyverse,broom)
datos <- read.table(file = "PC1_RLS_UTILIDADES.txt", header = TRUE)
datos |> select_if(is.numeric) |> pairs()

ESTIMACION DEL IC PARA “ρ”:

X = datos$Participacion
Y = datos$Utilidad
r<-cor(X,Y,method="pearson")
Zr <- 1/2*log((1+r)/(1-r))
alfa <- 0.01
n <- length(X)

Zrho_inf <- Zr - qnorm(1-alfa/2)*sqrt(1/(n-3)) 
Zrho_sup <- Zr + qnorm(1-alfa/2)*sqrt(1/(n-3))
rho_inf <- (exp(2*Zrho_inf)-1)/(exp(2*Zrho_inf)+1)
rho_sup <- (exp(2*Zrho_sup)-1)/(exp(2*Zrho_sup)+1)
c(rho_inf,rho_sup)
## [1] 0.2890851 0.9650575

Interpretación: Como el IC no contiene al “0”, se puede afirmar que a un nivel de confianza del 99% ρ!=0 (hay correlación lineal entre las variables).

Presente el modelo de regresión estimado. Interprete los coeficientes de regresión. En caso no sea posible, indique el porqué

lm(Y ~ X) -> modelo
modelo |> coef()
## (Intercept)           X 
##  122.034444    2.196816

Interpretación:

Construya un intervalo de confianza al 91% para la varianza de los errores

## Limite inferior
(LI.var = sum(modelo$residual^2)/qchisq(0.91,df=2))
## [1] 445.3118
## Limite superior
(LS.var = sum(modelo$residuals^2)/qchisq(0.09,df=2))
## [1] 11369.73

Interpretación: A un 91% de confianza la varianza de los errores se encontrara entre 445.3118 y 11369.73 und^2.

Prediga la utilidad de un año con 17.5% de participación en el mercado con un intervalo al 95%.

modelo %>% predict(data.frame(X=17.5),
interval = "prediction",
level = 0.95)
##        fit      lwr      upr
## 1 160.4787 126.4933 194.4642

Interpretación: A un 95% de confianza el valor estimado para las utilidades, dado X= 17.5% de participacion en el mercado, se encontrara entre 126.4933 y 194.4642 miles de soles..