#CARGA

#install.packages("datarium")
#Banco de datos para análisis estadísticos y visualización
#install.packages("confintr")
library(datarium)
library(confintr)

#VARIABLES

X <- c(stress$age)
Y <- c(stress$score)
plot(stress$age, stress$score, xlab='Edad', ylab='Nivel de Colesterol')

#CALCULO COEFICIENTE DE CORRELACION MMC

promx <- mean(X)
promy <- mean(Y)

sumxy <- sum((X-promx)*(Y-promy))
sumxp <- sum((X-promx)^2)
sumyp <- sum((Y-promy)^2)

r = sumxy/(sqrt(sumxp)*sqrt(sumyp))
r
## [1] 0.5303787

Comprobación

cor(X,Y,method="pearson")
## [1] 0.5303787

Interpretación: Como el valor obtenido se encuentra entre 40 y 60% se puede afirmar que la relación lineal entre las variables es positiva y moderada

#ESTIMACION DEL IC PARA “ρ”

Zr <- 1/2*log((1+r)/(1-r))
alfa <- 0.02
n <- length(X)

Zrho_inf <- Zr - qnorm(1-alfa/2)*sqrt(1/(n-3)) 
Zrho_sup <- Zr + qnorm(1-alfa/2)*sqrt(1/(n-3))
rho_inf <- (exp(2*Zrho_inf)-1)/(exp(2*Zrho_inf)+1)
rho_sup <- (exp(2*Zrho_sup)-1)/(exp(2*Zrho_sup)+1)
c(rho_inf,rho_sup)
## [1] 0.2752539 0.7157151

Comprobación

cor.test(X, Y, method = "pearson", alternative = "two.sided", conf.level = 0.98)
## 
##  Pearson's product-moment correlation
## 
## data:  X and Y
## t = 4.7646, df = 58, p-value = 1.308e-05
## alternative hypothesis: true correlation is not equal to 0
## 98 percent confidence interval:
##  0.2752539 0.7157151
## sample estimates:
##       cor 
## 0.5303787

Interpretación: Como el IC no contiene al “0” se puede afirmar que a un nivel de confianza del 98% ρ!=0.

#PRUEBA DE HIPOTESIS

tcalc <- r*sqrt(n-2)/sqrt(1-r^2)
2*pt(abs(tcalc),n-2,lower.tail = FALSE)
## [1] 1.308366e-05